AlpinDale
|
4b80b42362
fix: memory leaks due to nccl cuda graphs (#275)
|
11 달 전 |
AlpinDale
|
842912d022
feat: on-the-fly gguf conversion (#250)
|
11 달 전 |
AlpinDale
|
d2db4143fa
feat: add grafana for metrics (#240)
|
11 달 전 |
AlpinDale
|
bb158b6282
fix: bump torch to 2.2.0 (#234)
|
11 달 전 |
AlpinDale
|
1c46fa31ad
feat: add quadratic sampling (#233)
|
11 달 전 |
AlpinDale
|
f0dacc17dd
fix: remove fast-hadamard-transform in requirements
|
11 달 전 |
AlpinDale
|
c3a221eb02
feat: GGUF, QuIP#, and Marlin support (#228)
|
1 년 전 |
AlpinDale
|
0adab894fe
feat: grammar support (#206)
|
1 년 전 |
AlpinDale
|
339c6aec53
chore: bump ray version
|
1 년 전 |
AlpinDale
|
641bb0f6e9
feat: add custom allreduce kernels (#224)
|
1 년 전 |
AlpinDale
|
fe70c6e8d5
feat: bump cuda and pytorch (#205)
|
1 년 전 |
AlpinDale
|
7e72ce0a73
feat: mixtral tensor parallelism (#193)
|
1 년 전 |
AlpinDale
|
7d91e9e0f2
feat: CUDA graphs (#172)
|
1 년 전 |
AlpinDale
|
b9df8734d1
remove megablocks as a dependency
|
1 년 전 |
AlpinDale
|
23a54389c8
bump torch
|
1 년 전 |
AlpinDale
|
2755a48d51
merge dev branch into main (#153)
|
1 년 전 |
AlpinDale
|
887e03669a
feat: add exllamav2 for GPTQ (#99)
|
1 년 전 |
AlpinDale
|
161a69d2e0
Update requirements.txt
|
1 년 전 |
AlpinDale
|
41341b220a
requirements: pin pydantic version
|
1 년 전 |
AlpinDale
|
9b317aa26a
feat: finish up tests and workflows (#87)
|
1 년 전 |
AlpinDale
|
28db67fd78
fix: mistral support
|
1 년 전 |
LitreallyNone
|
b526a7b3bc
Update requirements.txt (#58)
|
1 년 전 |
AlpinDale
|
1e7d28f96f
fix: torch version mismatch (#43)
|
1 년 전 |
AlpinDale
|
da79f86e52
bump transformers and xformers versions
|
1 년 전 |
AlpinDale
|
2148f4be91
update requirements
|
1 년 전 |
AlpinDale
|
aba8b0b17a
add rope theta support and bump transformers
|
1 년 전 |
AlpinDale
|
c687430ce7
bump xformers and clean up leftover code
|
1 년 전 |
AlpinDale
|
acbf49ef89
feat: refactor scheduler
|
1 년 전 |
AlpinDale
|
10334ebd7c
requirements: stricter version for fschat
|
1 년 전 |
AlpinDale
|
592ee204a6
fix: ray depends on pyarrow
|
1 년 전 |