AlpinDale
|
c3a221eb02
feat: GGUF, QuIP#, and Marlin support (#228)
|
преди 11 месеца |
AlpinDale
|
31c95011a6
feat: FP8 E5M2 KV Cache (#226)
|
преди 11 месеца |
AlpinDale
|
641bb0f6e9
feat: add custom allreduce kernels (#224)
|
преди 11 месеца |
AlpinDale
|
26a717b49f
fix: use head_dim if available
|
преди 11 месеца |
AlpinDale
|
c0aac15421
feat: S-LoRA support (#222)
|
преди 11 месеца |
AlpinDale
|
8fa608aeb7
feat: replace Ray with NCCL for control plane comms (#221)
|
преди 11 месеца |
AlpinDale
|
15a0454172
feat: FP8 KV Cache (#185)
|
преди 1 година |
AlpinDale
|
b9b295d74e
chore: backlogs 1 (#191)
|
преди 1 година |
AlpinDale
|
7d91e9e0f2
feat: CUDA graphs (#172)
|
преди 1 година |
AlpinDale
|
725be3e0de
feat: mixtral HF with expert parallelism (#167)
|
преди 1 година |
AlpinDale
|
35e9cf707c
chore: force pt for mixtral (#164)
|
преди 1 година |
AlpinDale
|
653da510d1
chore: rewrite InputMetadata (#143)
|
преди 1 година |
AlpinDale
|
1334a833a4
feat: AMD ROCm support (#95)
|
преди 1 година |
AlpinDale
|
63c28919a0
Revert "fix: correct auto ntk scaling_factor for 4k ctx case" (#149)
|
преди 1 година |
AlpinDale
|
2b1ba581f9
feat: re-implement GPTQ (#141)
|
преди 1 година |
AlpinDale
|
8223f85c1b
feat: SqueezeLLM support (#140)
|
преди 1 година |
AlpinDale
|
237d2ec28d
fix: CPU OOM for large models (#128)
|
преди 1 година |
AlpinDale
|
0d51eac374
feat: awq for all models (#124)
|
преди 1 година |
AlpinDale
|
fd18a1d956
fix: get_tensor instead of pysafeslice
|
преди 1 година |
AlpinDale
|
5ea6889cea
chore: read from quantization_config (#123)
|
преди 1 година |
AlpinDale
|
3459f1c185
feat: usage stats for OpenAI endpoint (#122)
|
преди 1 година |
AlpinDale
|
1323b5456c
parse torch.dtype properly (#119)
|
преди 1 година |
AlpinDale
|
e7b6a2d5a0
chore: tensor parallel refactors part 2 (#116)
|
преди 1 година |
AlpinDale
|
5175605f8d
fix: yarn (#112)
|
преди 1 година |
sandwichdoge
|
99293aaff0
fix: correct auto ntk scaling_factor for 4k ctx case (#101)
|
преди 1 година |
AlpinDale
|
8834ecf9de
chore: clean up refactor endpoints (#98)
|
преди 1 година |
AlpinDale
|
74604eb252
fix: pylint complaints (#91)
|
преди 1 година |
AlpinDale
|
efc6f7fbec
chore: reformats (#90)
|
преди 1 година |
AlpinDale
|
3d72f05c7b
feat: flattened 1D tensor -> 2D tensor (#85)
|
преди 1 година |
AlpinDale
|
c1fa7e8567
chore: fix datatype check (#65)
|
преди 1 година |