AlpinDale
|
58e89e29d9
add custom bias to attention.py
|
9 bulan lalu |
AlpinDale
|
9810daa699
feat: INT8 KV Cache (#298)
|
10 bulan lalu |
AlpinDale
|
31c95011a6
feat: FP8 E5M2 KV Cache (#226)
|
11 bulan lalu |
AlpinDale
|
8fa608aeb7
feat: replace Ray with NCCL for control plane comms (#221)
|
11 bulan lalu |
AlpinDale
|
f013d714c0
chore: merge dev branch into main (#177)
|
1 tahun lalu |
AlpinDale
|
2755a48d51
merge dev branch into main (#153)
|
1 tahun lalu |
50h100a
|
fa0ae5a2c9
feat: new mirostatv2 implementation (#96)
|
1 tahun lalu |
AlpinDale
|
69204736de
Revert "fix: sync CPU delay in sampler (#93)"
|
1 tahun lalu |
AlpinDale
|
ce66e1df56
fix: sync CPU delay in sampler (#93)
|
1 tahun lalu |
AlpinDale
|
efc6f7fbec
chore: reformats (#90)
|
1 tahun lalu |
AlpinDale
|
3d72f05c7b
feat: flattened 1D tensor -> 2D tensor (#85)
|
1 tahun lalu |
AlpinDale
|
e6be0118c9
feat: prompt logprobs and batched samplers (#77)
|
1 tahun lalu |
AlpinDale
|
3bf6197afb
fix: prompt processing delay introduced by #66 (#71)
|
1 tahun lalu |
AlpinDale
|
cbeeabeb9a
feat: mistral support (#20)
|
1 tahun lalu |
AlpinDale
|
34295abec4
chore: use xformers attention bias and add docs
|
1 tahun lalu |
AlpinDale
|
5e82533d02
upstream: add option to specify tokenizer
|
1 tahun lalu |
AlpinDale
|
cf9dc9b6cd
feat: write model metadata
|
1 tahun lalu |