Автор | SHA1 Съобщение | Дата |
---|---|---|
|
00503b9fc1 feat: non-uniform quantization via `compressed-tensors` for llama | преди 5 месеца |
|
6671e3a162 feat: add CPU offloading support (#598) | преди 6 месеца |
|
497bf64942 chore: simplify pipeline parallel code in llama | преди 6 месеца |
|
4599c98f99 feat: dynamic image size support for VLMs | преди 6 месеца |