david/aphrodite-engine

Mirror von https://github.com/PygmalionAI/aphrodite-engine

Autor	SHA1 Nachricht	Datum
AlpinDale	00503b9fc1 feat: non-uniform quantization via `compressed-tensors` for llama	vor 5 Monaten
AlpinDale	6671e3a162 feat: add CPU offloading support (#598)	vor 6 Monaten
AlpinDale	497bf64942 chore: simplify pipeline parallel code in llama	vor 6 Monaten
AlpinDale	4599c98f99 feat: dynamic image size support for VLMs	vor 6 Monaten