AlpinDale d9f4c36edd feat: Medusa speculative decoding support (#590) 5 mēneši atpakaļ
..
__init__.py d9f4c36edd feat: Medusa speculative decoding support (#590) 5 mēneši atpakaļ
arctic.py 1e35cef979 feat: add arctic snowflake model (#551) 6 mēneši atpakaļ
chatglm.py 9e73559eba make use of batched rotary embedding kernels to support long context lora 6 mēneši atpakaļ
dbrx.py fca911ee0a vLLM Upstream Sync (#526) 7 mēneši atpakaļ
falcon.py fca911ee0a vLLM Upstream Sync (#526) 7 mēneši atpakaļ
jais.py fca911ee0a vLLM Upstream Sync (#526) 7 mēneši atpakaļ
medusa.py d9f4c36edd feat: Medusa speculative decoding support (#590) 5 mēneši atpakaļ
mlp_speculator.py de7e6919c0 feat: support tied weights and input scale for MLPSpeculator 5 mēneši atpakaļ
mpt.py fca911ee0a vLLM Upstream Sync (#526) 7 mēneši atpakaļ