AlpinDale 65cd99ba89 fix KVCache type hace 9 meses
..
layers 4fbb052b34 add jamba config file hace 9 meses
models 65cd99ba89 fix KVCache type hace 9 meses
__init__.py 0f1399c135 feat: attention refactor part 2 hace 10 meses
hf_downloader.py 214151b04c fix: max_num_batched_tokens for chunked_prefill (#412) hace 9 meses
loader.py 50c2434267 move megatron to a top-level directory hace 9 meses
neuron_loader.py d1786645a3 fix formatting hace 10 meses
outlines_decoding.py 63c2508ab4 no key sorting for outlines hace 9 meses
outlines_logits_processors.py 0b35176089 feat: add context-free grammars (#376) hace 10 meses
sampling_metadata.py 2319b411ce refactor: neuron support hace 10 meses
utils.py d1786645a3 fix formatting hace 10 meses