AlpinDale 65cd99ba89 fix KVCache type 9 ヶ月 前
..
layers 4fbb052b34 add jamba config file 9 ヶ月 前
models 65cd99ba89 fix KVCache type 9 ヶ月 前
__init__.py 0f1399c135 feat: attention refactor part 2 9 ヶ月 前
hf_downloader.py 214151b04c fix: max_num_batched_tokens for chunked_prefill (#412) 9 ヶ月 前
loader.py 50c2434267 move megatron to a top-level directory 9 ヶ月 前
neuron_loader.py d1786645a3 fix formatting 9 ヶ月 前
outlines_decoding.py 63c2508ab4 no key sorting for outlines 9 ヶ月 前
outlines_logits_processors.py 0b35176089 feat: add context-free grammars (#376) 9 ヶ月 前
sampling_metadata.py 2319b411ce refactor: neuron support 9 ヶ月 前
utils.py d1786645a3 fix formatting 9 ヶ月 前