.. |
layers
|
4fbb052b34
add jamba config file
|
9 달 전 |
models
|
65cd99ba89
fix KVCache type
|
9 달 전 |
__init__.py
|
0f1399c135
feat: attention refactor part 2
|
9 달 전 |
hf_downloader.py
|
214151b04c
fix: max_num_batched_tokens for chunked_prefill (#412)
|
9 달 전 |
loader.py
|
50c2434267
move megatron to a top-level directory
|
9 달 전 |
neuron_loader.py
|
d1786645a3
fix formatting
|
9 달 전 |
outlines_decoding.py
|
63c2508ab4
no key sorting for outlines
|
9 달 전 |
outlines_logits_processors.py
|
0b35176089
feat: add context-free grammars (#376)
|
9 달 전 |
sampling_metadata.py
|
2319b411ce
refactor: neuron support
|
9 달 전 |
utils.py
|
d1786645a3
fix formatting
|
9 달 전 |