.. |
guided_decoding
|
0256ed236b
feat: windows support (#790)
|
před 2 měsíci |
layers
|
bfc8988116
feat: add cuda sampling kernels for top_k and top_p (#828)
|
před 2 měsíci |
model_loader
|
0f1af04cf5
frontend: minor logging improvements (#787)
|
před 2 měsíci |
models
|
2f61644f6e
SPMD optimizations (#824)
|
před 2 měsíci |
__init__.py
|
7df7b8ca53
optimization: reduce end-to-end overhead from python obj allocation (#666)
|
před 4 měsíci |
_custom_op.py
|
5d37ec1016
suppress tpu import warning (#696)
|
před 4 měsíci |
parameter.py
|
f98e7b2f8c
feat: add HQQ quantization support (#795)
|
před 2 měsíci |
pooling_metadata.py
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
před 4 měsíci |
sampling_metadata.py
|
22427602eb
feat: add top-nsigma sampling method
|
před 2 měsíci |
utils.py
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
před 8 měsíci |