AlpinDale 39beed0b87 Revert "Refactor AWQ support." 1 năm trước cách đây
..
__init__.py 07aa2a492f upstream: add option to specify tokenizer 1 năm trước cách đây
activation.py 32844c1522 add GELU kernels and remove compile bloat 1 năm trước cách đây
attention.py e77960c57e use float datatype for RoPE 1 năm trước cách đây
layernorm.py f2fe14ec1c fix: epsilon variance value for RMSNorm 1 năm trước cách đây
sampler.py 6dfca14e1f compute logprobs with log_softmax instead of log 1 năm trước cách đây