Lịch sử commit

Tác giả SHA1 Thông báo Ngày
  AlpinDale 017b42c517 chore: use fork as the default method for mp backend 7 tháng trước cách đây
  AlpinDale cd9ed8623b fix: cuda version check for fp8 support in the cutlass kernels 7 tháng trước cách đây
  AlpinDale fad77538de feat: update cutlass int8 kernel configs for sm90 7 tháng trước cách đây
  AlpinDale b753ff7870 feat: per-channel support for static activation quant 7 tháng trước cách đây
  AlpinDale 3c7444c89b fix: asyncio.run hangs in python < 3.12 7 tháng trước cách đây
  AlpinDale d44ac8e497 fix: `--preemption_mode` -> `--preemption-mode` 7 tháng trước cách đây
  AlpinDale bcf9c83e6a fix: incorrect args passed to generate() method in phi3v example 7 tháng trước cách đây
  AlpinDale 025322ee5f fix: fp8 kv cache for qwen2 models 7 tháng trước cách đây
  AlpinDale 323fe23b21 chore: use 127.0.0.1 for single-node setups 7 tháng trước cách đây
  AlpinDale 89be49d058 fix: build for mi300x 7 tháng trước cách đây
  AlpinDale 7d3da17e19 fix: phi3 rope scaling 7 tháng trước cách đây
  AlpinDale 765adcfba1 chore: add w8a8 benchmark scripts 7 tháng trước cách đây
  AlpinDale 1587fab5de fix: cuda version check for mma warning suppression 7 tháng trước cách đây
  AlpinDale d1f91d0f70 fix: greedy sampling being not greedy in concurrent situations where penalties are used 7 tháng trước cách đây
  AlpinDale da6765c084 feat: lora support for commandr models 7 tháng trước cách đây
  AlpinDale 70ec3a7b93 chore: make the dockerfile a bit better 7 tháng trước cách đây
  AlpinDale 9b4c72a801 feat: support channel-wise quant for w8a8 dynamic per token activation quant 7 tháng trước cách đây
  AlpinDale 79b1c0b861 fix: do not error our if two processes do not agree on p2p capability 7 tháng trước cách đây
  AlpinDale e6d70101b3 feat: add support for phi-3 vision model 7 tháng trước cách đây
  AlpinDale 313e6e1ec7 feat: add typical acceptance sampling 7 tháng trước cách đây
  AlpinDale 0613d91551 fix: kv head calculation with MPT GQA 7 tháng trước cách đây
  AlpinDale b5694be865 chore: use a pool to reuse LogicalTokenBlock.token_ids 7 tháng trước cách đây
  AlpinDale c05a45f22f chore: minor updates to throughput benchmark and llm class 7 tháng trước cách đây
  AlpinDale dfa59bc5f9 fix: 16 GPUs in a cluster 7 tháng trước cách đây
  AlpinDale 5a925923e3 fix: numba cache 7 tháng trước cách đây
  AlpinDale 964aa08a70 fix: serializer log 7 tháng trước cách đây
  AlpinDale 5aa910a022 chore: allow building on non-avx512 machines 7 tháng trước cách đây
  AlpinDale 6a57861fca feat: initial XPU support via intel_extension_for_pytorch (#571) 7 tháng trước cách đây
  AlpinDale e2dbe5f05c feat: add sparse marlin for compressed tensors 7 tháng trước cách đây
  AlpinDale e2e64a6241 fix: limit numpy version 7 tháng trước cách đây