Commit Verlauf

Autor SHA1 Nachricht Datum
  AlpinDale 50c2434267 move megatron to a top-level directory vor 9 Monaten
  AlpinDale 4d33ce60da feat: Triton flash attention backend for ROCm (#407) vor 9 Monaten
  AlpinDale 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ vor 9 Monaten
  AlpinDale 0f1399c135 feat: attention refactor part 2 vor 9 Monaten
  AlpinDale d1786645a3 fix formatting vor 9 Monaten
  AlpinDale 688d56993a add logit scale for command-r vor 9 Monaten
  AlpinDale f1ea36a445 add some imports vor 9 Monaten
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) vor 9 Monaten
  AlpinDale da223153c6 feat&fix: cohere support and missing GPU blocks (#333) vor 10 Monaten
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) vor 10 Monaten
  AlpinDale e31c6f0b45 feat: refactor modeling logic and support more models (#274) vor 11 Monaten
  AlpinDale 842912d022 feat: on-the-fly gguf conversion (#250) vor 11 Monaten
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) vor 1 Jahr
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) vor 1 Jahr
  AlpinDale b9b295d74e chore: backlogs 1 (#191) vor 1 Jahr
  AlpinDale 7d91e9e0f2 feat: CUDA graphs (#172) vor 1 Jahr
  AlpinDale 653da510d1 chore: rewrite InputMetadata (#143) vor 1 Jahr
  AlpinDale 8b2bbbd98b chore: attention rewrite + models (#135) vor 1 Jahr
  AlpinDale 0d51eac374 feat: awq for all models (#124) vor 1 Jahr
  AlpinDale e7b6a2d5a0 chore: tensor parallel refactors part 2 (#116) vor 1 Jahr
  AlpinDale 74604eb252 fix: pylint complaints (#91) vor 1 Jahr
  AlpinDale efc6f7fbec chore: reformats (#90) vor 1 Jahr
  AlpinDale a6a4220fa6 feat: refactor megatron and quants (#57) vor 1 Jahr
  AlpinDale 0495c50a3e GPTQ+exllama support (#21) vor 1 Jahr
  AlpinDale 75c27d3e65 massive overhaul vor 1 Jahr
  AlpinDale 6b9561ef07 adapt TGI incremental detokenization vor 1 Jahr
  AlpinDale 45f6d9f923 initial refactor commit vor 1 Jahr
  AlpinDale 06e71fc492 feat: add GPT-NeoX support for testing purposes vor 1 Jahr