Historial de Commits

Autor SHA1 Mensaje Fecha
  AlpinDale b6c97e4d16 feat: add guided decoding to LLM hace 5 meses
  AlpinDale 1ab2dad198 Refactor prompt processing (#605) hace 5 meses
  AlpinDale 6671e3a162 feat: add CPU offloading support (#598) hace 5 meses
  AlpinDale 99680b2d23 feat: soft prompts (#589) hace 5 meses
  AlpinDale 4f7d212b70 feat: remove vision language config hace 5 meses
  AlpinDale c0c336aaa3 refactor: registry for processing model inputs; quick_gelu; clip model support hace 5 meses
  AlpinDale c05a45f22f chore: minor updates to throughput benchmark and llm class hace 5 meses
  AlpinDale 458c8b5e33 chore: estimated input speed for tqdm hace 5 meses
  AlpinDale e989ddf2a1 chore: allow using multiple lora modules in llm.generate() hace 6 meses
  AlpinDale d00a7517e6 fix: tokenizer delay with using LLM class hace 6 meses
  AlpinDale 8d77c69cbd feat: support image processor and add llava example hace 6 meses
  AlpinDale 8c61fb9c19 fix: prevent LLM.encode() to be used with causal models hace 6 meses
  AlpinDale 90ceab32ff refactor: consolidate prompt args to LLM engines hace 6 meses
  AlpinDale 342346afda improve hashing function hace 6 meses
  AlpinDale be8154a8a0 feat: proper embeddings API with e5-mistral-7b support hace 6 meses
  AlpinDale 7e6b309f89 tok/s in llm class hace 6 meses
  AlpinDale 35ae01d7ba refactor: attention metadata term hace 6 meses
  AlpinDale 46159b107a formatting: pt1 hace 7 meses
  AlpinDale bf2dd2bee9 feat: allow multiple sampling params in LLM class hace 7 meses
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) hace 8 meses
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) hace 10 meses
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) hace 10 meses
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) hace 11 meses
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) hace 1 año
  AlpinDale 641bb0f6e9 feat: add custom allreduce kernels (#224) hace 1 año
  AlpinDale c0aac15421 feat: S-LoRA support (#222) hace 1 año
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) hace 1 año
  AlpinDale f013d714c0 chore: merge dev branch into main (#177) hace 1 año
  AlpinDale 2755a48d51 merge dev branch into main (#153) hace 1 año
  AlpinDale 8834ecf9de chore: clean up refactor endpoints (#98) hace 1 año