Historial de Commits

Autor SHA1 Mensaje Fecha
  AlpinDale e702f587cf feat: add batched RoPE kernels (#371) hace 9 meses
  AlpinDale 3d6695cfbb feat: add approximate gelu activation kernels (#370) hace 9 meses
  AlpinDale 5fa15b4435 fix: double free with sliding window (#369) hace 9 meses
  AlpinDale 72cd8494aa feat: mistral neuron support (#368) hace 9 meses
  AlpinDale 0f6d56b07f feat: model executor refactor (#367) hace 9 meses
  AlpinDale b361096463 fix: tokenizer when using ray (#366) hace 9 meses
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) hace 9 meses
  50h100a 35b4aa7da5 Fix logitproc for logit_bias in OAI endpoints. hace 10 meses
  50h100a 7ed57e318d Overhauled SamplingTensors construction. hace 10 meses
  50h100a a39920bc99 Merge pull request #355 from 50h100a/pr_seedfix hace 10 meses
  50h100a 051c60736e Merge pull request #356 from 50h100a/pr_samplerinternals hace 10 meses
  50h100a d5dbd29db4 hoist sampler internals into a single function. hace 10 meses
  50h100a b9e0ae87c5 fix fine-grained seeding. hace 10 meses
  sgsdxzy 6ebac34dc1 chore: cleaner pre-llamafied Yi implementation (#352) hace 10 meses
  AlpinDale 681e94611f fix: restore backwards compatibility with old Yi models (#351) hace 10 meses
  AlpinDale 1b6732fcde chore: bump transformers version hace 10 meses
  Absurd 070c1cef8c fix: explicit RFC3986 for prometheus_client asgi (#344) hace 10 meses
  Stefan Daniel Schwarz 5d747cfc4d readme: docker docs (#340) hace 10 meses
  Stefan Daniel Schwarz 8e259ee7cf chore: hf_transfer for faster downloads (#339) hace 10 meses
  AlpinDale 398a97338a feat: enable lora loading/unloading via API (#337) hace 10 meses
  Stefan Daniel Schwarz b0688b6b9c fix: docker port and kobold api (#338) hace 10 meses
  AlpinDale ed225f59cb fix: transformers in requirements hace 10 meses
  AlpinDale e120404436 Revert "feat: CMake Build System Generator (#332)" hace 10 meses
  AlpinDale 06312251a7 fix: explictly export CUDA arches for CI hace 10 meses
  AlpinDale e53842bd5d fix: cuda home detection for fp8 kv cache hace 10 meses
  AlpinDale 7411a74cc6 bump version to 0.5.2 hace 10 meses
  AlpinDale ad6802690f feat: CMake Build System Generator (#332) hace 10 meses
  AlpinDale da223153c6 feat&fix: cohere support and missing GPU blocks (#333) hace 10 meses
  AlpinDale e2a7b50440 fix: logprobs when inf or nan (#329) hace 10 meses
  AlpinDale 4791a63fdc fix: env.py url in bugs template hace 10 meses