Историја ревизија

Аутор SHA1 Порука Датум
  AlpinDale 65cd99ba89 fix KVCache type пре 8 месеци
  AlpinDale 9e52445ba0 formatting пре 8 месеци
  AlpinDale 6c43e00e60 add jamba modeling code пре 8 месеци
  AlpinDale 4fbb052b34 add jamba config file пре 8 месеци
  AlpinDale a1f18f17e6 modify the cache engine and model runner/worker to support mamba states пре 8 месеци
  AlpinDale f60803384d move out of ops dir пре 8 месеци
  AlpinDale 2ced01bc3e clean up interfaces and add selective state update triton kernels пре 8 месеци
  AlpinDale 7fd3bd4bf2 add selective scan kernels пре 8 месеци
  AlpinDale 44b02e94cd add forward kernels for causal depthwise conv1d пре 8 месеци
  sgsdxzy f3b546e33a feat: upport twe lm_head for quantized weights (#409) пре 8 месеци
  sgsdxzy 214151b04c fix: max_num_batched_tokens for chunked_prefill (#412) пре 8 месеци
  AlpinDale 1dccb03b17 incorrect comparison for hadamard and punica checks пре 8 месеци
  sgsdxzy 6a0a6360f1 fix: Allow setting config-path when converting ggufs. (#410) пре 8 месеци
  sgsdxzy fcfb72af24 Support arbitrary model in GGUF. (#381) пре 8 месеци
  AlpinDale bd0ddf1cfe feat: EETQ quantization (#408) пре 8 месеци
  AlpinDale b1caee23a6 cache the p2p access check for memory saving пре 8 месеци
  AlpinDale 373e0d3c01 fix neuron пре 8 месеци
  AlpinDale 28bcca2396 incorrect use of monotonic time in metrics logger пре 8 месеци
  AlpinDale 4ba273886a debug logging for distributed_init_method пре 8 месеци
  AlpinDale 1270b5567e triton compile error for flash_attn пре 8 месеци
  AlpinDale f375353026 enable custom_all_reduce by default in llm.py пре 8 месеци
  AlpinDale 2d2b43fe00 fix type hint пре 8 месеци
  AlpinDale 531969a0b2 move merge_async_iterators to common utils пре 8 месеци
  AlpinDale c18bf116da fix stop strings not being excluded from outputs пре 8 месеци
  AlpinDale 5ab7a159d7 fix formatting for previous commit пре 8 месеци
  AlpinDale b6bbf584ac fix echo пре 8 месеци
  AlpinDale 6e0761ba5d make init_distributed_environment compatible with init_process_group пре 8 месеци
  AlpinDale 083ba7b452 roll back chunked prefill changes to SDPA, isolate cpu worker пре 8 месеци
  AlpinDale 8c67b37131 fix docstrings пре 8 месеци
  AlpinDale fe17712f29 fully working chunked prefill пре 8 месеци