Commit History

Автор SHA1 Съобщение Дата
  AlpinDale b6c4dfce23 chore: refactor TPU model runner and worker преди 5 месеца
  AlpinDale 1ff6d4c3d7 feat: support pipeline parallel on indivisible GPU count (#587) преди 5 месеца
  AlpinDale 4f7d212b70 feat: remove vision language config преди 5 месеца
  AlpinDale d0ff3fd59e fix: tpu sampler output преди 5 месеца
  AlpinDale d2461161ec chore: optimize KV cache swapping for TPU преди 5 месеца
  AlpinDale 8b626e4032 fix: cpu kv cache allocation for TPU преди 5 месеца
  AlpinDale fcd58614f4 feat: support parallel sampling and swapping in TPU преди 5 месеца
  AlpinDale af1286f9fa fix: kv cache size calculation on TPUs преди 5 месеца
  AlpinDale 608e8e1310 chore: refactor TPU backend to make it more similar to GPU backend преди 5 месеца
  AlpinDale a524667db0 fix: device assertion for sdpa backend; fix env for tpu worker преди 5 месеца
  AlpinDale fe21123a1c feat: TPU support (#570) преди 5 месеца