AlpinDale
|
eef647deab
fix: greedy decoding in TPU
|
před 4 měsíci |
AlpinDale
|
8d88814475
chore: reduce XLA compile times
|
před 4 měsíci |
AlpinDale
|
386ad8bef6
feat: tensor parallelism for TPU with ray
|
před 4 měsíci |
AlpinDale
|
f91991f584
fix: f-string fixes
|
před 4 měsíci |
AlpinDale
|
b6c4dfce23
chore: refactor TPU model runner and worker
|
před 4 měsíci |
AlpinDale
|
8c2dd39500
chore: remove multimodal stuff from TPU
|
před 4 měsíci |
AlpinDale
|
e1475fbec7
feat: MoE support with Pallas GMM kernel for TPUs
|
před 4 měsíci |
AlpinDale
|
1cb06835a0
fix: TPU multimodal kwargs and outlines installation in TPU docker
|
před 4 měsíci |
AlpinDale
|
4f7d212b70
feat: remove vision language config
|
před 4 měsíci |
AlpinDale
|
4599c98f99
feat: dynamic image size support for VLMs
|
před 4 měsíci |
AlpinDale
|
301ec7c77d
fix: pad slot id in tpu runner
|
před 5 měsíci |
AlpinDale
|
cdff8e89f9
feat: introduce `DraftModelRunner`
|
před 5 měsíci |
AlpinDale
|
85ef2fe8b1
chore: clean up placeholder symbols
|
před 5 měsíci |
AlpinDale
|
fcd58614f4
feat: support parallel sampling and swapping in TPU
|
před 5 měsíci |
AlpinDale
|
d36b88b301
fix: raise errors if using unsupported samplers on TPU
|
před 5 měsíci |
AlpinDale
|
608e8e1310
chore: refactor TPU backend to make it more similar to GPU backend
|
před 5 měsíci |
AlpinDale
|
fe21123a1c
feat: TPU support (#570)
|
před 5 měsíci |