AlpinDale
|
4b80b42362
fix: memory leaks due to nccl cuda graphs (#275)
|
hace 11 meses |
AlpinDale
|
641bb0f6e9
feat: add custom allreduce kernels (#224)
|
hace 1 año |
AlpinDale
|
8fa608aeb7
feat: replace Ray with NCCL for control plane comms (#221)
|
hace 1 año |
AlpinDale
|
74604eb252
fix: pylint complaints (#91)
|
hace 1 año |
AlpinDale
|
a6a4220fa6
feat: refactor megatron and quants (#57)
|
hace 1 año |