AlpinDale
|
50c2434267
move megatron to a top-level directory
|
9 місяців тому |
sgsdxzy
|
638547ec98
fix: Improve cohere model. (#404)
|
9 місяців тому |
AlpinDale
|
fa083286e3
Speculative Decoding Part 4: Lookahead scheduling (#402)
|
9 місяців тому |
sgsdxzy
|
47370d2ad5
Fix cohere for command-r+ (#394)
|
9 місяців тому |
AlpinDale
|
0f1399c135
feat: attention refactor part 2
|
9 місяців тому |
AlpinDale
|
d1786645a3
fix formatting
|
9 місяців тому |
AlpinDale
|
ace9bcd53f
fix gptq for cohere
|
9 місяців тому |
AlpinDale
|
688d56993a
add logit scale for command-r
|
9 місяців тому |
AlpinDale
|
06d88bb8fd
logitproc for cohere
|
9 місяців тому |
AlpinDale
|
582e9efc12
support command-r+ model
|
9 місяців тому |
AlpinDale
|
f8dfac6372
chore: attention refactor and upstream sync apr01 (#365)
|
9 місяців тому |
AlpinDale
|
da223153c6
feat&fix: cohere support and missing GPU blocks (#333)
|
9 місяців тому |