AlpinDale
|
0dfa6b60ec
core: support logprobs with multi-step scheduling (#963)
|
2 주 전 |
50h100a
|
9022c6d869
remove progress_bar imports
|
2 달 전 |
50h100a
|
9576096b9d
iterate over weights normally
|
2 달 전 |
AlpinDale
|
0e558e9b2f
fix: loading chameleon model with TP>1 (#695)
|
4 달 전 |
AlpinDale
|
3f712cd287
feat: add progress bar for loading individual weight modules (#640)
|
4 달 전 |
AlpinDale
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
4 달 전 |
AlpinDale
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
8 달 전 |
AlpinDale
|
f8dfac6372
chore: attention refactor and upstream sync apr01 (#365)
|
9 달 전 |
AlpinDale
|
da223153c6
feat&fix: cohere support and missing GPU blocks (#333)
|
10 달 전 |
AlpinDale
|
e42a78381a
feat: switch from pylint to ruff (#322)
|
10 달 전 |
AlpinDale
|
e31c6f0b45
feat: refactor modeling logic and support more models (#274)
|
10 달 전 |
AlpinDale
|
842912d022
feat: on-the-fly gguf conversion (#250)
|
11 달 전 |
AlpinDale
|
c3a221eb02
feat: GGUF, QuIP#, and Marlin support (#228)
|
11 달 전 |
AlpinDale
|
8fa608aeb7
feat: replace Ray with NCCL for control plane comms (#221)
|
11 달 전 |
AlpinDale
|
f013d714c0
chore: merge dev branch into main (#177)
|
1 년 전 |
AlpinDale
|
2755a48d51
merge dev branch into main (#153)
|
1 년 전 |
AlpinDale
|
d5abc36994
fix: assertion error in gpt-j
|
1 년 전 |
AlpinDale
|
74604eb252
fix: pylint complaints (#91)
|
1 년 전 |
AlpinDale
|
efc6f7fbec
chore: reformats (#90)
|
1 년 전 |
AlpinDale
|
a6a4220fa6
feat: refactor megatron and quants (#57)
|
1 년 전 |
AlpinDale
|
0495c50a3e
GPTQ+exllama support (#21)
|
1 년 전 |
AlpinDale
|
75c27d3e65
massive overhaul
|
1 년 전 |
AlpinDale
|
6b9561ef07
adapt TGI incremental detokenization
|
1 년 전 |
AlpinDale
|
45f6d9f923
initial refactor commit
|
1 년 전 |
AlpinDale
|
6dfca19dda
fix: gpt-j loading
|
1 년 전 |
AlpinDale
|
cd17af7bc4
chore: clean up gpt-j and remove cross_attention
|
1 년 전 |
AlpinDale
|
3dfa2c8480
fix: pass to mlp
|
1 년 전 |
AlpinDale
|
a59d9a25b2
feat: support for GPT-J HF
|
1 년 전 |
AlpinDale
|
fd35ba84b0
fix: whoops
|
1 년 전 |
AlpinDale
|
f2fe14ec1c
fix: epsilon variance value for RMSNorm
|
1 년 전 |