artek0chumak
|
526942c67d
fix imports
|
3 jaren geleden |
artek0chumak
|
2e0abe48ae
fix generate
|
3 jaren geleden |
artek0chumak
|
b29937b74c
Init inference generation
|
3 jaren geleden |
justheuristic
|
e2711a033b
Add automated tests (#23)
|
3 jaren geleden |
Dmitry Baranchuk
|
f5463812ad
Shallow prompt tuning (#22)
|
3 jaren geleden |
dbaranchuk
|
21e1f42f04
mv set_requires_grad to remote_model
|
3 jaren geleden |
dbaranchuk
|
79280c4371
refactoring
|
3 jaren geleden |
dbaranchuk
|
6bffeff0a1
fix
|
3 jaren geleden |
dbaranchuk
|
b3cc9e0d99
add LM head for DistributedBloomCausalLM
|
3 jaren geleden |
dbaranchuk
|
df42822f26
LM head for CausalLM & chunked forward
|
3 jaren geleden |
justheuristic
|
1c68670d06
it works
|
3 jaren geleden |
justheuristic
|
88c1bf9896
black-isort
|
3 jaren geleden |
justheuristic
|
4695071ad2
WIP: make DistributedBloom compliant with HF interface
|
3 jaren geleden |
justheuristic
|
e32208c954
black-isort
|
3 jaren geleden |
justheuristic
|
4ad845bce3
black-isort
|
3 jaren geleden |
Dmitry Baranchuk
|
e66ab6f1f2
design interface & refactoring
|
3 jaren geleden |
Dmitry Baranchuk
|
d969172208
set requires_grad=False, lm_layer -> h @ word_embeddings, rm lm_layer from comverted_model
|
3 jaren geleden |
justheuristic
|
331591c915
less intrusive warnings
|
3 jaren geleden |
justheuristic
|
9c492bbe8c
Infer prefix by defaukt
|
3 jaren geleden |
justheuristic
|
19ae71e8fc
from_pretrained
|
3 jaren geleden |
justheuristic
|
471e47c0f5
black-isort
|
3 jaren geleden |
justheuristic
|
7d68f6b9a4
fix model creation
|
3 jaren geleden |
justheuristic
|
5849cea28c
prototype remote sequential
|
3 jaren geleden |