Aleksandr Borzunov
|
2fed6ba68e
Use HF username as wandb run name
|
vor 3 Jahren |
Alexander Borzunov
|
c365b2ec9f
Tweak settings for the upcoming demo (#2)
|
vor 3 Jahren |
Aleksandr Borzunov
|
64dee420da
Upgrade to using hivemind.optim.experimental
|
vor 3 Jahren |
Aleksandr Borzunov
|
e97e7b8811
Try removing OffloadOptimizer
|
vor 3 Jahren |
Aleksandr Borzunov
|
3b184c57da
Don't download VQGAN weights
|
vor 3 Jahren |
Aleksandr Borzunov
|
c61c61b20d
Use t5-small tokenizer
|
vor 3 Jahren |
Aleksandr Borzunov
|
144d35ebce
Set share_input_output_emb=True
|
vor 3 Jahren |
Aleksandr Borzunov
|
df54ab6da5
Log number of params
|
vor 3 Jahren |
Aleksandr Borzunov
|
d0985de540
Enable rotary embeddings
|
vor 3 Jahren |
Aleksandr Borzunov
|
20e2a3aab2
Use dalle-pytorch instead of LeanAlbert
|
vor 3 Jahren |
Max Ryabinin
|
72fc0bcdb7
Initial commit (ru-max branch without private code)
|
vor 4 Jahren |