Alexander Borzunov
|
c365b2ec9f
Tweak settings for the upcoming demo (#2)
|
před 3 roky |
Aleksandr Borzunov
|
64dee420da
Upgrade to using hivemind.optim.experimental
|
před 3 roky |
Aleksandr Borzunov
|
e97e7b8811
Try removing OffloadOptimizer
|
před 3 roky |
Aleksandr Borzunov
|
259e6b9009
Set per_device_batch_sizes = 3
|
před 3 roky |
Aleksandr Borzunov
|
75e68ed8c0
Fix hivemind commit in requirements.txt
|
před 3 roky |
Aleksandr Borzunov
|
3666555ee5
Add learning-at-home repos to requirements.txt
|
před 3 roky |
Aleksandr Borzunov
|
3b184c57da
Don't download VQGAN weights
|
před 3 roky |
Aleksandr Borzunov
|
c61c61b20d
Use t5-small tokenizer
|
před 3 roky |
Aleksandr Borzunov
|
144d35ebce
Set share_input_output_emb=True
|
před 3 roky |
Aleksandr Borzunov
|
380a5f3231
Set num threads to <= 4
|
před 3 roky |
Aleksandr Borzunov
|
df54ab6da5
Log number of params
|
před 3 roky |
Aleksandr Borzunov
|
c5493b9baf
Update per_device_batch_sizes and shuffle_buffer_size
|
před 3 roky |
Aleksandr Borzunov
|
17da8639c2
Fix and improve preprocessing
|
před 3 roky |
Aleksandr Borzunov
|
d0985de540
Enable rotary embeddings
|
před 3 roky |
Aleksandr Borzunov
|
f621362466
Make logging less verbose
|
před 3 roky |
Aleksandr Borzunov
|
31215c85d3
Handle None captions
|
před 3 roky |
Aleksandr Borzunov
|
1c30209eba
Increase timeouts
|
před 3 roky |
Aleksandr Borzunov
|
20e2a3aab2
Use dalle-pytorch instead of LeanAlbert
|
před 3 roky |
Max Ryabinin
|
72fc0bcdb7
Initial commit (ru-max branch without private code)
|
před 4 roky |