Aleksandr Borzunov
|
c61c61b20d
Use t5-small tokenizer
|
3 jaren geleden |
Aleksandr Borzunov
|
144d35ebce
Set share_input_output_emb=True
|
3 jaren geleden |
Aleksandr Borzunov
|
380a5f3231
Set num threads to <= 4
|
3 jaren geleden |
Aleksandr Borzunov
|
df54ab6da5
Log number of params
|
3 jaren geleden |
Aleksandr Borzunov
|
c5493b9baf
Update per_device_batch_sizes and shuffle_buffer_size
|
3 jaren geleden |
Aleksandr Borzunov
|
17da8639c2
Fix and improve preprocessing
|
3 jaren geleden |
Aleksandr Borzunov
|
d0985de540
Enable rotary embeddings
|
3 jaren geleden |
Aleksandr Borzunov
|
f621362466
Make logging less verbose
|
3 jaren geleden |
Aleksandr Borzunov
|
31215c85d3
Handle None captions
|
3 jaren geleden |
Aleksandr Borzunov
|
1c30209eba
Increase timeouts
|
3 jaren geleden |
Aleksandr Borzunov
|
20e2a3aab2
Use dalle-pytorch instead of LeanAlbert
|
3 jaren geleden |
Max Ryabinin
|
72fc0bcdb7
Initial commit (ru-max branch without private code)
|
4 jaren geleden |