Aleksandr Borzunov
|
c61c61b20d
Use t5-small tokenizer
|
há 3 anos atrás |
Aleksandr Borzunov
|
144d35ebce
Set share_input_output_emb=True
|
há 3 anos atrás |
Aleksandr Borzunov
|
380a5f3231
Set num threads to <= 4
|
há 3 anos atrás |
Aleksandr Borzunov
|
df54ab6da5
Log number of params
|
há 3 anos atrás |
Aleksandr Borzunov
|
c5493b9baf
Update per_device_batch_sizes and shuffle_buffer_size
|
há 3 anos atrás |
Aleksandr Borzunov
|
17da8639c2
Fix and improve preprocessing
|
há 3 anos atrás |
Aleksandr Borzunov
|
d0985de540
Enable rotary embeddings
|
há 3 anos atrás |
Aleksandr Borzunov
|
f621362466
Make logging less verbose
|
há 3 anos atrás |
Aleksandr Borzunov
|
31215c85d3
Handle None captions
|
há 3 anos atrás |
Aleksandr Borzunov
|
1c30209eba
Increase timeouts
|
há 3 anos atrás |
Aleksandr Borzunov
|
20e2a3aab2
Use dalle-pytorch instead of LeanAlbert
|
há 3 anos atrás |
Max Ryabinin
|
72fc0bcdb7
Initial commit (ru-max branch without private code)
|
há 4 anos atrás |