Explorar o código

Set share_input_output_emb=True

Aleksandr Borzunov %!s(int64=3) %!d(string=hai) anos
pai
achega
144d35ebce
Modificáronse 1 ficheiros con 1 adicións e 0 borrados
  1. 1 0
      task.py

+ 1 - 0
task.py

@@ -84,6 +84,7 @@ class TrainingTask:
                 shared_ff_ids=shared_layer_ids,
                 rotary_emb=True,
                 reversible=True,
+                share_input_output_emb=True,
             )
             logger.info(f"Trainable parameters: "
                         f"{sum(param.numel() for param in dalle.parameters() if param.requires_grad)}")