Explorar o código

Enable rotary embeddings

Aleksandr Borzunov %!s(int64=3) %!d(string=hai) anos
pai
achega
d0985de540
Modificáronse 1 ficheiros con 1 adicións e 1 borrados
  1. 1 1
      task.py

+ 1 - 1
task.py

@@ -82,7 +82,7 @@ class TrainingTask:
                 attn_dropout=0,
                 shared_attn_ids=shared_layer_ids,
                 shared_ff_ids=shared_layer_ids,
-                rotary_emb=False,  # FIXME: Fix RuntimeError when True
+                rotary_emb=True,
                 reversible=True,
             )
             self.model = ModelWrapper(dalle)