浏览代码

Log number of params

Aleksandr Borzunov 3 年之前
父节点
当前提交
df54ab6da5
共有 1 个文件被更改,包括 2 次插入0 次删除
  1. 2 0
      task.py

+ 2 - 0
task.py

@@ -85,6 +85,8 @@ class TrainingTask:
                 rotary_emb=True,
                 reversible=True,
             )
+            logger.info(f"Trainable parameters: "
+                        f"{sum(param.numel() for param in dalle.parameters() if param.requires_grad)}")
             self.model = ModelWrapper(dalle)
         else:
             logger.info(f"Loading model from {latest_checkpoint_dir}")