justheuristic 4 年 前
コミット
882cad67da
1 ファイル変更0 行追加1 行削除
  1. 0 1
      hivemind/moe/client/balanced_expert.py

+ 0 - 1
hivemind/moe/client/balanced_expert.py

@@ -67,7 +67,6 @@ class BalancedRemoteExpert(nn.Module):
 
         # Note: we send DUMMY to prevent torch from excluding expert from backward if no other inputs require grad
         flat_outputs = _BalancedRemoteModuleCall.apply(DUMMY,
-                                                       self.uid,
                                                        self.expert_balancer,
                                                        self.info,
                                                        self.forward_timeout,