justheuristic 4 년 전
부모
커밋
882cad67da
1개의 변경된 파일0개의 추가작업 그리고 1개의 파일을 삭제
  1. 0 1
      hivemind/moe/client/balanced_expert.py

+ 0 - 1
hivemind/moe/client/balanced_expert.py

@@ -67,7 +67,6 @@ class BalancedRemoteExpert(nn.Module):
 
         # Note: we send DUMMY to prevent torch from excluding expert from backward if no other inputs require grad
         flat_outputs = _BalancedRemoteModuleCall.apply(DUMMY,
-                                                       self.uid,
                                                        self.expert_balancer,
                                                        self.info,
                                                        self.forward_timeout,