justheuristic 4 năm trước cách đây
mục cha
commit
882cad67da
1 tập tin đã thay đổi với 0 bổ sung1 xóa
  1. 0 1
      hivemind/moe/client/balanced_expert.py

+ 0 - 1
hivemind/moe/client/balanced_expert.py

@@ -67,7 +67,6 @@ class BalancedRemoteExpert(nn.Module):
 
         # Note: we send DUMMY to prevent torch from excluding expert from backward if no other inputs require grad
         flat_outputs = _BalancedRemoteModuleCall.apply(DUMMY,
-                                                       self.uid,
                                                        self.expert_balancer,
                                                        self.info,
                                                        self.forward_timeout,