4 سال پیش · 32b87bf3fe
--- a/hivemind/client/optim/collaborative.py
+++ b/hivemind/client/optim/collaborative.py
@@ -131,8 +131,8 @@ class CollaborativeOptimizer(DecentralizedOptimizerBase):
 
				         with self.lock_collaboration_state:
			
 
				             self.averager.load_state_from_peers(**kwargs)
			
 
				             self.local_samples_accumulated = self.local_steps_accumulated = 0
			
 
				+            self.reset_accumulated_grads_()
			
 
				             self.update_scheduler()
			
 
				-            self.opt.zero_grad()
			
 
				 
			
 
				     def step(self, batch_size: Optional[int] = None, **kwargs):
			
 
				         """
			
@@ -189,8 +189,6 @@ class CollaborativeOptimizer(DecentralizedOptimizerBase):
 
				                 self.averager.local_step += 1
			
 
				 
			
 
				             self.opt.step()
			
 
				-            if self.reuse_grad_buffers:
			
 
				-                self.opt.zero_grad()
			
 
				             self.reset_accumulated_grads_()
			
 
				             self.local_samples_accumulated = self.local_steps_accumulated = 0
			
 
				             self.collaboration_state.register_step()
			
@@ -240,9 +238,10 @@ class CollaborativeOptimizer(DecentralizedOptimizerBase):
 
				     @torch.no_grad()
			
 
				     def reset_accumulated_grads_(self):
			
 
				         if self.reuse_grad_buffers:
			
 
				-            return
			
 
				-        for grad_buf in self.accumulated_grads():
			
 
				-            grad_buf.zero_()
			
 
				+            self.opt.zero_grad()
			
 
				+        else:
			
 
				+            for grad_buf in self.accumulated_grads():
			
 
				+                grad_buf.zero_()
			
 
				 
			
 
				     def report_training_progress(self):
			
 
				         """ Periodically publish metadata and the current number of samples accumulated towards the next step """