4 年之前 · 318bb7ad48
--- a/hivemind/optim/experimental/state_averager.py
+++ b/hivemind/optim/experimental/state_averager.py
@@ -631,7 +631,8 @@ class TrainingStateAverager(DecentralizedAverager):
 
				         Attempt to download the latest optimizer state from peers and update trainer parameters/statistics.
			
 
				         :returns: whether or the averager succeeded in loading parameters
			
 
				         """
			
 
				-        main_parameters_and_extras = tuple(chain(self.main_parameters, self.extra_tensors))
			
 
				+        opt_parameters = tuple(param for param_group in self.optimizer.param_groups for param in param_group["params"])
			
 
				+        main_parameters_and_extras = tuple(chain(opt_parameters, self.extra_tensors))
			
 
				         num_parameters_and_extras = len(main_parameters_and_extras)
			
 
				 
			
 
				         loaded_state = super().load_state_from_peers(**kwargs)
			
@@ -661,6 +662,8 @@ class TrainingStateAverager(DecentralizedAverager):
 
				 
			
 
				         if self.offload_optimizer:
			
 
				             self._apply_optimizer_parameters_()
			
 
				+        if not self.reuse_tensors:
			
 
				+            self._load_local_tensors_into_averager_()
			
 
				 
			
 
				         self.local_epoch = metadata["epoch"]
			
 
				         self._update_scheduler()