3 år sedan · 86326064de
--- a/benchmarks/benchmark_optimizer.py
+++ b/benchmarks/benchmark_optimizer.py
@@ -51,7 +51,7 @@ class TrainingArguments:
 
				     )
			
 
				 
			
 
				 
			
 
				-def _run_training_with_swarm(args: TrainingArguments):
			
 
				+def benchmark_optimizer(args: TrainingArguments):
			
 
				     random.seed(args.seed)
			
 
				     torch.manual_seed(args.seed)
			
 
				     torch.set_num_threads(1)
			
--- a/hivemind/optim/grad_scaler.py
+++ b/hivemind/optim/grad_scaler.py
@@ -6,7 +6,7 @@ from torch.cuda.amp import GradScaler as TorchGradScaler
 
				 from torch.cuda.amp.grad_scaler import _refresh_per_optimizer_state
			
 
				 from torch.optim import Optimizer as TorchOptimizer
			
 
				 
			
 
				-from hivemind.optim.base import DecentralizedOptimizerBase
			
 
				+from hivemind.optim import DecentralizedOptimizerBase, Optimizer
			
 
				 from hivemind.utils.logging import get_logger
			
 
				 
			
 
				 logger = get_logger(__name__)
			
@@ -34,7 +34,7 @@ class GradScaler(TorchGradScaler):
 
				             self._is_running_global_step = was_running
			
 
				 
			
 
				     def unscale_(self, optimizer: TorchOptimizer) -> bool:
			
 
				-        assert isinstance(optimizer, DecentralizedOptimizerBase)
			
 
				+        assert isinstance(optimizer, (Optimizer, DecentralizedOptimizerBase))
			
 
				         if self._is_running_global_step:
			
 
				             super().unscale_(optimizer.opt)
			
 
				             return True