Forráskód Böngészése

benchmark_forward: Use dtype=bfloat16

Aleksandr Borzunov 2 éve
szülő
commit
e188610125
1 módosított fájl, 1 hozzáadás és 1 törlés
  1. 1 1
      src/petals/cli/benchmark_forward.py

+ 1 - 1
src/petals/cli/benchmark_forward.py

@@ -42,7 +42,7 @@ def main():
 @torch.inference_mode()
 def benchmark_forward(process_idx, args):
     tokenizer = BloomTokenizerFast.from_pretrained(args.model)
-    model = DistributedBloomForCausalLM.from_pretrained(args.model, initial_peers=args.initial_peers, torch_dtype=torch.float32)
+    model = DistributedBloomForCausalLM.from_pretrained(args.model, initial_peers=args.initial_peers, torch_dtype=torch.bfloat16)
     logger.info(f"Created model: {process_idx=} {model.device=}")
 
     torch.manual_seed(42)