há 2 anos atrás · e9e506711e
--- a/src/petals/server/server.py
+++ b/src/petals/server/server.py
@@ -436,30 +436,31 @@ class ModuleContainer(threading.Thread):
 
				 
			
 
				         blocks = {}
			
 
				         try:
			
 
				+            module_uid, block_index = module_uids[0], block_indices[0]
			
 
				+            block = load_pretrained_block(
			
 
				+                converted_model_name_or_path,
			
 
				+                block_index,
			
 
				+                config=block_config,
			
 
				+                torch_dtype=torch_dtype,
			
 
				+                revision=revision,
			
 
				+                token=token,
			
 
				+                cache_dir=cache_dir,
			
 
				+                max_disk_space=max_disk_space,
			
 
				+            )
			
 
				+            block = convert_block(
			
 
				+                block,
			
 
				+                block_index,
			
 
				+                block_config,
			
 
				+                tensor_parallel_devices,
			
 
				+                device,
			
 
				+                quant_type,
			
 
				+                adapters=server_info.adapters,
			
 
				+                freeze=True,
			
 
				+                token=token,
			
 
				+                cache_dir=cache_dir,
			
 
				+                max_disk_space=max_disk_space,
			
 
				+            )
			
 
				             for module_uid, block_index in zip(module_uids, block_indices):
			
 
				-                block = load_pretrained_block(
			
 
				-                    converted_model_name_or_path,
			
 
				-                    block_index,
			
 
				-                    config=block_config,
			
 
				-                    torch_dtype=torch_dtype,
			
 
				-                    revision=revision,
			
 
				-                    token=token,
			
 
				-                    cache_dir=cache_dir,
			
 
				-                    max_disk_space=max_disk_space,
			
 
				-                )
			
 
				-                block = convert_block(
			
 
				-                    block,
			
 
				-                    block_index,
			
 
				-                    block_config,
			
 
				-                    tensor_parallel_devices,
			
 
				-                    device,
			
 
				-                    quant_type,
			
 
				-                    adapters=server_info.adapters,
			
 
				-                    freeze=True,
			
 
				-                    token=token,
			
 
				-                    cache_dir=cache_dir,
			
 
				-                    max_disk_space=max_disk_space,
			
 
				-                )
			
 
				                 blocks[module_uid] = TransformerBackend(
			
 
				                     module_uid,
			
 
				                     block,
			
--- a/src/petals/utils/convert_block.py
+++ b/src/petals/utils/convert_block.py
@@ -64,6 +64,8 @@ def convert_block(
 
				                 **kwargs,
			
 
				             )
			
 
				             add_adapter_to_block(block, block_index, adapter_name, adapter_config, adapter_state_dict)
			
 
				+    else:
			
 
				+        print("NO CONVERSION")
			
 
				 
			
 
				     return block