3 years ago · 8f34b92b68
--- a/src/server/server.py
+++ b/src/server/server.py
@@ -202,7 +202,6 @@ class Server(threading.Thread):
 
															             if load_in_8bit:
														
 
															                 dtype = block.input_layernorm.weight.dtype
														
 
															-                assert dtype == torch.float16, f"'load_in_8bit' does not support {dtype} for now"
														
 
															                 block = replace_8bit_linear(block)
														
 
															             block = block.to(device)