Max Ryabinin 2 роки тому
батько
коміт
0fc36c8eed
1 змінених файлів з 0 додано та 1 видалено
  1. 0 1
      hivemind/moe/server/layers/albert.py

+ 0 - 1
hivemind/moe/server/layers/albert.py

@@ -571,7 +571,6 @@ class HeadExpert(nn.Module):
 class StandardHeadExpert(HeadExpert):
     def __init__(self, hid_dim):
         super().__init__(hid_dim)
-        self.config.num_hidden_layers = 1
 
 
 body_sample_input = lambda batch_size, hid_dim: (torch.empty((batch_size, SEQUENCE_LENGTH, hid_dim)),)