作者 | SHA1 备注 | 提交日期 |
---|---|---|
|
5233b6c085 Split hivemind.client into hivemind.averaging and hivemind.moe (#304) | 4 年之前 |
|
6128cbbd51 Add gradient clipping support to ExpertBackend (#214) | 4 年之前 |
|
3024d381c5 Support learning rate schedulers in ExpertBackend (#196) | 4 年之前 |