Max Ryabinin 62652e1717 Add Switch Transformers-like RemoteMixtureOfExperts (#228) 4 tahun lalu
..
layers 62652e1717 Add Switch Transformers-like RemoteMixtureOfExperts (#228) 4 tahun lalu
__init__.py 62652e1717 Add Switch Transformers-like RemoteMixtureOfExperts (#228) 4 tahun lalu
checkpoints.py 3024d381c5 Support learning rate schedulers in ExpertBackend (#196) 4 tahun lalu
connection_handler.py 916c3db52d Move compression-related code to hivemind.utils.compression (#213) 4 tahun lalu
dht_handler.py f132294edb Extract expert-specific methods from DHT (#192) 4 tahun lalu
expert_backend.py ca5c7610ae Add tool for custom user experts (#189) 4 tahun lalu
expert_uid.py 3024d381c5 Support learning rate schedulers in ExpertBackend (#196) 4 tahun lalu
runtime.py 6128cbbd51 Add gradient clipping support to ExpertBackend (#214) 4 tahun lalu
task_pool.py 6f8f192150 Improve Runtime exception handling (#207) 4 tahun lalu