justheuristic 200fbecdbf Refactor MPFuture to use a single pipe/thread per process (#298) před 4 roky
..
layers 62652e1717 Add Switch Transformers-like RemoteMixtureOfExperts (#228) před 4 roky
__init__.py f0c5627139 Improve error handling, remove deprecated functionality (#261) před 4 roky
checkpoints.py 3024d381c5 Support learning rate schedulers in ExpertBackend (#196) před 4 roky
connection_handler.py 2328ba9262 Fix device in Switch-MoE, overhaul Server architecture (#256) před 4 roky
dht_handler.py f0c5627139 Improve error handling, remove deprecated functionality (#261) před 4 roky
expert_backend.py 2328ba9262 Fix device in Switch-MoE, overhaul Server architecture (#256) před 4 roky
expert_uid.py f0c5627139 Improve error handling, remove deprecated functionality (#261) před 4 roky
runtime.py 42b9b6cef8 Use logging in benchmarks, fix libp2p-related issues (#280) před 4 roky
task_pool.py 200fbecdbf Refactor MPFuture to use a single pipe/thread per process (#298) před 4 roky