Max Ryabinin 62652e1717 Add Switch Transformers-like RemoteMixtureOfExperts (#228) vor 4 Jahren
..
test_utils 70dadfb8b5 Start the server with a terminal command, fix default config.yml (#108) vor 5 Jahren
benchmark_averaging.py 10917b259e Averager: update group keys after every step, infer nbits dynamically (#141) vor 4 Jahren
benchmark_dht.py f132294edb Extract expert-specific methods from DHT (#192) vor 4 Jahren
benchmark_tensor_compression.py 916c3db52d Move compression-related code to hivemind.utils.compression (#213) vor 4 Jahren
benchmark_throughput.py 3024d381c5 Support learning rate schedulers in ExpertBackend (#196) vor 4 Jahren
custom_networks.py 62652e1717 Add Switch Transformers-like RemoteMixtureOfExperts (#228) vor 4 Jahren
test_averaging.py 8c3bd93e87 Statistics averaging (#229) vor 4 Jahren
test_custom_expert.py 62652e1717 Add Switch Transformers-like RemoteMixtureOfExperts (#228) vor 4 Jahren
test_dht.py f132294edb Extract expert-specific methods from DHT (#192) vor 4 Jahren
test_dht_crypto.py 1deab01c71 Add RSA signature protection for DHT records (#187) vor 4 Jahren
test_dht_experts.py 62652e1717 Add Switch Transformers-like RemoteMixtureOfExperts (#228) vor 4 Jahren
test_dht_node.py 1deab01c71 Add RSA signature protection for DHT records (#187) vor 4 Jahren
test_dht_storage.py 1754792aad Process-wide channel cache for gRPC+aio (#120) vor 4 Jahren
test_expert_backend.py 6128cbbd51 Add gradient clipping support to ExpertBackend (#214) vor 4 Jahren
test_moe.py 62652e1717 Add Switch Transformers-like RemoteMixtureOfExperts (#228) vor 4 Jahren
test_routing.py 06162992fa Serialize DHTID source with msgpack (#172) vor 4 Jahren
test_training.py 62652e1717 Add Switch Transformers-like RemoteMixtureOfExperts (#228) vor 4 Jahren
test_util_modules.py 0080028e25 Add uniform compression (#202) vor 4 Jahren