5 lat temu · 8905ced068
--- a/hivemind/server/__init__.py
+++ b/hivemind/server/__init__.py
@@ -1,8 +1,12 @@
 
				 import multiprocessing as mp
			
 
				 import multiprocessing.synchronize
			
 
				 import threading
			
 
				-from typing import Dict, Optional
			
 
				+from contextlib import contextmanager
			
 
				 
			
 
				+import torch
			
 
				+from typing import Dict, Optional, Tuple
			
 
				+
			
 
				+import hivemind
			
 
				 from hivemind.dht import DHT
			
 
				 from hivemind.server.runtime import Runtime
			
 
				 from hivemind.server.task_pool import Task, TaskPool, TaskPoolBase
			
@@ -10,6 +14,7 @@ from hivemind.server.expert_backend import ExpertBackend
 
				 from hivemind.server.checkpoint_saver import CheckpointSaver
			
 
				 from hivemind.server.connection_handler import ConnectionHandler
			
 
				 from hivemind.server.dht_handler import DHTHandlerThread
			
 
				+from hivemind.server.layers import name_to_block, name_to_input
			
 
				 from hivemind.utils import Endpoint, get_port, replace_port, find_open_port, get_logger
			
 
				 
			
 
				 logger = get_logger(__name__)
			
@@ -56,6 +61,82 @@ class Server(threading.Thread):
 
				         if start:
			
 
				             self.run_in_background(await_ready=True)
			
 
				 
			
 
				+    @staticmethod
			
 
				+    def create(listen_on='0.0.0.0:*', num_experts=None, expert_uids=None, expert_cls='ffn', hidden_dim=1024,
			
 
				+               num_handlers=None, expert_prefix='expert', expert_offset=0, max_batch_size=16384, device=None,
			
 
				+               no_optimizer=False, no_dht=False, initial_peers=(), dht_port=None, verbose=True,
			
 
				+               start=False, **kwargs):  # removed type specification (-> Server)
			
 
				+        """
			
 
				+        Instantiate a server with several identical experts. See argparse comments below for details
			
 
				+        :param listen_on: network interface with address and (optional) port, e.g. "127.0.0.1:1337" or "[::]:80"
			
 
				+        :param num_experts: run this many identical experts
			
 
				+        :param expert_prefix: all expert uids will be {expert_prefix}.{index}
			
 
				+        :param expert_offset: expert uid will use indices in range(expert_offset, expert_offset + num_experts)
			
 
				+        :param expert_uids: spawn experts with these exact uids, overrides num_experts, expert_prefix and expert_offset
			
 
				+        :param expert_cls: expert type from test_utils.layers, e.g. 'ffn', 'transformer', 'det_dropout' or 'nop';
			
 
				+        :param hidden_dim: main dimension for expert_cls
			
 
				+        :param num_handlers: server will use this many parallel processes to handle incoming requests
			
 
				+        :param max_batch_size: total num examples in the same batch will not exceed this value
			
 
				+        :param device: all experts will use this device in torch notation; default: cuda if available else cpu
			
 
				+        :param no_optimizer: if specified, all optimizers use learning rate=0
			
 
				+        :param no_dht: if specified, the server will not be attached to a dht
			
 
				+        :param initial_peers: a list of peers that will introduce this node to the dht,
			
 
				+        e.g. ('123.11.22.33:1337', '[fe80::abe2:db1c:be7d:5a85]:4567'), default = no peers
			
 
				+        :param dht_port:  DHT node will listen on this port, default = find open port
			
 
				+        You can then use this node as initial peer for subsequent servers.
			
 
				+        :param verbose: whether to print server started / finished / terminated events
			
 
				+        :param start: if True, starts server right away and returns when server is ready for requests
			
 
				+        """
			
 
				+        assert (expert_uids is None) != (num_experts is None and expert_prefix == 'expert' and expert_offset == 0), \
			
 
				+            "Please provide either expert uids *or* (num_experts, expert_prefix and expert_offset), not both"
			
 
				+        if verbose and len(kwargs) != 0:
			
 
				+            print("Ignored kwargs:", kwargs)
			
 
				+        assert expert_cls in name_to_block
			
 
				+        num_handlers = num_handlers if num_handlers is not None else num_experts * 8
			
 
				+        device = device or ('cuda' if torch.cuda.is_available() else 'cpu')
			
 
				+
			
 
				+        # initialize dht
			
 
				+        dht = None
			
 
				+        if not no_dht:
			
 
				+            logger.info("Bootstrapping DHT node, initial peers =", initial_peers)
			
 
				+            dht = hivemind.DHT(initial_peers=initial_peers, start=True,
			
 
				+                               listen_on=f"{hivemind.LOCALHOST}:{dht_port or hivemind.find_open_port()}")
			
 
				+            if verbose:
			
 
				+                logger.info(f"Running dht node on port {dht.port}")
			
 
				+
			
 
				+        sample_input = name_to_input[expert_cls](4, hidden_dim)
			
 
				+        if isinstance(sample_input, tuple):
			
 
				+            args_schema = tuple(hivemind.BatchTensorDescriptor.from_tensor(arg) for arg in sample_input)
			
 
				+        else:
			
 
				+            args_schema = (hivemind.BatchTensorDescriptor.from_tensor(sample_input),)
			
 
				+
			
 
				+        # initialize experts
			
 
				+        if expert_uids is None:
			
 
				+            num_experts = num_experts if num_experts is not None else 1
			
 
				+            expert_uids = [f'{expert_prefix}{hivemind.DHT.UID_DELIMITER}{i + expert_offset}'
			
 
				+                           for i in range(num_experts)]
			
 
				+
			
 
				+        experts = {}
			
 
				+        for expert_uid in expert_uids:
			
 
				+            expert = name_to_block[expert_cls](hidden_dim)
			
 
				+            opt = torch.optim.SGD(expert.parameters(), 0.0 if no_optimizer else 0.05)
			
 
				+            experts[expert_uid] = hivemind.ExpertBackend(name=expert_uid, expert=expert, opt=opt,
			
 
				+                                                         args_schema=args_schema,
			
 
				+                                                         outputs_schema=hivemind.BatchTensorDescriptor(hidden_dim),
			
 
				+                                                         max_batch_size=max_batch_size,
			
 
				+                                                         )
			
 
				+        # actually start server
			
 
				+        server = Server(
			
 
				+            dht, experts, listen_on=listen_on,
			
 
				+            num_connection_handlers=num_handlers, device=device)
			
 
				+
			
 
				+        if start:
			
 
				+            server.run_in_background(await_ready=True)
			
 
				+            if verbose:
			
 
				+                logger.info(f"Server started at {server.listen_on}")
			
 
				+                logger.info(f"Got {len(experts)} active experts of type {expert_cls}: {list(experts.keys())}")
			
 
				+        return server
			
 
				+
			
 
				     def run(self):
			
 
				         """
			
 
				         Starts Server in the current thread. Initializes dht if necessary, starts connection handlers,
			
@@ -126,3 +207,42 @@ class Server(threading.Thread):
 
				             self.dht.join()
			
 
				 
			
 
				         self.runtime.shutdown()
			
 
				+
			
 
				+
			
 
				+@contextmanager
			
 
				+def background_server(*args, shutdown_timeout=5, verbose=True, **kwargs) -> Tuple[hivemind.Endpoint, hivemind.Endpoint]:
			
 
				+    """ A context manager that creates server in a background thread, awaits .ready on entry and shutdowns on exit """
			
 
				+    pipe, runners_pipe = mp.Pipe(duplex=True)
			
 
				+    runner = mp.get_context("spawn").Process(
			
 
				+        target=_server_runner, args=(runners_pipe, *args), kwargs=dict(verbose=verbose, **kwargs))
			
 
				+
			
 
				+    try:
			
 
				+        runner.start()
			
 
				+        yield pipe.recv()  # once the server is ready, runner will send us a tuple(hostname, port, dht port)
			
 
				+        pipe.send('SHUTDOWN')  # on exit from context, send shutdown signal
			
 
				+    finally:
			
 
				+        runner.join(timeout=shutdown_timeout)
			
 
				+        if runner.is_alive():
			
 
				+            if verbose:
			
 
				+                logger.info("Server failed to shutdown gracefully, terminating it the hard way...")
			
 
				+            runner.kill()
			
 
				+            if verbose:
			
 
				+                logger.info("Server terminated.")
			
 
				+
			
 
				+
			
 
				+def _server_runner(pipe, *args, verbose, **kwargs):
			
 
				+    server = Server.create(*args, verbose=verbose, start=True, **kwargs)
			
 
				+    try:
			
 
				+        if server.dht is not None:
			
 
				+            dht_listen_on = hivemind.replace_port(server.dht.listen_on, server.dht.port)
			
 
				+        else:
			
 
				+            dht_listen_on = None
			
 
				+        pipe.send((server.listen_on, dht_listen_on))
			
 
				+        pipe.recv()  # wait for shutdown signal
			
 
				+    finally:
			
 
				+        if verbose:
			
 
				+            logger.info("Shutting down server...")
			
 
				+        server.shutdown()
			
 
				+        server.join()
			
 
				+        if verbose:
			
 
				+            logger.info("Server shut down successfully.")
			
--- a/hivemind/server/layers/__init__.py
+++ b/hivemind/server/layers/__init__.py
@@ -1,7 +1,7 @@
 
				 import torch
			
 
				 import torch.nn as nn
			
 
				 
			
 
				-from hivemind.utils.custom_layers import DeterministicDropout
			
 
				+from hivemind.server.layers.dropout import DeterministicDropout
			
 
				 
			
 
				 
			
 
				 class FeedforwardBlock(nn.Module):
			
--- a/hivemind/server/layers/dropout.py
+++ b/hivemind/server/layers/dropout.py
--- a/requirements.txt
+++ b/requirements.txt
@@ -5,4 +5,5 @@ prefetch_generator>=1.0.1
 
				 umsgpack
			
 
				 uvloop>=0.14.0
			
 
				 grpcio>=1.31
			
 
				-grpcio-tools>=1.30.0
			
 
				+grpcio-tools>=1.30.0
			
 
				+configargparse>=1.2.3
			
--- a/scripts/config.yml
+++ b/scripts/config.yml
@@ -0,0 +1,15 @@
 
				+listen_on: 0.0.0.0:* #'localhost' for local connections only, '0.0.0.0' for ipv4 '::' for ipv6
			
 
				+num_experts: 1 #run this many identical experts
			
 
				+expert_cls: ffn #expert type from test_utils.layers, e.g. 'ffn', 'transformer', 'det_dropout' or 'nop'.
			
 
				+hidden_dim: 1024 #main dimension for expert_cls
			
 
				+#num_handlers:  #'server will use this many processes to handle incoming requests
			
 
				+expert_prefix: expert #all expert uids will be {expert_prefix}.{index}
			
 
				+expert_offset: 0 #expert uid will use indices in range(expert_offset, expert_offset + num_experts)
			
 
				+max_batch_size: 16384 #total num examples in the same batch will not exceed this value
			
 
				+#device:  #all experts will use this device in torch notation; default: cuda if available else cpu
			
 
				+no_optimizer: True #if specified, all optimizers use learning rate=0
			
 
				+no_dht: True #if specified, the server will not be attached to a dht
			
 
				+initial_peers: "[]" #a list of peers that will introduce this node to the dht, e.g. [("1.2.3.4", 1337), ("127.0.0.1", 4321)]
			
 
				+#dht_port:  #DHT node will listen on this port
			
 
				+#root_port:  #If this server does not have peers, it will create a virtual dht node on this port. You can then use this node as initial peer.
			
 
				+increase_file_limit: True #On *nix, this will increase the max number of processes a server can spawn before hitting "Too many open files"; Use at your own risk.
			
--- a/scripts/run_server.py
+++ b/scripts/run_server.py
@@ -0,0 +1,52 @@
 
				+from typing import Optional
			
 
				+import configargparse
			
 
				+import resource
			
 
				+from hivemind.server import Server
			
 
				+
			
 
				+if __name__ == '__main__':
			
 
				+    # fmt:off
			
 
				+    parser = configargparse.ArgParser(default_config_files=["config.yml"])
			
 
				+    parser.add('-c', '--my-config', required=False, is_config_file=True, help='config file path')
			
 
				+    parser.add_argument('--listen_on', type=str, default='0.0.0.0:*', required=False,
			
 
				+                        help="'localhost' for local connections only, '0.0.0.0' for ipv4 '::' for ipv6")
			
 
				+    parser.add_argument('--num_experts', type=int, default=1, required=False, help="run this many identical experts")
			
 
				+    parser.add_argument('--expert_cls', type=str, default='ffn', required=False,
			
 
				+                        help="expert type from test_utils.layers, e.g. 'ffn', 'transformer', 'det_dropout' or 'nop'.")
			
 
				+    parser.add_argument('--hidden_dim', type=int, default=1024, required=False, help='main dimension for expert_cls')
			
 
				+    parser.add_argument('--num_handlers', type=int, default=None, required=False,
			
 
				+                        help='server will use this many processes to handle incoming requests')
			
 
				+    parser.add_argument('--expert_prefix', type=str, default='expert', required=False,
			
 
				+                        help='all expert uids will be {expert_prefix}.{index}')
			
 
				+    parser.add_argument('--expert_offset', type=int, default=0, required=False,
			
 
				+                        help='expert uid will use indices in range(expert_offset, expert_offset + num_experts)')
			
 
				+    parser.add_argument('--max_batch_size', type=int, default=16384, required=False,
			
 
				+                        help='total num examples in the same batch will not exceed this value')
			
 
				+    parser.add_argument('--device', type=str, default=None, required=False,
			
 
				+                        help='all experts will use this device in torch notation; default: cuda if available else cpu')
			
 
				+    parser.add_argument('--no_optimizer', action='store_true', help='if specified, all optimizers use learning rate=0')
			
 
				+    parser.add_argument('--no_dht', action='store_true', help='if specified, the server will not be attached to a dht')
			
 
				+    parser.add_argument('--initial_peers', type=str, default="[]", required=False, help='a list of peers that will'
			
 
				+                        ' introduce this node to the dht, e.g. [("1.2.3.4", 1337), ("127.0.0.1", 4321)]')
			
 
				+    parser.add_argument('--dht_port', type=int, default=None, required=False, help='DHT node will listen on this port')
			
 
				+    parser.add_argument('--root_port', type=int, default=None, required=False, help='If this server does not have peers'
			
 
				+                        ', it will create a virtual dht node on this port. You can then use this node as initial peer.')
			
 
				+    parser.add_argument('--increase_file_limit', action='store_true', help='On *nix, this will increase the max number'
			
 
				+                        ' of processes a server can spawn before hitting "Too many open files"; Use at your own risk.')
			
 
				+    # fmt:on
			
 
				+    args = vars(parser.parse_args())
			
 
				+
			
 
				+    if args.pop('increase_file_limit'):
			
 
				+        soft, hard = resource.getrlimit(resource.RLIMIT_NOFILE)
			
 
				+        try:
			
 
				+            print("Setting open file limit to soft={}, hard={}".format(max(soft, 2 ** 15), max(hard, 2 ** 15)))
			
 
				+            resource.setrlimit(resource.RLIMIT_NOFILE, (max(soft, 2 ** 15), max(hard, 2 ** 15)))
			
 
				+        except:
			
 
				+            print("Could not increase open file limit, currently at soft={}, hard={}".format(soft, hard))
			
 
				+
			
 
				+    args['initial_peers'] = eval(args['initial_peers'])
			
 
				+
			
 
				+    try:
			
 
				+        server = Server.create(**args, start=True, verbose=True)
			
 
				+        server.join()
			
 
				+    finally:
			
 
				+        server.shutdown()
			
--- a/tests/benchmark_throughput.py
+++ b/tests/benchmark_throughput.py
@@ -5,7 +5,8 @@ import sys
 
				 import time
			
 
				 
			
 
				 import torch
			
 
				-from test_utils import layers, print_device_info, increase_file_limit
			
 
				+from hivemind.server import layers
			
 
				+from test_utils import print_device_info, increase_file_limit
			
 
				 
			
 
				 import hivemind
			
 
				 from hivemind import find_open_port
			
--- a/tests/test_moe.py
+++ b/tests/test_moe.py
@@ -6,7 +6,7 @@ import pytest
 
				 import torch
			
 
				 import hivemind
			
 
				 from hivemind.client.expert import DUMMY
			
 
				-from test_utils.run_server import background_server
			
 
				+from hivemind import background_server
			
 
				 
			
 
				 
			
 
				 def test_moe():
			
--- a/tests/test_training.py
+++ b/tests/test_training.py
@@ -4,9 +4,8 @@ import torch
 
				 import torch.nn as nn
			
 
				 import torch.nn.functional as F
			
 
				 from sklearn.datasets import load_digits
			
 
				-from test_utils.run_server import background_server
			
 
				 
			
 
				-from hivemind import RemoteExpert
			
 
				+from hivemind import RemoteExpert, background_server
			
 
				 
			
 
				 
			
 
				 def test_training(port: Optional[int] = None, max_steps: int = 100, threshold: float = 0.9):
			
--- a/tests/test_utils/run_server.py
+++ b/tests/test_utils/run_server.py
@@ -1,188 +0,0 @@
 
				-import argparse
			
 
				-import multiprocessing as mp
			
 
				-from contextlib import contextmanager
			
 
				-
			
 
				-import resource
			
 
				-from typing import Tuple
			
 
				-
			
 
				-import torch
			
 
				-
			
 
				-import hivemind
			
 
				-from test_utils.layers import name_to_block, name_to_input
			
 
				-
			
 
				-logger = hivemind.get_logger(__name__)
			
 
				-
			
 
				-
			
 
				-def make_dummy_server(listen_on='0.0.0.0:*', num_experts=None, expert_uids=None, expert_cls='ffn', hidden_dim=1024,
			
 
				-                      num_handlers=None, expert_prefix='expert', expert_offset=0, max_batch_size=16384, device=None,
			
 
				-                      no_optimizer=False, no_dht=False, initial_peers=(), dht_port=None, root_port=None, verbose=True,
			
 
				-                      start=False, **kwargs) -> hivemind.Server:
			
 
				-    """
			
 
				-    Instantiate a server with several identical experts. See argparse comments below for details
			
 
				-    :param listen_on: network interface with address and (optional) port, e.g. "127.0.0.1:1337" or "[::]:80"
			
 
				-    :param num_experts: run this many identical experts
			
 
				-    :param expert_prefix: all expert uids will be {expert_prefix}.{index}
			
 
				-    :param expert_offset: expert uid will use indices in range(expert_offset, expert_offset + num_experts)
			
 
				-    :param expert_uids: spawn experts with these exact uids, overrides num_experts, expert_prefix and expert_offset
			
 
				-    :param expert_cls: expert type from test_utils.layers, e.g. 'ffn', 'transformer', 'det_dropout' or 'nop';
			
 
				-    :param hidden_dim: main dimension for expert_cls
			
 
				-    :param num_handlers: server will use this many parallel processes to handle incoming requests
			
 
				-    :param max_batch_size: total num examples in the same batch will not exceed this value
			
 
				-    :param device: all experts will use this device in torch notation; default: cuda if available else cpu
			
 
				-    :param no_optimizer: if specified, all optimizers use learning rate=0
			
 
				-    :param no_dht: if specified, the server will not be attached to a dht
			
 
				-    :param initial_peers: a list of peers that will introduce this node to the dht,
			
 
				-      e.g. [("1.2.3.4", 1337), ("127.0.0.1", 4321)]'), default = no peers
			
 
				-    :param dht_port:  DHT node will listen on this port, default = find open port
			
 
				-    :param root_port: if this server does not have initial_peers, it will create a virtual dht node on this port.
			
 
				-        You can then use this node as initial peer for subsequent servers.
			
 
				-    :param verbose: whether to print server started / finished / terminated events
			
 
				-    :param start: if True, starts server right away and returns when server is ready for requests
			
 
				-    """
			
 
				-    assert (expert_uids is None) != (num_experts is None and expert_prefix == 'expert' and expert_offset == 0), \
			
 
				-        "Please provide either expert uids *or* (num_experts, expert_prefix and expert_offset), not both"
			
 
				-    if verbose and len(kwargs) != 0:
			
 
				-        print("Ignored kwargs:", kwargs)
			
 
				-    assert expert_cls in name_to_block
			
 
				-    num_handlers = num_handlers if num_handlers is not None else num_experts * 8
			
 
				-    device = device or ('cuda' if torch.cuda.is_available() else 'cpu')
			
 
				-
			
 
				-    # initialize dht
			
 
				-    dht = None
			
 
				-    if not no_dht:
			
 
				-        if not len(initial_peers):
			
 
				-            logger.info("No initial peers provided. Starting additional dht as an initial peer.")
			
 
				-            dht_root = hivemind.DHT(initial_peers=initial_peers, start=True,
			
 
				-                                    listen_on=f"{hivemind.LOCALHOST}:{root_port or hivemind.find_open_port()}")
			
 
				-            logger.info(f"Initializing DHT with port {dht_root.port}")
			
 
				-            initial_peers = [f"{hivemind.LOCALHOST}:{dht_root.port}"]
			
 
				-        else:
			
 
				-            logger.info("Bootstrapping dht with peers:", initial_peers)
			
 
				-            if root_port is not None:
			
 
				-                logger.info(f"Warning: root_port={root_port} will not be used since we already have peers.")
			
 
				-
			
 
				-        dht = hivemind.DHT(initial_peers=initial_peers, start=True,
			
 
				-                           listen_on=f"{hivemind.LOCALHOST}:{dht_port or hivemind.find_open_port()}")
			
 
				-        if verbose:
			
 
				-            logger.info(f"Running dht node on port {dht.port}")
			
 
				-
			
 
				-    sample_input = name_to_input[expert_cls](4, hidden_dim)
			
 
				-    if isinstance(sample_input, tuple):
			
 
				-        args_schema = tuple(hivemind.BatchTensorDescriptor.from_tensor(arg) for arg in sample_input)
			
 
				-    else:
			
 
				-        args_schema = (hivemind.BatchTensorDescriptor.from_tensor(sample_input),)
			
 
				-
			
 
				-    # initialize experts
			
 
				-    if expert_uids is None:
			
 
				-        num_experts = num_experts if num_experts is not None else 1
			
 
				-        expert_uids = [f'{expert_prefix}{hivemind.DHT.UID_DELIMITER}{i + expert_offset}'
			
 
				-                       for i in range(num_experts)]
			
 
				-
			
 
				-    experts = {}
			
 
				-    for expert_uid in expert_uids:
			
 
				-        expert = name_to_block[expert_cls](hidden_dim)
			
 
				-        opt = torch.optim.SGD(expert.parameters(), 0.0 if no_optimizer else 0.05)
			
 
				-        experts[expert_uid] = hivemind.ExpertBackend(name=expert_uid, expert=expert, opt=opt,
			
 
				-                                                     args_schema=args_schema,
			
 
				-                                                     outputs_schema=hivemind.BatchTensorDescriptor(hidden_dim),
			
 
				-                                                     max_batch_size=max_batch_size,
			
 
				-                                                     )
			
 
				-    # actually start server
			
 
				-    server = hivemind.Server(
			
 
				-        dht, experts, listen_on=listen_on,
			
 
				-        num_connection_handlers=num_handlers, device=device)
			
 
				-
			
 
				-    if start:
			
 
				-        server.run_in_background(await_ready=True)
			
 
				-        if verbose:
			
 
				-            logger.info(f"Server started at {server.listen_on}")
			
 
				-            logger.info(f"Got {len(experts)} active experts of type {expert_cls}: {list(experts.keys())}")
			
 
				-    return server
			
 
				-
			
 
				-
			
 
				-@contextmanager
			
 
				-def background_server(*args, shutdown_timeout=5, verbose=True, **kwargs) -> Tuple[hivemind.Endpoint, hivemind.Endpoint]:
			
 
				-    """ A context manager that creates server in a background thread, awaits .ready on entry and shutdowns on exit """
			
 
				-    pipe, runners_pipe = mp.Pipe(duplex=True)
			
 
				-    runner = mp.get_context("spawn").Process(
			
 
				-        target=_server_runner, args=(runners_pipe, *args), kwargs=dict(verbose=verbose, **kwargs))
			
 
				-
			
 
				-    try:
			
 
				-        runner.start()
			
 
				-        yield pipe.recv()  # once the server is ready, runner will send us a tuple(hostname, port, dht port)
			
 
				-        pipe.send('SHUTDOWN')  # on exit from context, send shutdown signal
			
 
				-    finally:
			
 
				-        runner.join(timeout=shutdown_timeout)
			
 
				-        if runner.is_alive():
			
 
				-            if verbose:
			
 
				-                logger.info("Server failed to shutdown gracefully, terminating it the hard way...")
			
 
				-            runner.kill()
			
 
				-            if verbose:
			
 
				-                logger.info("Server terminated.")
			
 
				-
			
 
				-
			
 
				-def _server_runner(pipe, *args, verbose, **kwargs):
			
 
				-    server = make_dummy_server(*args, verbose=verbose, start=True, **kwargs)
			
 
				-    try:
			
 
				-        if server.dht is not None:
			
 
				-            dht_listen_on = hivemind.replace_port(server.dht.listen_on, server.dht.port)
			
 
				-        else:
			
 
				-            dht_listen_on = None
			
 
				-        pipe.send((server.listen_on, dht_listen_on))
			
 
				-        pipe.recv()  # wait for shutdown signal
			
 
				-    finally:
			
 
				-        if verbose:
			
 
				-            logger.info("Shutting down server...")
			
 
				-        server.shutdown()
			
 
				-        server.join()
			
 
				-        if verbose:
			
 
				-            logger.info("Server shut down successfully.")
			
 
				-
			
 
				-
			
 
				-if __name__ == '__main__':
			
 
				-    # fmt:off
			
 
				-    parser = argparse.ArgumentParser()
			
 
				-    parser.add_argument('--listen_on', type=str, default='0.0.0.0:*', required=False,
			
 
				-                        help="'localhost' for local connections only, '0.0.0.0' for ipv4 '::' for ipv6")
			
 
				-    parser.add_argument('--num_experts', type=int, default=1, required=False, help="run this many identical experts")
			
 
				-    parser.add_argument('--expert_cls', type=str, default='ffn', required=False,
			
 
				-                        help="expert type from test_utils.layers, e.g. 'ffn', 'transformer', 'det_dropout' or 'nop'.")
			
 
				-    parser.add_argument('--hidden_dim', type=int, default=1024, required=False, help='main dimension for expert_cls')
			
 
				-    parser.add_argument('--num_handlers', type=int, default=None, required=False,
			
 
				-                        help='server will use this many processes to handle incoming requests')
			
 
				-    parser.add_argument('--expert_prefix', type=str, default='expert', required=False,
			
 
				-                        help='all expert uids will be {expert_prefix}.{index}')
			
 
				-    parser.add_argument('--expert_offset', type=int, default=0, required=False,
			
 
				-                        help='expert uid will use indices in range(expert_offset, expert_offset + num_experts)')
			
 
				-    parser.add_argument('--max_batch_size', type=int, default=16384, required=False,
			
 
				-                        help='total num examples in the same batch will not exceed this value')
			
 
				-    parser.add_argument('--device', type=str, default=None, required=False,
			
 
				-                        help='all experts will use this device in torch notation; default: cuda if available else cpu')
			
 
				-    parser.add_argument('--no_optimizer', action='store_true', help='if specified, all optimizers use learning rate=0')
			
 
				-    parser.add_argument('--no_dht', action='store_true', help='if specified, the server will not be attached to a dht')
			
 
				-    parser.add_argument('--initial_peers', type=str, default="[]", required=False, help='a list of peers that will'
			
 
				-                        ' introduce this node to the dht, e.g. [("1.2.3.4", 1337), ("127.0.0.1", 4321)]')
			
 
				-    parser.add_argument('--dht_port', type=int, default=None, required=False, help='DHT node will listen on this port')
			
 
				-    parser.add_argument('--root_port', type=int, default=None, required=False, help='If this server does not have peers'
			
 
				-                        ', it will create a virtual dht node on this port. You can then use this node as initial peer.')
			
 
				-    parser.add_argument('--increase_file_limit', action='store_true', help='On *nix, this will increase the max number'
			
 
				-                        ' of processes a server can spawn before hitting "Too many open files"; Use at your own risk.')
			
 
				-    # fmt:on
			
 
				-
			
 
				-    args = vars(parser.parse_args())
			
 
				-
			
 
				-    if args.pop('increase_file_limit'):
			
 
				-        soft, hard = resource.getrlimit(resource.RLIMIT_NOFILE)
			
 
				-        try:
			
 
				-            print("Setting open file limit to soft={}, hard={}".format(max(soft, 2 ** 15), max(hard, 2 ** 15)))
			
 
				-            resource.setrlimit(resource.RLIMIT_NOFILE, (max(soft, 2 ** 15), max(hard, 2 ** 15)))
			
 
				-        except:
			
 
				-            print("Could not increase open file limit, currently at soft={}, hard={}".format(soft, hard))
			
 
				-
			
 
				-    args['initial_peers'] = eval(args['initial_peers'])
			
 
				-
			
 
				-    try:
			
 
				-        server = make_dummy_server(**args, start=True, verbose=True)
			
 
				-        server.join()
			
 
				-    finally:
			
 
				-        server.shutdown()