.. |
__init__.py
|
05faa0b3c8
add quantization script for cpu
|
vor 3 Jahren |
config.json
|
a798ea04a6
add minimalistic benchmarks
|
vor 3 Jahren |
convert_model.py
|
5695897620
fix imports
|
vor 3 Jahren |
deploy_server.sh
|
f055135b08
rm prefix
|
vor 3 Jahren |
inference_one_block.py
|
4695071ad2
WIP: make DistributedBloom compliant with HF interface
|
vor 3 Jahren |
local_server_config_example.cfg
|
f60a7dd183
deploy swarm on local & remote machines
|
vor 3 Jahren |
remote_server_config_example.cfg
|
f60a7dd183
deploy swarm on local & remote machines
|
vor 3 Jahren |
run_local_servers.sh
|
d969172208
set requires_grad=False, lm_layer -> h @ word_embeddings, rm lm_layer from comverted_model
|
vor 3 Jahren |
run_remote_servers.sh
|
f60a7dd183
deploy swarm on local & remote machines
|
vor 3 Jahren |
run_server.py
|
f73c655c82
Make throughput obligatory
|
vor 3 Jahren |