justheuristic 1ab5fb1630 fetch a specific bloom block without downloading the entire model há 3 anos atrás
..
__init__.py 05faa0b3c8 add quantization script for cpu há 3 anos atrás
config.json a798ea04a6 add minimalistic benchmarks há 3 anos atrás
convert_model.py 6047a2ffe0 push config and tokenizer separately há 3 anos atrás
inference_one_block.py e8241d2915 black everything há 3 anos atrás
run_server.py 1ab5fb1630 fetch a specific bloom block without downloading the entire model há 3 anos atrás