AIForce/petals

نویسنده	SHA1 پیام	تاریخ
artek0chumak	1e227240e5 select adapter by name in handler.py	2 سال پیش
artek0chumak	e452df25cc Add skeleton for peft init	2 سال پیش
artek0chumak	da204f1285 Add loading into device directly	2 سال پیش
artek0chumak	92612aebed style	2 سال پیش
artek0chumak	ddd770000b Add layer specific loading	2 سال پیش
artek0chumak	c02ae4c9ba Fix long downloading	2 سال پیش
artek0chumak	9ea77b0911 Safer way to download pefts	2 سال پیش
artek0chumak	6563bf1750 Add first functional code	2 سال پیش
artek0chumak	02e1c95415 Add possible tests	2 سال پیش
Alexander Borzunov	b28f5016ea Delete deprecated petals.cli scripts (#336)	2 سال پیش
Alexander Borzunov	fa095f6461 Use 4-bit for llama by default, use bitsandbytes 0.40.0.post3 (#340)	2 سال پیش
Alexander Borzunov	158013a671 Implement direct server-to-server communication (#331)	2 سال پیش
Alexander Borzunov	4d9c26fe5c Allow free_disk_space_for() remove arbitrary files from Petals cache (#339)	2 سال پیش
Alexander Borzunov	de930918a0 Support loading blocks in 4-bit (QLoRA NF4 format, disabled by default) (#333)	2 سال پیش
Alexander Borzunov	66a47c763e Require pydantic < 2.0 (2.0 is incompatible with hivemind 1.1.8) (#337)	2 سال پیش
Alexander Borzunov	10c72acdf4 Fix warmup steps and minor issues in benchmarks (#334)	2 سال پیش
Alexander Borzunov	d126ee3053 Add benchmark scripts (#319)	2 سال پیش
Alexander Borzunov	fecee8c4dc Show license links when loading models (#332)	2 سال پیش
Alexander Borzunov	47a2b1ee65 Fix llama's lm_head.weight.requires_grad (#330)	2 سال پیش
Alexander Borzunov	7a37513f77 Add AutoDistributed{Model, ModelForCausalLM, ModelForSequenceClassification} (#329)	2 سال پیش
Alexander Borzunov	cb3f018f9f Add LLaMA support (#323)	2 سال پیش
Max Ryabinin	5c0733711a Use number of tokens for attn_cache_size (#286)	2 سال پیش
Max Ryabinin	c839173e57 Determine block dtype in a unified manner (#325)	2 سال پیش
Max Ryabinin	3e7ae5116d Remove unused imports and attributes (#324)	2 سال پیش
Alexander Borzunov	675bacb592 Bump version to 1.1.5 (#312)	2 سال پیش
Alexander Borzunov	e026952338 Abort speedtest if it runs too long (#316)	2 سال پیش
Alexander Borzunov	6eb306a605 Raise error for unexpected .generate() kwargs (#315)	2 سال پیش
Alexander Borzunov	d9e7bfc949 Divide compute throughput by average no. of used blocks (#314)	2 سال پیش
Alexander Borzunov	6137b1b4b0 Replace .make_sequence(..., mode="random") with mode="max_throughput" (#313)	2 سال پیش
Alexander Borzunov	0a313bf6c5 Update hivemind to 1.1.8, enable efficient bfloat16 encoding (#311)	2 سال پیش

جدیدتر قدیمی‌تر

تاریخچه Commit ها یافتن

تاریخچه Commit ها