Alexander Borzunov
|
82a97d6e9e
Fix beam search in GPU clients (#531)
|
1 an în urmă |
Alexander Borzunov
|
47d50e1e29
Improve default arguments for clients and servers (#530)
|
1 an în urmă |
Alexander Borzunov
|
dd4a3230bc
Add Falcon support (#499)
|
1 an în urmă |
Alexander Borzunov
|
26ebbfe8f0
Support macOS (#477)
|
2 ani în urmă |
Alexander Borzunov
|
de2475f31c
Make client compatible with transformers' GenerationMixin (#464)
|
2 ani în urmă |
Alexander Borzunov
|
8c546d988a
Test Llama, rebalancing, throughput eval, and all CLI scripts (#452)
|
2 ani în urmă |
justheuristic
|
5af04524dd
Split long sequences into chunks (#403)
|
2 ani în urmă |
Alexander Borzunov
|
eb0664b993
Support Python 3.11 (#393)
|
2 ani în urmă |
Alexander Borzunov
|
c735dd7ba3
Update transformers to 4.31.0 and peft to 0.4.0 (#371)
|
2 ani în urmă |
Artem Chumachenko
|
b9f0a5467f
Support peft LoRA adapters (#335)
|
2 ani în urmă |
Alexander Borzunov
|
cb3f018f9f
Add LLaMA support (#323)
|
2 ani în urmă |
Max Ryabinin
|
5c0733711a
Use number of tokens for attn_cache_size (#286)
|
2 ani în urmă |
Alexander Borzunov
|
74d8cda8c4
Add Python 3.10 to CI (#299)
|
2 ani în urmă |
Alexander Borzunov
|
a7d3d02194
Fix invalid author email in setup.cfg (#287)
|
2 ani în urmă |
justheuristic
|
c4938bc23e
Merge inference pools into one to increase inference speed (#225)
|
2 ani în urmă |
Alexander Borzunov
|
702bb5a2c2
CI: Update deprecated actions, don't measure network RPS (#215)
|
2 ani în urmă |
Alexander Borzunov
|
825f5dbf2d
CI: Convert model only when convert_model.py or setup.cfg change (#213)
|
2 ani în urmă |
Alexander Borzunov
|
5ff250bee9
Improve errors in case of missing blocks, suggest to join your own server (#212)
|
2 ani în urmă |
justheuristic
|
ae9e71fe8e
Add local tensor-parallel fwd/bwd (#143)
|
2 ani în urmă |
Max Ryabinin
|
a0e8bbd28d
Fix arguments in remove_old_models.py (#153)
|
2 ani în urmă |
justheuristic
|
a2066a4096
Optimize RemoteSequenceManager (#106)
|
2 ani în urmă |
Alexander Borzunov
|
7bd5916744
Make Petals a pip-installable package (attempt 2) (#102)
|
2 ani în urmă |
Alexander Borzunov
|
dc71574a63
Use public swarm by default (#92)
|
2 ani în urmă |
justheuristic
|
e92487e5d2
Update dependency versions (#71)
|
2 ani în urmă |
justheuristic
|
892d18fea7
Build cpuonly from bitsandbytes main (#70)
|
2 ani în urmă |
justheuristic
|
d271b75dd4
Let users specify sequence length instead of assuming 2048 (#52)
|
3 ani în urmă |
justheuristic
|
a2634001e9
Reduce vocabulary size in test model, fix bug in routing when overlapped (#45)
|
3 ani în urmă |
justheuristic
|
9460220a10
make pytest outputs more verbose (#44)
|
3 ani în urmă |
Dmitry Baranchuk
|
c4aa1f49df
Rename 350m -> 560m (#43)
|
3 ani în urmă |
Dmitry Baranchuk
|
11a424837f
integrate mixed-8bit model (#39)
|
3 ani în urmă |