Michael Diskin
|
cc8d39c2ea
Update readthedocs with hivemind.optim (#288)
|
4 ani în urmă |
Max Ryabinin
|
5233b6c085
Split hivemind.client into hivemind.averaging and hivemind.moe (#304)
|
4 ani în urmă |
justheuristic
|
0a0e290ea3
Add per-tensor compression, make all-reduce faster and more flexible (#272)
|
4 ani în urmă |
Max Ryabinin
|
62652e1717
Add Switch Transformers-like RemoteMixtureOfExperts (#228)
|
4 ani în urmă |
justheuristic
|
053c7c7d13
Disentangle DecentralizedAverager components, add weights (#217)
|
4 ani în urmă |
justheuristic
|
10917b259e
Averager: update group keys after every step, infer nbits dynamically (#141)
|
4 ani în urmă |
justheuristic
|
4edec82bb9
[Suggestions are welcome] Docs v0.8 (#86)
|
5 ani în urmă |
Max Ryabinin
|
35289c7005
tesseract -> hivemind
|
5 ani în urmă |
justheuristic
|
5016002186
remove dependency on run_and_await_k, rename GatingFunction to RemoteMixtureOfExperts
|
5 ani în urmă |
justheuristic
|
795bae239c
add docs in sphinx format: tesseract.runtime
|
5 ani în urmă |
justheuristic
|
e050714f56
add some docs for remoteexpert forward
|
5 ani în urmă |
justheuristic
|
57add150c4
raw html
|
5 ani în urmă |
justheuristic
|
23a1e80de9
indent
|
5 ani în urmă |
justheuristic
|
27b020627d
sphix doc style guide
|
5 ani în urmă |
justheuristic
|
70ed5dcb7f
numpy-style docstr
|
5 ani în urmă |