justheuristic 077ce58323 wip: implement grad wrt logits преди 5 години
..
__init__.py c58d08cc06 remove run_and_await_k completely, rename gating_function to moe преди 5 години
expert.py 6fb99c8746 wip: parallel fault-tolerant moe backward pass преди 5 години
moe.py 077ce58323 wip: implement grad wrt logits преди 5 години