Историја ревизија

Аутор SHA1 Порука Датум
  justheuristic c005da2089 wip: implement grad wrt logits пре 5 година
  justheuristic 676066baed wip: implement grad wrt logits пре 5 година
  justheuristic 87b2f8b635 wip: implement grad wrt logits пре 5 година
  justheuristic 8931c56f73 move to notes пре 5 година
  justheuristic 662357fcb3 reweigh grads correctly пре 5 година
  justheuristic 153ab20232 change order of grads пре 5 година
  justheuristic 284250d00c change order of grads пре 5 година
  justheuristic c5ee3d6041 only return grad w.r.t. inputs пре 5 година
  justheuristic 05e7c92f3d unpack tuple пре 5 година
  justheuristic 5cbcf79b00 list -> tensor пре 5 година
  justheuristic c8889bde96 list -> tensor пре 5 година
  justheuristic 8030c075c9 use lists for gatehr пре 5 година
  justheuristic 60af3952c9 flag to remove optimizer пре 5 година
  justheuristic 80ab75583f wip: parallel fault-tolerant moe backward pass пре 5 година
  justheuristic 2b2ddf8280 wip: parallel fault-tolerant moe backward pass пре 5 година
  justheuristic 6fb99c8746 wip: parallel fault-tolerant moe backward pass пре 5 година
  justheuristic c58d08cc06 remove run_and_await_k completely, rename gating_function to moe пре 5 година