Historique des commits

Auteur SHA1 Message Date
  justheuristic cbf1c42df1 unified prefix scheme il y a 5 ans
  justheuristic dfa9dfaae2 move to notes il y a 5 ans
  justheuristic 8931c56f73 move to notes il y a 5 ans
  justheuristic b20f3ee985 grad logits wrt actual logits il y a 5 ans
  justheuristic be3119b12e add basic moe correctness test il y a 5 ans
  justheuristic 662357fcb3 reweigh grads correctly il y a 5 ans
  justheuristic 153ab20232 change order of grads il y a 5 ans
  justheuristic 284250d00c change order of grads il y a 5 ans
  justheuristic c5ee3d6041 only return grad w.r.t. inputs il y a 5 ans
  justheuristic 05e7c92f3d unpack tuple il y a 5 ans
  justheuristic 5cbcf79b00 list -> tensor il y a 5 ans
  justheuristic c8889bde96 list -> tensor il y a 5 ans
  justheuristic 8030c075c9 use lists for gatehr il y a 5 ans
  justheuristic 49e4459ec8 do not .detach non-tensor parameters il y a 5 ans
  justheuristic 97c4003e5c enumerate il y a 5 ans
  justheuristic 60af3952c9 flag to remove optimizer il y a 5 ans
  justheuristic 9a4e306f39 flag to remove optimizer il y a 5 ans
  justheuristic 80ab75583f wip: parallel fault-tolerant moe backward pass il y a 5 ans
  justheuristic 2b2ddf8280 wip: parallel fault-tolerant moe backward pass il y a 5 ans
  justheuristic 6fb99c8746 wip: parallel fault-tolerant moe backward pass il y a 5 ans
  justheuristic ebe07eebfd typo il y a 5 ans
  justheuristic 88d1bdc025 unused imports il y a 5 ans
  justheuristic c58d08cc06 remove run_and_await_k completely, rename gating_function to moe il y a 5 ans
  justheuristic 4a33e155b6 remove run_and_await_k completely il y a 5 ans
  justheuristic 5016002186 remove dependency on run_and_await_k, rename GatingFunction to RemoteMixtureOfExperts il y a 5 ans
  justheuristic e71bb5428f change print time for network il y a 5 ans
  justheuristic ba1533b7bb add lifetime option for server and dht il y a 5 ans
  justheuristic 7c8d091633 deduplicate args il y a 5 ans
  justheuristic 7fe3b8d7a5 clarify network shutdown il y a 5 ans
  justheuristic 3ceb24d07d separate dht script il y a 5 ans