Historie revizí

Autor SHA1 Zpráva Datum
  justheuristic 9a8320c106 pep8 před 5 roky
  justheuristic aa0743c587 pep8 před 5 roky
  justheuristic 6605b00d05 safer shutdown order před 5 roky
  justheuristic f9798a474a unified prefix scheme před 5 roky
  justheuristic cbf1c42df1 unified prefix scheme před 5 roky
  justheuristic dfa9dfaae2 move to notes před 5 roky
  justheuristic 8931c56f73 move to notes před 5 roky
  justheuristic b20f3ee985 grad logits wrt actual logits před 5 roky
  justheuristic be3119b12e add basic moe correctness test před 5 roky
  justheuristic 662357fcb3 reweigh grads correctly před 5 roky
  justheuristic 153ab20232 change order of grads před 5 roky
  justheuristic 284250d00c change order of grads před 5 roky
  justheuristic c5ee3d6041 only return grad w.r.t. inputs před 5 roky
  justheuristic 05e7c92f3d unpack tuple před 5 roky
  justheuristic 5cbcf79b00 list -> tensor před 5 roky
  justheuristic c8889bde96 list -> tensor před 5 roky
  justheuristic 8030c075c9 use lists for gatehr před 5 roky
  justheuristic 49e4459ec8 do not .detach non-tensor parameters před 5 roky
  justheuristic 97c4003e5c enumerate před 5 roky
  justheuristic 60af3952c9 flag to remove optimizer před 5 roky
  justheuristic 9a4e306f39 flag to remove optimizer před 5 roky
  justheuristic 80ab75583f wip: parallel fault-tolerant moe backward pass před 5 roky
  justheuristic 2b2ddf8280 wip: parallel fault-tolerant moe backward pass před 5 roky
  justheuristic 6fb99c8746 wip: parallel fault-tolerant moe backward pass před 5 roky
  justheuristic ebe07eebfd typo před 5 roky
  justheuristic 88d1bdc025 unused imports před 5 roky
  justheuristic c58d08cc06 remove run_and_await_k completely, rename gating_function to moe před 5 roky
  justheuristic 4a33e155b6 remove run_and_await_k completely před 5 roky
  justheuristic 5016002186 remove dependency on run_and_await_k, rename GatingFunction to RemoteMixtureOfExperts před 5 roky
  justheuristic 5192ffa184 Update issue templates před 5 roky