Commit History

Автор SHA1 Съобщение Дата
  Alexander Borzunov ab41223b17 Fix dtype- and device-related client issues (#98) преди 2 години
  Dmitry Baranchuk 24ba3433e4 [Fix] make distributed seq cls to not create the full bloom model (#49) преди 3 години
  Dmitry Baranchuk 11a424837f integrate mixed-8bit model (#39) преди 3 години
  Dmitry Baranchuk 04a2b6f5e3 Support various backend dtypes & async serialization (#38) преди 3 години
  justheuristic e2711a033b Add automated tests (#23) преди 3 години
  Dmitry Baranchuk f5463812ad Shallow prompt tuning (#22) преди 3 години
  Dmitry Baranchuk fd0bf064f3 minor refactoring преди 3 години
  dbaranchuk 21e1f42f04 mv set_requires_grad to remote_model преди 3 години
  dbaranchuk 5168a3405a fix comments преди 3 години
  dbaranchuk 79280c4371 refactoring преди 3 години
  dbaranchuk 6bffeff0a1 fix преди 3 години
  dbaranchuk df42822f26 LM head for CausalLM & chunked forward преди 3 години
  justheuristic 88c1bf9896 black-isort преди 3 години
  justheuristic 4695071ad2 WIP: make DistributedBloom compliant with HF interface преди 3 години
  justheuristic e32208c954 black-isort преди 3 години
  justheuristic 4ad845bce3 black-isort преди 3 години
  Dmitry Baranchuk e66ab6f1f2 design interface & refactoring преди 3 години
  Dmitry Baranchuk d969172208 set requires_grad=False, lm_layer -> h @ word_embeddings, rm lm_layer from comverted_model преди 3 години
  justheuristic 6113a7e955 create alibi inside each block преди 3 години
  justheuristic f8b7aaece4 proper __len__ преди 3 години
  justheuristic eea6fbb318 check for past key values properly преди 3 години
  justheuristic 3f32912937 check for past key values properly преди 3 години
  justheuristic 471e47c0f5 black-isort преди 3 години
  justheuristic d03b38b9eb black-isort преди 3 години
  justheuristic 83cd4412a1 black-isort преди 3 години
  justheuristic 1ab5fb1630 fetch a specific bloom block without downloading the entire model преди 3 години
  justheuristic a6fca51212 fetch a specific bloom block without downloading the entire model преди 3 години
  justheuristic e8241d2915 black everything преди 3 години
  justheuristic 3b9351de1c isort преди 3 години
  justheuristic 1c49bcb741 basic backend преди 3 години