Historie revizí

Autor SHA1 Zpráva Datum
  Anton Sinitsin 02bbd85ed8 Added primitives for speculative decoding and tests (#598) před 1 rokem
  Aleksandr Borzunov a2d4b65ae0 Update README.md před 1 rokem
  Aleksandr Borzunov 10fab97e2b Fix year in citation před 1 rokem
  Alexander Borzunov 8ad5513bea Fix server warnings, update license links and readme (#602) před 1 rokem
  Alexander Borzunov 67ca11a282 Update hivemind to support torch >= 2.3.0, pydantic >= 2.0 (#601) před 1 rokem
  Alexander Borzunov 103ef760da Materialize buffers in get_block_size() (#600) před 1 rokem
  justheuristic 10f7525ce0 Fix typo in README před 1 rokem
  justheuristic 19be29e89e note about llama 3.1 RoPE support před 1 rokem
  justheuristic 6477cb85e7 Bump transformers to 4.43.1 (#596) před 1 rokem
  Artem Chumachenko f1e1b051d0 Update peft dependency, fix initialization and inference with new peft (#557) před 1 rokem
  Anton Sinitsin c0a4d2e3d5 Add option to rollback inference for a certain number of steps (#588) před 1 rokem
  Anton Sinitsin 68585864ae Update transformers to 4.41.2 (#583) před 1 rokem
  Priyanshupareek e268c99a6b Restrict PyTorch version to <2.3.0 to resolve import error (#577) před 1 rokem
  Artem Chumachenko 30f522d1a0 Fix dummy cache allocation (#574) před 1 rokem
  Artem Chumachenko d6f4f80f3f Fix Mixtral-related issues (#570) před 1 rokem
  Artem Chumachenko d2fcbbc72e Add Mixtral models (#553) před 1 rokem
  justheuristic 2ad0b2b936 Fix p2p pushing in rpc_inference (by @miaoqijun ) , support transformers 4.38.2 (#563) před 1 rokem
  justheuristic efee5d1fa8 Clean disk space in push-docker-image.yaml (#558) před 1 rokem
  Denis Mazur 0d91bbdac3 Bump transformers and accelerate versions (#554) před 1 rokem
  justheuristic d59c15c578 Bump version for inference diagnostics (#543) před 1 rokem
  Max Ryabinin 03cbe90234 Optimize LLaMA for inference (#513) před 1 rokem
  justheuristic 25a0796b39 Hotfix: require peft version 0.5.0 (#539) před 1 rokem
  justheuristic dcce43670f Hotfix: set transformers version <=4.34 temporarily (#538) před 1 rokem
  Alexander Borzunov 82a97d6e9e Fix beam search in GPU clients (#531) před 1 rokem
  Alexander Borzunov 47d50e1e29 Improve default arguments for clients and servers (#530) před 1 rokem
  Max Ryabinin ae19b65095 Add position_ids argument to DistributedFalconModel (#525) před 1 rokem
  Alexander Borzunov 1d9401ddce Update README.md (#520) před 1 rokem
  FYY a2484b3053 Fix file locks in NFS-mounted directories (#517) před 1 rokem
  Alexander Borzunov 5ce4f1a159 Store (start_block, end_block) in each DHT record for reliability (#510) před 1 rokem
  Alexander Borzunov 158621677b Bump version to 2.2.0 (#502) před 1 rokem