8bit-model
Шинэчлэгдсэн 3 жил өмнө by dbaranchuk
8bit_backward
Шинэчлэгдсэн 3 жил өмнө by dbaranchuk
8bit_blocks
Шинэчлэгдсэн 3 жил өмнө by Tim Dettmers
8bit_model_inference
Шинэчлэгдсэн 3 жил өмнө by dbaranchuk
CI
Шинэчлэгдсэн 3 жил өмнө by justheuristic
add-sst2-example
Шинэчлэгдсэн 2 жил өмнө by Artem Chumachenko
amd-gpus
Шинэчлэгдсэн 2 жил өмнө by GitHub
beamsearch
Шинэчлэгдсэн 2 жил өмнө by Artem Chumachenko
beat-docker-into-submission
Шинэчлэгдсэн 2 жил өмнө by GitHub
bnb-0-41-1
Шинэчлэгдсэн 2 жил өмнө by GitHub
bootstrap-peers
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
borzunov-patch-1
Шинэчлэгдсэн 2 жил өмнө by GitHub
borzunov-patch-2
Шинэчлэгдсэн 2 жил өмнө by GitHub
borzunov-patch-3
Шинэчлэгдсэн 1 жил өмнө by GitHub
bump
Шинэчлэгдсэн 1 жил өмнө by GitHub
cache
Шинэчлэгдсэн 3 жил өмнө by GitHub
client
Шинэчлэгдсэн 3 жил өмнө by justheuristic
client-attempt2
Шинэчлэгдсэн 3 жил өмнө by justheuristic
client-convenience
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
dbaranchuk-patch-1
Шинэчлэгдсэн 3 жил өмнө by GitHub
debug-leak
Шинэчлэгдсэн 2 жил өмнө by Your Name
declare_adapters
Шинэчлэгдсэн 2 жил өмнө by Your Name
deep-prompt-tuning
Шинэчлэгдсэн 3 жил өмнө by dbaranchuk
deep_prompt_inference
Шинэчлэгдсэн 3 жил өмнө by justheuristic
demo-1
Шинэчлэгдсэн 3 жил өмнө by justheuristic
diff
Шинэчлэгдсэн 3 жил өмнө by justheuristic
diff-compression
Шинэчлэгдсэн 2 жил өмнө by justheuristic
distributed-deep-ptune
Шинэчлэгдсэн 3 жил өмнө by justheuristic
download_8bit_weights
Шинэчлэгдсэн 2 жил өмнө by Max Ryabinin
efficient-forward-backward
Шинэчлэгдсэн 3 жил өмнө by dbaranchuk
empty-weights
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
enable-rebalancing
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
examples_fix_hivemind
Шинэчлэгдсэн 2 жил өмнө by GitHub
extract-module-container
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
facelift
Шинэчлэгдсэн 3 жил өмнө by justheuristic
fault-tolerant-inference
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
fix-auth-token
Шинэчлэгдсэн 3 жил өмнө by justheuristic
fix-branch-name
Шинэчлэгдсэн 3 жил өмнө by GitHub
fix-cache
Шинэчлэгдсэн 3 жил өмнө by justheuristic
fix-ci
Шинэчлэгдсэн 3 жил өмнө by justheuristic
fix-convert-8bit
Шинэчлэгдсэн 3 жил өмнө by dbaranchuk
fix-distr-seq-cls
Шинэчлэгдсэн 3 жил өмнө by dbaranchuk
fix-docker
Шинэчлэгдсэн 1 жил өмнө by GitHub
fix-inference-retry
Шинэчлэгдсэн 1 жил өмнө by Aleksandr Borzunov
fix-joining-announce
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
fix-master-ci
Шинэчлэгдсэн 3 жил өмнө by GitHub
fix-nf4-and-dtypes
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
fix-pb2
Шинэчлэгдсэн 2 жил өмнө by justheuristic
fix-protobuf
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
fix-ptune
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
fix-readme
Шинэчлэгдсэн 2 жил өмнө by justheuristic
fix-rebalancing-issues
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
fix-requirements
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
fix-seq-backward-recovery
Шинэчлэгдсэн 3 жил өмнө by GitHub
fix-too-many-open-files
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
fix3
Шинэчлэгдсэн 2 жил өмнө by justheuristic
forward-backward-timeouts
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
forward_backward
Шинэчлэгдсэн 1 жил өмнө by Denis Mazur
forward_kwargs
Шинэчлэгдсэн 1 жил өмнө by Your Name
friendly-timeout-errors
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
generation
Шинэчлэгдсэн 3 жил өмнө by Artem Chumachenko
generation-inference
Шинэчлэгдсэн 3 жил өмнө by Artem Chumachenko
get_sequence
Шинэчлэгдсэн 3 жил өмнө by justheuristic
hf_quantization_integration
Шинэчлэгдсэн 1 жил өмнө by vahe1994
hivemind-1.1.4
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
hivemind-dht-fork-process
Шинэчлэгдсэн 2 жил өмнө by GitHub
hotfix_bnb
Шинэчлэгдсэн 2 жил өмнө by justheuristic
inference_chain
Шинэчлэгдсэн 3 жил өмнө by justheuristic
instruction-readability-style
Шинэчлэгдсэн 2 жил өмнө by GitHub
investigate-segfault
Шинэчлэгдсэн 2 жил өмнө by justheuristic
justheuristic-patch-1
Шинэчлэгдсэн 3 жил өмнө by GitHub
justheuristic-patch-2
Шинэчлэгдсэн 3 жил өмнө by GitHub
justheuristic-patch-3
Шинэчлэгдсэн 3 жил өмнө by GitHub
justheuristic-patch-4
Шинэчлэгдсэн 2 жил өмнө by GitHub
justheuristic-patch-5
Шинэчлэгдсэн 2 жил өмнө by GitHub
lm_head
Шинэчлэгдсэн 3 жил өмнө by GitHub
load-balancing
Шинэчлэгдсэн 3 жил өмнө by Aleksandr Borzunov
lora_from_hub
Шинэчлэгдсэн 1 жил өмнө by Artem Chumachenko
lru
Шинэчлэгдсэн 2 жил өмнө by Your Name
main
Шинэчлэгдсэн 1 жил өмнө by GitHub
main_fix
Шинэчлэгдсэн 3 жил өмнө by justheuristic
measure-throughput
Шинэчлэгдсэн 3 жил өмнө by Aleksandr Borzunov
measurements
Шинэчлэгдсэн 2 жил өмнө by Your Name
memory_savings
Шинэчлэгдсэн 3 жил өмнө by justheuristic
mockup
Шинэчлэгдсэн 3 жил өмнө by justheuristic
multiple-experts
Шинэчлэгдсэн 3 жил өмнө by justheuristic
no-cpufeature
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
no_qkv_merge
Шинэчлэгдсэн 1 жил өмнө by Max Ryabinin
optimize_seq
Шинэчлэгдсэн 3 жил өмнө by justheuristic
partial_rollback
Шинэчлэгдсэн 1 жил өмнө by Your Name
payload-size
Шинэчлэгдсэн 1 жил өмнө by GitHub
petals-readme-title
Шинэчлэгдсэн 3 жил өмнө by GitHub
pip-installable
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
pip-installable-v2
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
priority-tasks
Шинэчлэгдсэн 2 жил өмнө by justheuristic
processing_attention
Шинэчлэгдсэн 2 жил өмнө by Artem Chumachenko
prompt-inference
Шинэчлэгдсэн 3 жил өмнө by Artem Chumachenko
prompt-tuning
Шинэчлэгдсэн 3 жил өмнө by GitHub
ptune-example-personachat
Шинэчлэгдсэн 2 жил өмнө by artek0chumak
ptune-wip
Шинэчлэгдсэн 3 жил өмнө by justheuristic
pytest-verbose
Шинэчлэгдсэн 3 жил өмнө by GitHub
qkv_merge
Шинэчлэгдсэн 1 жил өмнө by Max Ryabinin
readme-clarifications
Шинэчлэгдсэн 2 жил өмнө by justheuristic
readme-release
Шинэчлэгдсэн 3 жил өмнө by GitHub
remove-remote-block
Шинэчлэгдсэн 3 жил өмнө by justheuristic
rename-test-model
Шинэчлэгдсэн 3 жил өмнө by GitHub
repetition-penalty
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
rpc
Шинэчлэгдсэн 3 жил өмнө by Dmitry Baranchuk
rtfd
Шинэчлэгдсэн 2 жил өмнө by GitHub
sequence
Шинэчлэгдсэн 3 жил өмнө by justheuristic
server-dtypes
Шинэчлэгдсэн 2 жил өмнө by justheuristic
server-increase-startup-timeout
Шинэчлэгдсэн 2 жил өмнө by GitHub
server-logging
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
server-timeouts
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
speculative_inference
Шинэчлэгдсэн 11 сар өмнө by Your Name
speculative_test
Шинэчлэгдсэн 1 жил өмнө by xtinkt
standardize
Шинэчлэгдсэн 3 жил өмнө by justheuristic
step_metadata
Шинэчлэгдсэн 1 жил өмнө by Your Name
support-backend-dtypes
Шинэчлэгдсэн 3 жил өмнө by dbaranchuk
test-push
Шинэчлэгдсэн 3 жил өмнө by justheuristic
test-with-jf160m
Шинэчлэгдсэн 1 жил өмнө by Your Name
test_branch
Шинэчлэгдсэн 1 жил өмнө by xtinkt
test_main
Шинэчлэгдсэн 1 жил өмнө by Your Name
test_opt_serving
Шинэчлэгдсэн 2 жил өмнө by Max Ryabinin
test_set_position
Шинэчлэгдсэн 1 жил өмнө by GitHub
upd-deps
Шинэчлэгдсэн 2 жил өмнө by justheuristic
update-bullet-points
Шинэчлэгдсэн 3 жил өмнө by GitHub
update-hivemind
Шинэчлэгдсэн 2 жил өмнө by Aleksandr Borzunov
update-model
Шинэчлэгдсэн 3 жил өмнө by Dmitry Baranchuk
update-readme-disclaimers-faq
Шинэчлэгдсэн 3 жил өмнө by GitHub
update-readme-pics
Шинэчлэгдсэн 3 жил өмнө by GitHub
update_example_1
Шинэчлэгдсэн 2 жил өмнө by Artem Chumachenko
vectorized_beam_search
Шинэчлэгдсэн 2 жил өмнө by Artem Chumachenko
versions
Шинэчлэгдсэн 2 жил өмнө by GitHub
warn-about-6b-instructions
Шинэчлэгдсэн 3 жил өмнө by GitHub
wip_triton
Шинэчлэгдсэн 1 жил өмнө by Max Ryabinin
yozh-dev-branch
Шинэчлэгдсэн 2 жил өмнө by Just Heuristic