main
Aktualisiert vor 1 Jahr von GitHub
8bit-model
Aktualisiert vor 3 Jahren von dbaranchuk
8bit_backward
Aktualisiert vor 3 Jahren von dbaranchuk
8bit_blocks
Aktualisiert vor 3 Jahren von Tim Dettmers
8bit_model_inference
Aktualisiert vor 3 Jahren von dbaranchuk
CI
Aktualisiert vor 3 Jahren von justheuristic
add-sst2-example
Aktualisiert vor 2 Jahren von Artem Chumachenko
amd-gpus
Aktualisiert vor 2 Jahren von GitHub
beamsearch
Aktualisiert vor 2 Jahren von Artem Chumachenko
beat-docker-into-submission
Aktualisiert vor 2 Jahren von GitHub
bnb-0-41-1
Aktualisiert vor 2 Jahren von GitHub
bootstrap-peers
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
borzunov-patch-1
Aktualisiert vor 2 Jahren von GitHub
borzunov-patch-2
Aktualisiert vor 2 Jahren von GitHub
borzunov-patch-3
Aktualisiert vor 1 Jahr von GitHub
bump
Aktualisiert vor 1 Jahr von GitHub
cache
Aktualisiert vor 2 Jahren von GitHub
client
Aktualisiert vor 3 Jahren von justheuristic
client-attempt2
Aktualisiert vor 3 Jahren von justheuristic
client-convenience
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
dbaranchuk-patch-1
Aktualisiert vor 3 Jahren von GitHub
debug-leak
Aktualisiert vor 2 Jahren von Your Name
declare_adapters
Aktualisiert vor 2 Jahren von Your Name
deep-prompt-tuning
Aktualisiert vor 3 Jahren von dbaranchuk
deep_prompt_inference
Aktualisiert vor 2 Jahren von justheuristic
demo-1
Aktualisiert vor 3 Jahren von justheuristic
diff
Aktualisiert vor 3 Jahren von justheuristic
diff-compression
Aktualisiert vor 2 Jahren von justheuristic
distributed-deep-ptune
Aktualisiert vor 3 Jahren von justheuristic
download_8bit_weights
Aktualisiert vor 2 Jahren von Max Ryabinin
efficient-forward-backward
Aktualisiert vor 3 Jahren von dbaranchuk
empty-weights
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
enable-rebalancing
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
examples_fix_hivemind
Aktualisiert vor 2 Jahren von GitHub
extract-module-container
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
facelift
Aktualisiert vor 3 Jahren von justheuristic
fault-tolerant-inference
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
fix-auth-token
Aktualisiert vor 3 Jahren von justheuristic
fix-branch-name
Aktualisiert vor 3 Jahren von GitHub
fix-cache
Aktualisiert vor 3 Jahren von justheuristic
fix-ci
Aktualisiert vor 3 Jahren von justheuristic
fix-convert-8bit
Aktualisiert vor 3 Jahren von dbaranchuk
fix-distr-seq-cls
Aktualisiert vor 3 Jahren von dbaranchuk
fix-docker
Aktualisiert vor 1 Jahr von GitHub
fix-inference-retry
Aktualisiert vor 1 Jahr von Aleksandr Borzunov
fix-joining-announce
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
fix-master-ci
Aktualisiert vor 3 Jahren von GitHub
fix-nf4-and-dtypes
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
fix-pb2
Aktualisiert vor 2 Jahren von justheuristic
fix-protobuf
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
fix-ptune
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
fix-readme
Aktualisiert vor 2 Jahren von justheuristic
fix-rebalancing-issues
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
fix-requirements
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
fix-seq-backward-recovery
Aktualisiert vor 3 Jahren von GitHub
fix-too-many-open-files
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
fix3
Aktualisiert vor 2 Jahren von justheuristic
forward-backward-timeouts
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
forward_backward
Aktualisiert vor 1 Jahr von Denis Mazur
forward_kwargs
Aktualisiert vor 1 Jahr von Your Name
friendly-timeout-errors
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
generation
Aktualisiert vor 3 Jahren von Artem Chumachenko
generation-inference
Aktualisiert vor 2 Jahren von Artem Chumachenko
get_sequence
Aktualisiert vor 3 Jahren von justheuristic
hf_quantization_integration
Aktualisiert vor 1 Jahr von vahe1994
hivemind-1.1.4
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
hivemind-dht-fork-process
Aktualisiert vor 2 Jahren von GitHub
hotfix_bnb
Aktualisiert vor 2 Jahren von justheuristic
inference_chain
Aktualisiert vor 3 Jahren von justheuristic
instruction-readability-style
Aktualisiert vor 2 Jahren von GitHub
investigate-segfault
Aktualisiert vor 2 Jahren von justheuristic
justheuristic-patch-1
Aktualisiert vor 3 Jahren von GitHub
justheuristic-patch-2
Aktualisiert vor 3 Jahren von GitHub
justheuristic-patch-3
Aktualisiert vor 2 Jahren von GitHub
justheuristic-patch-4
Aktualisiert vor 2 Jahren von GitHub
justheuristic-patch-5
Aktualisiert vor 2 Jahren von GitHub
lm_head
Aktualisiert vor 3 Jahren von GitHub
load-balancing
Aktualisiert vor 3 Jahren von Aleksandr Borzunov
lora_from_hub
Aktualisiert vor 1 Jahr von Artem Chumachenko
lru
Aktualisiert vor 2 Jahren von Your Name
main_fix
Aktualisiert vor 3 Jahren von justheuristic
measure-throughput
Aktualisiert vor 3 Jahren von Aleksandr Borzunov
measurements
Aktualisiert vor 2 Jahren von Your Name
memory_savings
Aktualisiert vor 3 Jahren von justheuristic
mockup
Aktualisiert vor 3 Jahren von justheuristic
multiple-experts
Aktualisiert vor 3 Jahren von justheuristic
no-cpufeature
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
no_qkv_merge
Aktualisiert vor 1 Jahr von Max Ryabinin
optimize_seq
Aktualisiert vor 3 Jahren von justheuristic
partial_rollback
Aktualisiert vor 1 Jahr von Your Name
payload-size
Aktualisiert vor 1 Jahr von GitHub
petals-readme-title
Aktualisiert vor 3 Jahren von GitHub
pip-installable
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
pip-installable-v2
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
priority-tasks
Aktualisiert vor 2 Jahren von justheuristic
processing_attention
Aktualisiert vor 2 Jahren von Artem Chumachenko
prompt-inference
Aktualisiert vor 3 Jahren von Artem Chumachenko
prompt-tuning
Aktualisiert vor 3 Jahren von GitHub
ptune-example-personachat
Aktualisiert vor 2 Jahren von artek0chumak
ptune-wip
Aktualisiert vor 3 Jahren von justheuristic
pytest-verbose
Aktualisiert vor 3 Jahren von GitHub
qkv_merge
Aktualisiert vor 1 Jahr von Max Ryabinin
readme-clarifications
Aktualisiert vor 2 Jahren von justheuristic
readme-release
Aktualisiert vor 3 Jahren von GitHub
remove-remote-block
Aktualisiert vor 3 Jahren von justheuristic
rename-test-model
Aktualisiert vor 3 Jahren von GitHub
repetition-penalty
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
rpc
Aktualisiert vor 3 Jahren von Dmitry Baranchuk
rtfd
Aktualisiert vor 2 Jahren von GitHub
sequence
Aktualisiert vor 3 Jahren von justheuristic
server-dtypes
Aktualisiert vor 2 Jahren von justheuristic
server-increase-startup-timeout
Aktualisiert vor 2 Jahren von GitHub
server-logging
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
server-timeouts
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
speculative_inference
Aktualisiert vor 11 Monaten von Your Name
speculative_test
Aktualisiert vor 1 Jahr von xtinkt
standardize
Aktualisiert vor 3 Jahren von justheuristic
step_metadata
Aktualisiert vor 1 Jahr von Your Name
support-backend-dtypes
Aktualisiert vor 3 Jahren von dbaranchuk
test-push
Aktualisiert vor 3 Jahren von justheuristic
test-with-jf160m
Aktualisiert vor 1 Jahr von Your Name
test_branch
Aktualisiert vor 1 Jahr von xtinkt
test_main
Aktualisiert vor 1 Jahr von Your Name
test_opt_serving
Aktualisiert vor 2 Jahren von Max Ryabinin
test_set_position
Aktualisiert vor 1 Jahr von GitHub
upd-deps
Aktualisiert vor 2 Jahren von justheuristic
update-bullet-points
Aktualisiert vor 3 Jahren von GitHub
update-hivemind
Aktualisiert vor 2 Jahren von Aleksandr Borzunov
update-model
Aktualisiert vor 3 Jahren von Dmitry Baranchuk
update-readme-disclaimers-faq
Aktualisiert vor 3 Jahren von GitHub
update-readme-pics
Aktualisiert vor 3 Jahren von GitHub
update_example_1
Aktualisiert vor 2 Jahren von Artem Chumachenko
vectorized_beam_search
Aktualisiert vor 2 Jahren von Artem Chumachenko
versions
Aktualisiert vor 2 Jahren von GitHub
warn-about-6b-instructions
Aktualisiert vor 3 Jahren von GitHub
wip_triton
Aktualisiert vor 1 Jahr von Max Ryabinin
yozh-dev-branch
Aktualisiert vor 2 Jahren von Just Heuristic