8bit-model
hace 3 años actualizado por dbaranchuk
8bit_backward
hace 3 años actualizado por dbaranchuk
8bit_blocks
hace 3 años actualizado por Tim Dettmers
8bit_model_inference
hace 3 años actualizado por dbaranchuk
CI
hace 3 años actualizado por justheuristic
add-sst2-example
hace 2 años actualizado por Artem Chumachenko
amd-gpus
hace 2 años actualizado por GitHub
beamsearch
hace 2 años actualizado por Artem Chumachenko
beat-docker-into-submission
hace 2 años actualizado por GitHub
bnb-0-41-1
hace 2 años actualizado por GitHub
bootstrap-peers
hace 2 años actualizado por Aleksandr Borzunov
borzunov-patch-1
hace 2 años actualizado por GitHub
borzunov-patch-2
hace 2 años actualizado por GitHub
borzunov-patch-3
hace 1 año actualizado por GitHub
bump
hace 1 año actualizado por GitHub
cache
hace 2 años actualizado por GitHub
client
hace 3 años actualizado por justheuristic
client-attempt2
hace 3 años actualizado por justheuristic
client-convenience
hace 2 años actualizado por Aleksandr Borzunov
dbaranchuk-patch-1
hace 3 años actualizado por GitHub
debug-leak
hace 2 años actualizado por Your Name
declare_adapters
hace 2 años actualizado por Your Name
deep-prompt-tuning
hace 3 años actualizado por dbaranchuk
deep_prompt_inference
hace 2 años actualizado por justheuristic
demo-1
hace 3 años actualizado por justheuristic
diff
hace 3 años actualizado por justheuristic
diff-compression
hace 2 años actualizado por justheuristic
distributed-deep-ptune
hace 3 años actualizado por justheuristic
download_8bit_weights
hace 2 años actualizado por Max Ryabinin
efficient-forward-backward
hace 3 años actualizado por dbaranchuk
empty-weights
hace 2 años actualizado por Aleksandr Borzunov
enable-rebalancing
hace 2 años actualizado por Aleksandr Borzunov
examples_fix_hivemind
hace 2 años actualizado por GitHub
extract-module-container
hace 2 años actualizado por Aleksandr Borzunov
facelift
hace 3 años actualizado por justheuristic
fault-tolerant-inference
hace 2 años actualizado por Aleksandr Borzunov
fix-auth-token
hace 3 años actualizado por justheuristic
fix-branch-name
hace 3 años actualizado por GitHub
fix-cache
hace 3 años actualizado por justheuristic
fix-ci
hace 3 años actualizado por justheuristic
fix-convert-8bit
hace 3 años actualizado por dbaranchuk
fix-distr-seq-cls
hace 3 años actualizado por dbaranchuk
fix-docker
hace 1 año actualizado por GitHub
fix-inference-retry
hace 1 año actualizado por Aleksandr Borzunov
fix-joining-announce
hace 2 años actualizado por Aleksandr Borzunov
fix-master-ci
hace 3 años actualizado por GitHub
fix-nf4-and-dtypes
hace 2 años actualizado por Aleksandr Borzunov
fix-pb2
hace 2 años actualizado por justheuristic
fix-protobuf
hace 2 años actualizado por Aleksandr Borzunov
fix-ptune
hace 2 años actualizado por Aleksandr Borzunov
fix-readme
hace 2 años actualizado por justheuristic
fix-rebalancing-issues
hace 2 años actualizado por Aleksandr Borzunov
fix-requirements
hace 2 años actualizado por Aleksandr Borzunov
fix-seq-backward-recovery
hace 3 años actualizado por GitHub
fix-too-many-open-files
hace 2 años actualizado por Aleksandr Borzunov
fix3
hace 2 años actualizado por justheuristic
forward-backward-timeouts
hace 2 años actualizado por Aleksandr Borzunov
forward_backward
hace 1 año actualizado por Denis Mazur
forward_kwargs
hace 1 año actualizado por Your Name
friendly-timeout-errors
hace 2 años actualizado por Aleksandr Borzunov
generation
hace 3 años actualizado por Artem Chumachenko
generation-inference
hace 2 años actualizado por Artem Chumachenko
get_sequence
hace 3 años actualizado por justheuristic
hf_quantization_integration
hace 1 año actualizado por vahe1994
hivemind-1.1.4
hace 2 años actualizado por Aleksandr Borzunov
hivemind-dht-fork-process
hace 2 años actualizado por GitHub
hotfix_bnb
hace 2 años actualizado por justheuristic
inference_chain
hace 3 años actualizado por justheuristic
instruction-readability-style
hace 2 años actualizado por GitHub
investigate-segfault
hace 2 años actualizado por justheuristic
justheuristic-patch-1
hace 3 años actualizado por GitHub
justheuristic-patch-2
hace 3 años actualizado por GitHub
justheuristic-patch-3
hace 2 años actualizado por GitHub
justheuristic-patch-4
hace 2 años actualizado por GitHub
justheuristic-patch-5
hace 2 años actualizado por GitHub
lm_head
hace 3 años actualizado por GitHub
load-balancing
hace 3 años actualizado por Aleksandr Borzunov
lora_from_hub
hace 1 año actualizado por Artem Chumachenko
lru
hace 2 años actualizado por Your Name
main
hace 1 año actualizado por GitHub
main_fix
hace 3 años actualizado por justheuristic
measure-throughput
hace 3 años actualizado por Aleksandr Borzunov
measurements
hace 2 años actualizado por Your Name
memory_savings
hace 3 años actualizado por justheuristic
mockup
hace 3 años actualizado por justheuristic
multiple-experts
hace 3 años actualizado por justheuristic
no-cpufeature
hace 2 años actualizado por Aleksandr Borzunov
no_qkv_merge
hace 1 año actualizado por Max Ryabinin
optimize_seq
hace 3 años actualizado por justheuristic
partial_rollback
hace 1 año actualizado por Your Name
payload-size
hace 1 año actualizado por GitHub
petals-readme-title
hace 3 años actualizado por GitHub
pip-installable
hace 2 años actualizado por Aleksandr Borzunov
pip-installable-v2
hace 2 años actualizado por Aleksandr Borzunov
priority-tasks
hace 2 años actualizado por justheuristic
processing_attention
hace 2 años actualizado por Artem Chumachenko
prompt-inference
hace 3 años actualizado por Artem Chumachenko
prompt-tuning
hace 3 años actualizado por GitHub
ptune-example-personachat
hace 2 años actualizado por artek0chumak
ptune-wip
hace 3 años actualizado por justheuristic
pytest-verbose
hace 3 años actualizado por GitHub
qkv_merge
hace 1 año actualizado por Max Ryabinin
readme-clarifications
hace 2 años actualizado por justheuristic
readme-release
hace 3 años actualizado por GitHub
remove-remote-block
hace 3 años actualizado por justheuristic
rename-test-model
hace 3 años actualizado por GitHub
repetition-penalty
hace 2 años actualizado por Aleksandr Borzunov
rpc
hace 3 años actualizado por Dmitry Baranchuk
rtfd
hace 2 años actualizado por GitHub
sequence
hace 3 años actualizado por justheuristic
server-dtypes
hace 2 años actualizado por justheuristic
server-increase-startup-timeout
hace 2 años actualizado por GitHub
server-logging
hace 2 años actualizado por Aleksandr Borzunov
server-timeouts
hace 2 años actualizado por Aleksandr Borzunov
speculative_inference
hace 11 meses actualizado por Your Name
speculative_test
hace 1 año actualizado por xtinkt
standardize
hace 3 años actualizado por justheuristic
step_metadata
hace 1 año actualizado por Your Name
support-backend-dtypes
hace 3 años actualizado por dbaranchuk
test-push
hace 3 años actualizado por justheuristic
test-with-jf160m
hace 1 año actualizado por Your Name
test_branch
hace 1 año actualizado por xtinkt
test_main
hace 1 año actualizado por Your Name
test_opt_serving
hace 2 años actualizado por Max Ryabinin
test_set_position
hace 1 año actualizado por GitHub
upd-deps
hace 2 años actualizado por justheuristic
update-bullet-points
hace 3 años actualizado por GitHub
update-hivemind
hace 2 años actualizado por Aleksandr Borzunov
update-model
hace 3 años actualizado por Dmitry Baranchuk
update-readme-disclaimers-faq
hace 3 años actualizado por GitHub
update-readme-pics
hace 3 años actualizado por GitHub
update_example_1
hace 2 años actualizado por Artem Chumachenko
vectorized_beam_search
hace 2 años actualizado por Artem Chumachenko
versions
hace 2 años actualizado por GitHub
warn-about-6b-instructions
hace 3 años actualizado por GitHub
wip_triton
hace 1 año actualizado por Max Ryabinin
yozh-dev-branch
hace 2 años actualizado por Just Heuristic