8bit-model
Обновлено 3 лет назад пользователем dbaranchuk
8bit_backward
Обновлено 3 лет назад пользователем dbaranchuk
8bit_blocks
Обновлено 3 лет назад пользователем Tim Dettmers
8bit_model_inference
Обновлено 3 лет назад пользователем dbaranchuk
CI
Обновлено 3 лет назад пользователем justheuristic
add-sst2-example
Обновлено 2 лет назад пользователем Artem Chumachenko
amd-gpus
Обновлено 2 лет назад пользователем GitHub
beamsearch
Обновлено 2 лет назад пользователем Artem Chumachenko
beat-docker-into-submission
Обновлено 2 лет назад пользователем GitHub
bnb-0-41-1
Обновлено 2 лет назад пользователем GitHub
bootstrap-peers
Обновлено 2 лет назад пользователем Aleksandr Borzunov
borzunov-patch-1
Обновлено 2 лет назад пользователем GitHub
borzunov-patch-2
Обновлено 2 лет назад пользователем GitHub
borzunov-patch-3
Обновлено 1 год назад пользователем GitHub
bump
Обновлено 1 год назад пользователем GitHub
cache
Обновлено 2 лет назад пользователем GitHub
client
Обновлено 3 лет назад пользователем justheuristic
client-attempt2
Обновлено 3 лет назад пользователем justheuristic
client-convenience
Обновлено 2 лет назад пользователем Aleksandr Borzunov
dbaranchuk-patch-1
Обновлено 3 лет назад пользователем GitHub
debug-leak
Обновлено 2 лет назад пользователем Your Name
declare_adapters
Обновлено 2 лет назад пользователем Your Name
deep-prompt-tuning
Обновлено 3 лет назад пользователем dbaranchuk
deep_prompt_inference
Обновлено 2 лет назад пользователем justheuristic
demo-1
Обновлено 3 лет назад пользователем justheuristic
diff
Обновлено 3 лет назад пользователем justheuristic
diff-compression
Обновлено 2 лет назад пользователем justheuristic
distributed-deep-ptune
Обновлено 3 лет назад пользователем justheuristic
download_8bit_weights
Обновлено 2 лет назад пользователем Max Ryabinin
efficient-forward-backward
Обновлено 3 лет назад пользователем dbaranchuk
empty-weights
Обновлено 2 лет назад пользователем Aleksandr Borzunov
enable-rebalancing
Обновлено 2 лет назад пользователем Aleksandr Borzunov
examples_fix_hivemind
Обновлено 2 лет назад пользователем GitHub
extract-module-container
Обновлено 2 лет назад пользователем Aleksandr Borzunov
facelift
Обновлено 3 лет назад пользователем justheuristic
fault-tolerant-inference
Обновлено 2 лет назад пользователем Aleksandr Borzunov
fix-auth-token
Обновлено 3 лет назад пользователем justheuristic
fix-branch-name
Обновлено 3 лет назад пользователем GitHub
fix-cache
Обновлено 3 лет назад пользователем justheuristic
fix-ci
Обновлено 3 лет назад пользователем justheuristic
fix-convert-8bit
Обновлено 3 лет назад пользователем dbaranchuk
fix-distr-seq-cls
Обновлено 3 лет назад пользователем dbaranchuk
fix-docker
Обновлено 1 год назад пользователем GitHub
fix-inference-retry
Обновлено 1 год назад пользователем Aleksandr Borzunov
fix-joining-announce
Обновлено 2 лет назад пользователем Aleksandr Borzunov
fix-master-ci
Обновлено 3 лет назад пользователем GitHub
fix-nf4-and-dtypes
Обновлено 2 лет назад пользователем Aleksandr Borzunov
fix-pb2
Обновлено 2 лет назад пользователем justheuristic
fix-protobuf
Обновлено 2 лет назад пользователем Aleksandr Borzunov
fix-ptune
Обновлено 2 лет назад пользователем Aleksandr Borzunov
fix-readme
Обновлено 2 лет назад пользователем justheuristic
fix-rebalancing-issues
Обновлено 2 лет назад пользователем Aleksandr Borzunov
fix-requirements
Обновлено 2 лет назад пользователем Aleksandr Borzunov
fix-seq-backward-recovery
Обновлено 3 лет назад пользователем GitHub
fix-too-many-open-files
Обновлено 2 лет назад пользователем Aleksandr Borzunov
fix3
Обновлено 2 лет назад пользователем justheuristic
forward-backward-timeouts
Обновлено 2 лет назад пользователем Aleksandr Borzunov
forward_backward
Обновлено 1 год назад пользователем Denis Mazur
forward_kwargs
Обновлено 1 год назад пользователем Your Name
friendly-timeout-errors
Обновлено 2 лет назад пользователем Aleksandr Borzunov
generation
Обновлено 3 лет назад пользователем Artem Chumachenko
generation-inference
Обновлено 2 лет назад пользователем Artem Chumachenko
get_sequence
Обновлено 3 лет назад пользователем justheuristic
hf_quantization_integration
Обновлено 1 год назад пользователем vahe1994
hivemind-1.1.4
Обновлено 2 лет назад пользователем Aleksandr Borzunov
hivemind-dht-fork-process
Обновлено 2 лет назад пользователем GitHub
hotfix_bnb
Обновлено 2 лет назад пользователем justheuristic
inference_chain
Обновлено 3 лет назад пользователем justheuristic
instruction-readability-style
Обновлено 2 лет назад пользователем GitHub
investigate-segfault
Обновлено 2 лет назад пользователем justheuristic
justheuristic-patch-1
Обновлено 3 лет назад пользователем GitHub
justheuristic-patch-2
Обновлено 3 лет назад пользователем GitHub
justheuristic-patch-3
Обновлено 2 лет назад пользователем GitHub
justheuristic-patch-4
Обновлено 2 лет назад пользователем GitHub
justheuristic-patch-5
Обновлено 2 лет назад пользователем GitHub
lm_head
Обновлено 3 лет назад пользователем GitHub
load-balancing
Обновлено 3 лет назад пользователем Aleksandr Borzunov
lora_from_hub
Обновлено 1 год назад пользователем Artem Chumachenko
lru
Обновлено 2 лет назад пользователем Your Name
main
Обновлено 1 год назад пользователем GitHub
main_fix
Обновлено 3 лет назад пользователем justheuristic
measure-throughput
Обновлено 3 лет назад пользователем Aleksandr Borzunov
measurements
Обновлено 2 лет назад пользователем Your Name
memory_savings
Обновлено 3 лет назад пользователем justheuristic
mockup
Обновлено 3 лет назад пользователем justheuristic
multiple-experts
Обновлено 3 лет назад пользователем justheuristic
no-cpufeature
Обновлено 2 лет назад пользователем Aleksandr Borzunov
no_qkv_merge
Обновлено 1 год назад пользователем Max Ryabinin
optimize_seq
Обновлено 3 лет назад пользователем justheuristic
partial_rollback
Обновлено 1 год назад пользователем Your Name
payload-size
Обновлено 1 год назад пользователем GitHub
petals-readme-title
Обновлено 3 лет назад пользователем GitHub
pip-installable
Обновлено 2 лет назад пользователем Aleksandr Borzunov
pip-installable-v2
Обновлено 2 лет назад пользователем Aleksandr Borzunov
priority-tasks
Обновлено 2 лет назад пользователем justheuristic
processing_attention
Обновлено 2 лет назад пользователем Artem Chumachenko
prompt-inference
Обновлено 3 лет назад пользователем Artem Chumachenko
prompt-tuning
Обновлено 3 лет назад пользователем GitHub
ptune-example-personachat
Обновлено 2 лет назад пользователем artek0chumak
ptune-wip
Обновлено 3 лет назад пользователем justheuristic
pytest-verbose
Обновлено 3 лет назад пользователем GitHub
qkv_merge
Обновлено 1 год назад пользователем Max Ryabinin
readme-clarifications
Обновлено 2 лет назад пользователем justheuristic
readme-release
Обновлено 3 лет назад пользователем GitHub
remove-remote-block
Обновлено 3 лет назад пользователем justheuristic
rename-test-model
Обновлено 3 лет назад пользователем GitHub
repetition-penalty
Обновлено 2 лет назад пользователем Aleksandr Borzunov
rpc
Обновлено 3 лет назад пользователем Dmitry Baranchuk
rtfd
Обновлено 2 лет назад пользователем GitHub
sequence
Обновлено 3 лет назад пользователем justheuristic
server-dtypes
Обновлено 2 лет назад пользователем justheuristic
server-increase-startup-timeout
Обновлено 2 лет назад пользователем GitHub
server-logging
Обновлено 2 лет назад пользователем Aleksandr Borzunov
server-timeouts
Обновлено 2 лет назад пользователем Aleksandr Borzunov
speculative_inference
Обновлено 11 месяцев назад пользователем Your Name
speculative_test
Обновлено 1 год назад пользователем xtinkt
standardize
Обновлено 3 лет назад пользователем justheuristic
step_metadata
Обновлено 1 год назад пользователем Your Name
support-backend-dtypes
Обновлено 3 лет назад пользователем dbaranchuk
test-push
Обновлено 3 лет назад пользователем justheuristic
test-with-jf160m
Обновлено 1 год назад пользователем Your Name
test_branch
Обновлено 1 год назад пользователем xtinkt
test_main
Обновлено 1 год назад пользователем Your Name
test_opt_serving
Обновлено 2 лет назад пользователем Max Ryabinin
test_set_position
Обновлено 1 год назад пользователем GitHub
upd-deps
Обновлено 2 лет назад пользователем justheuristic
update-bullet-points
Обновлено 3 лет назад пользователем GitHub
update-hivemind
Обновлено 2 лет назад пользователем Aleksandr Borzunov
update-model
Обновлено 3 лет назад пользователем Dmitry Baranchuk
update-readme-disclaimers-faq
Обновлено 3 лет назад пользователем GitHub
update-readme-pics
Обновлено 3 лет назад пользователем GitHub
update_example_1
Обновлено 2 лет назад пользователем Artem Chumachenko
vectorized_beam_search
Обновлено 2 лет назад пользователем Artem Chumachenko
versions
Обновлено 2 лет назад пользователем GitHub
warn-about-6b-instructions
Обновлено 3 лет назад пользователем GitHub
wip_triton
Обновлено 1 год назад пользователем Max Ryabinin
yozh-dev-branch
Обновлено 2 лет назад пользователем Just Heuristic