main
Zaktualizowano 1 rok temu przez GitHub
8bit-model
Zaktualizowano 3 lat temu przez dbaranchuk
8bit_backward
Zaktualizowano 3 lat temu przez dbaranchuk
8bit_blocks
Zaktualizowano 3 lat temu przez Tim Dettmers
8bit_model_inference
Zaktualizowano 3 lat temu przez dbaranchuk
CI
Zaktualizowano 3 lat temu przez justheuristic
add-sst2-example
Zaktualizowano 2 lat temu przez Artem Chumachenko
amd-gpus
Zaktualizowano 2 lat temu przez GitHub
beamsearch
Zaktualizowano 2 lat temu przez Artem Chumachenko
beat-docker-into-submission
Zaktualizowano 2 lat temu przez GitHub
bnb-0-41-1
Zaktualizowano 2 lat temu przez GitHub
bootstrap-peers
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
borzunov-patch-1
Zaktualizowano 2 lat temu przez GitHub
borzunov-patch-2
Zaktualizowano 2 lat temu przez GitHub
borzunov-patch-3
Zaktualizowano 1 rok temu przez GitHub
bump
Zaktualizowano 1 rok temu przez GitHub
cache
Zaktualizowano 2 lat temu przez GitHub
client
Zaktualizowano 3 lat temu przez justheuristic
client-attempt2
Zaktualizowano 3 lat temu przez justheuristic
client-convenience
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
dbaranchuk-patch-1
Zaktualizowano 3 lat temu przez GitHub
debug-leak
Zaktualizowano 2 lat temu przez Your Name
declare_adapters
Zaktualizowano 2 lat temu przez Your Name
deep-prompt-tuning
Zaktualizowano 3 lat temu przez dbaranchuk
deep_prompt_inference
Zaktualizowano 2 lat temu przez justheuristic
demo-1
Zaktualizowano 3 lat temu przez justheuristic
diff
Zaktualizowano 3 lat temu przez justheuristic
diff-compression
Zaktualizowano 2 lat temu przez justheuristic
distributed-deep-ptune
Zaktualizowano 3 lat temu przez justheuristic
download_8bit_weights
Zaktualizowano 2 lat temu przez Max Ryabinin
efficient-forward-backward
Zaktualizowano 3 lat temu przez dbaranchuk
empty-weights
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
enable-rebalancing
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
examples_fix_hivemind
Zaktualizowano 2 lat temu przez GitHub
extract-module-container
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
facelift
Zaktualizowano 3 lat temu przez justheuristic
fault-tolerant-inference
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
fix-auth-token
Zaktualizowano 3 lat temu przez justheuristic
fix-branch-name
Zaktualizowano 3 lat temu przez GitHub
fix-cache
Zaktualizowano 3 lat temu przez justheuristic
fix-ci
Zaktualizowano 3 lat temu przez justheuristic
fix-convert-8bit
Zaktualizowano 3 lat temu przez dbaranchuk
fix-distr-seq-cls
Zaktualizowano 3 lat temu przez dbaranchuk
fix-docker
Zaktualizowano 1 rok temu przez GitHub
fix-inference-retry
Zaktualizowano 1 rok temu przez Aleksandr Borzunov
fix-joining-announce
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
fix-master-ci
Zaktualizowano 3 lat temu przez GitHub
fix-nf4-and-dtypes
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
fix-pb2
Zaktualizowano 2 lat temu przez justheuristic
fix-protobuf
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
fix-ptune
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
fix-readme
Zaktualizowano 2 lat temu przez justheuristic
fix-rebalancing-issues
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
fix-requirements
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
fix-seq-backward-recovery
Zaktualizowano 3 lat temu przez GitHub
fix-too-many-open-files
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
fix3
Zaktualizowano 2 lat temu przez justheuristic
forward-backward-timeouts
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
forward_backward
Zaktualizowano 1 rok temu przez Denis Mazur
forward_kwargs
Zaktualizowano 1 rok temu przez Your Name
friendly-timeout-errors
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
generation
Zaktualizowano 3 lat temu przez Artem Chumachenko
generation-inference
Zaktualizowano 2 lat temu przez Artem Chumachenko
get_sequence
Zaktualizowano 3 lat temu przez justheuristic
hf_quantization_integration
Zaktualizowano 1 rok temu przez vahe1994
hivemind-1.1.4
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
hivemind-dht-fork-process
Zaktualizowano 2 lat temu przez GitHub
hotfix_bnb
Zaktualizowano 2 lat temu przez justheuristic
inference_chain
Zaktualizowano 3 lat temu przez justheuristic
instruction-readability-style
Zaktualizowano 2 lat temu przez GitHub
investigate-segfault
Zaktualizowano 2 lat temu przez justheuristic
justheuristic-patch-1
Zaktualizowano 3 lat temu przez GitHub
justheuristic-patch-2
Zaktualizowano 3 lat temu przez GitHub
justheuristic-patch-3
Zaktualizowano 2 lat temu przez GitHub
justheuristic-patch-4
Zaktualizowano 2 lat temu przez GitHub
justheuristic-patch-5
Zaktualizowano 2 lat temu przez GitHub
lm_head
Zaktualizowano 3 lat temu przez GitHub
load-balancing
Zaktualizowano 3 lat temu przez Aleksandr Borzunov
lora_from_hub
Zaktualizowano 1 rok temu przez Artem Chumachenko
lru
Zaktualizowano 2 lat temu przez Your Name
main_fix
Zaktualizowano 3 lat temu przez justheuristic
measure-throughput
Zaktualizowano 3 lat temu przez Aleksandr Borzunov
measurements
Zaktualizowano 2 lat temu przez Your Name
memory_savings
Zaktualizowano 3 lat temu przez justheuristic
mockup
Zaktualizowano 3 lat temu przez justheuristic
multiple-experts
Zaktualizowano 3 lat temu przez justheuristic
no-cpufeature
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
no_qkv_merge
Zaktualizowano 1 rok temu przez Max Ryabinin
optimize_seq
Zaktualizowano 3 lat temu przez justheuristic
partial_rollback
Zaktualizowano 1 rok temu przez Your Name
payload-size
Zaktualizowano 1 rok temu przez GitHub
petals-readme-title
Zaktualizowano 3 lat temu przez GitHub
pip-installable
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
pip-installable-v2
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
priority-tasks
Zaktualizowano 2 lat temu przez justheuristic
processing_attention
Zaktualizowano 2 lat temu przez Artem Chumachenko
prompt-inference
Zaktualizowano 3 lat temu przez Artem Chumachenko
prompt-tuning
Zaktualizowano 3 lat temu przez GitHub
ptune-example-personachat
Zaktualizowano 2 lat temu przez artek0chumak
ptune-wip
Zaktualizowano 3 lat temu przez justheuristic
pytest-verbose
Zaktualizowano 3 lat temu przez GitHub
qkv_merge
Zaktualizowano 1 rok temu przez Max Ryabinin
readme-clarifications
Zaktualizowano 2 lat temu przez justheuristic
readme-release
Zaktualizowano 3 lat temu przez GitHub
remove-remote-block
Zaktualizowano 3 lat temu przez justheuristic
rename-test-model
Zaktualizowano 3 lat temu przez GitHub
repetition-penalty
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
rpc
Zaktualizowano 3 lat temu przez Dmitry Baranchuk
rtfd
Zaktualizowano 2 lat temu przez GitHub
sequence
Zaktualizowano 3 lat temu przez justheuristic
server-dtypes
Zaktualizowano 2 lat temu przez justheuristic
server-increase-startup-timeout
Zaktualizowano 2 lat temu przez GitHub
server-logging
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
server-timeouts
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
speculative_inference
Zaktualizowano 11 miesięcy temu przez Your Name
speculative_test
Zaktualizowano 1 rok temu przez xtinkt
standardize
Zaktualizowano 3 lat temu przez justheuristic
step_metadata
Zaktualizowano 1 rok temu przez Your Name
support-backend-dtypes
Zaktualizowano 3 lat temu przez dbaranchuk
test-push
Zaktualizowano 3 lat temu przez justheuristic
test-with-jf160m
Zaktualizowano 1 rok temu przez Your Name
test_branch
Zaktualizowano 1 rok temu przez xtinkt
test_main
Zaktualizowano 1 rok temu przez Your Name
test_opt_serving
Zaktualizowano 2 lat temu przez Max Ryabinin
test_set_position
Zaktualizowano 1 rok temu przez GitHub
upd-deps
Zaktualizowano 2 lat temu przez justheuristic
update-bullet-points
Zaktualizowano 3 lat temu przez GitHub
update-hivemind
Zaktualizowano 2 lat temu przez Aleksandr Borzunov
update-model
Zaktualizowano 3 lat temu przez Dmitry Baranchuk
update-readme-disclaimers-faq
Zaktualizowano 3 lat temu przez GitHub
update-readme-pics
Zaktualizowano 3 lat temu przez GitHub
update_example_1
Zaktualizowano 2 lat temu przez Artem Chumachenko
vectorized_beam_search
Zaktualizowano 2 lat temu przez Artem Chumachenko
versions
Zaktualizowano 2 lat temu przez GitHub
warn-about-6b-instructions
Zaktualizowano 3 lat temu przez GitHub
wip_triton
Zaktualizowano 1 rok temu przez Max Ryabinin
yozh-dev-branch
Zaktualizowano 2 lat temu przez Just Heuristic