8bit-model
Atualizado 3 anos atrás por dbaranchuk
8bit_backward
Atualizado 3 anos atrás por dbaranchuk
8bit_blocks
Atualizado 3 anos atrás por Tim Dettmers
8bit_model_inference
Atualizado 3 anos atrás por dbaranchuk
CI
Atualizado 3 anos atrás por justheuristic
add-sst2-example
Atualizado 2 anos atrás por Artem Chumachenko
amd-gpus
Atualizado 2 anos atrás por GitHub
beamsearch
Atualizado 2 anos atrás por Artem Chumachenko
beat-docker-into-submission
Atualizado 2 anos atrás por GitHub
bnb-0-41-1
Atualizado 2 anos atrás por GitHub
bootstrap-peers
Atualizado 2 anos atrás por Aleksandr Borzunov
borzunov-patch-1
Atualizado 2 anos atrás por GitHub
borzunov-patch-2
Atualizado 2 anos atrás por GitHub
borzunov-patch-3
Atualizado 1 ano atrás por GitHub
bump
Atualizado 1 ano atrás por GitHub
cache
Atualizado 2 anos atrás por GitHub
client
Atualizado 3 anos atrás por justheuristic
client-attempt2
Atualizado 3 anos atrás por justheuristic
client-convenience
Atualizado 2 anos atrás por Aleksandr Borzunov
dbaranchuk-patch-1
Atualizado 3 anos atrás por GitHub
debug-leak
Atualizado 2 anos atrás por Your Name
declare_adapters
Atualizado 2 anos atrás por Your Name
deep-prompt-tuning
Atualizado 3 anos atrás por dbaranchuk
deep_prompt_inference
Atualizado 2 anos atrás por justheuristic
demo-1
Atualizado 3 anos atrás por justheuristic
diff
Atualizado 3 anos atrás por justheuristic
diff-compression
Atualizado 2 anos atrás por justheuristic
distributed-deep-ptune
Atualizado 3 anos atrás por justheuristic
download_8bit_weights
Atualizado 2 anos atrás por Max Ryabinin
efficient-forward-backward
Atualizado 3 anos atrás por dbaranchuk
empty-weights
Atualizado 2 anos atrás por Aleksandr Borzunov
enable-rebalancing
Atualizado 2 anos atrás por Aleksandr Borzunov
examples_fix_hivemind
Atualizado 2 anos atrás por GitHub
extract-module-container
Atualizado 2 anos atrás por Aleksandr Borzunov
facelift
Atualizado 3 anos atrás por justheuristic
fault-tolerant-inference
Atualizado 2 anos atrás por Aleksandr Borzunov
fix-auth-token
Atualizado 3 anos atrás por justheuristic
fix-branch-name
Atualizado 3 anos atrás por GitHub
fix-cache
Atualizado 3 anos atrás por justheuristic
fix-ci
Atualizado 3 anos atrás por justheuristic
fix-convert-8bit
Atualizado 3 anos atrás por dbaranchuk
fix-distr-seq-cls
Atualizado 3 anos atrás por dbaranchuk
fix-docker
Atualizado 1 ano atrás por GitHub
fix-inference-retry
Atualizado 1 ano atrás por Aleksandr Borzunov
fix-joining-announce
Atualizado 2 anos atrás por Aleksandr Borzunov
fix-master-ci
Atualizado 3 anos atrás por GitHub
fix-nf4-and-dtypes
Atualizado 2 anos atrás por Aleksandr Borzunov
fix-pb2
Atualizado 2 anos atrás por justheuristic
fix-protobuf
Atualizado 2 anos atrás por Aleksandr Borzunov
fix-ptune
Atualizado 2 anos atrás por Aleksandr Borzunov
fix-readme
Atualizado 2 anos atrás por justheuristic
fix-rebalancing-issues
Atualizado 2 anos atrás por Aleksandr Borzunov
fix-requirements
Atualizado 2 anos atrás por Aleksandr Borzunov
fix-seq-backward-recovery
Atualizado 3 anos atrás por GitHub
fix-too-many-open-files
Atualizado 2 anos atrás por Aleksandr Borzunov
fix3
Atualizado 2 anos atrás por justheuristic
forward-backward-timeouts
Atualizado 2 anos atrás por Aleksandr Borzunov
forward_backward
Atualizado 1 ano atrás por Denis Mazur
forward_kwargs
Atualizado 1 ano atrás por Your Name
friendly-timeout-errors
Atualizado 2 anos atrás por Aleksandr Borzunov
generation
Atualizado 3 anos atrás por Artem Chumachenko
generation-inference
Atualizado 2 anos atrás por Artem Chumachenko
get_sequence
Atualizado 3 anos atrás por justheuristic
hf_quantization_integration
Atualizado 1 ano atrás por vahe1994
hivemind-1.1.4
Atualizado 2 anos atrás por Aleksandr Borzunov
hivemind-dht-fork-process
Atualizado 2 anos atrás por GitHub
hotfix_bnb
Atualizado 2 anos atrás por justheuristic
inference_chain
Atualizado 3 anos atrás por justheuristic
instruction-readability-style
Atualizado 2 anos atrás por GitHub
investigate-segfault
Atualizado 2 anos atrás por justheuristic
justheuristic-patch-1
Atualizado 3 anos atrás por GitHub
justheuristic-patch-2
Atualizado 3 anos atrás por GitHub
justheuristic-patch-3
Atualizado 2 anos atrás por GitHub
justheuristic-patch-4
Atualizado 2 anos atrás por GitHub
justheuristic-patch-5
Atualizado 2 anos atrás por GitHub
lm_head
Atualizado 3 anos atrás por GitHub
load-balancing
Atualizado 3 anos atrás por Aleksandr Borzunov
lora_from_hub
Atualizado 1 ano atrás por Artem Chumachenko
lru
Atualizado 2 anos atrás por Your Name
main
Atualizado 1 ano atrás por GitHub
main_fix
Atualizado 3 anos atrás por justheuristic
measure-throughput
Atualizado 3 anos atrás por Aleksandr Borzunov
measurements
Atualizado 2 anos atrás por Your Name
memory_savings
Atualizado 3 anos atrás por justheuristic
mockup
Atualizado 3 anos atrás por justheuristic
multiple-experts
Atualizado 3 anos atrás por justheuristic
no-cpufeature
Atualizado 2 anos atrás por Aleksandr Borzunov
no_qkv_merge
Atualizado 1 ano atrás por Max Ryabinin
optimize_seq
Atualizado 3 anos atrás por justheuristic
partial_rollback
Atualizado 1 ano atrás por Your Name
payload-size
Atualizado 1 ano atrás por GitHub
petals-readme-title
Atualizado 3 anos atrás por GitHub
pip-installable
Atualizado 2 anos atrás por Aleksandr Borzunov
pip-installable-v2
Atualizado 2 anos atrás por Aleksandr Borzunov
priority-tasks
Atualizado 2 anos atrás por justheuristic
processing_attention
Atualizado 2 anos atrás por Artem Chumachenko
prompt-inference
Atualizado 3 anos atrás por Artem Chumachenko
prompt-tuning
Atualizado 3 anos atrás por GitHub
ptune-example-personachat
Atualizado 2 anos atrás por artek0chumak
ptune-wip
Atualizado 3 anos atrás por justheuristic
pytest-verbose
Atualizado 3 anos atrás por GitHub
qkv_merge
Atualizado 1 ano atrás por Max Ryabinin
readme-clarifications
Atualizado 2 anos atrás por justheuristic
readme-release
Atualizado 3 anos atrás por GitHub
remove-remote-block
Atualizado 3 anos atrás por justheuristic
rename-test-model
Atualizado 3 anos atrás por GitHub
repetition-penalty
Atualizado 2 anos atrás por Aleksandr Borzunov
rpc
Atualizado 3 anos atrás por Dmitry Baranchuk
rtfd
Atualizado 2 anos atrás por GitHub
sequence
Atualizado 3 anos atrás por justheuristic
server-dtypes
Atualizado 2 anos atrás por justheuristic
server-increase-startup-timeout
Atualizado 2 anos atrás por GitHub
server-logging
Atualizado 2 anos atrás por Aleksandr Borzunov
server-timeouts
Atualizado 2 anos atrás por Aleksandr Borzunov
speculative_inference
Atualizado 11 meses atrás por Your Name
speculative_test
Atualizado 1 ano atrás por xtinkt
standardize
Atualizado 3 anos atrás por justheuristic
step_metadata
Atualizado 1 ano atrás por Your Name
support-backend-dtypes
Atualizado 3 anos atrás por dbaranchuk
test-push
Atualizado 3 anos atrás por justheuristic
test-with-jf160m
Atualizado 1 ano atrás por Your Name
test_branch
Atualizado 1 ano atrás por xtinkt
test_main
Atualizado 1 ano atrás por Your Name
test_opt_serving
Atualizado 2 anos atrás por Max Ryabinin
test_set_position
Atualizado 1 ano atrás por GitHub
upd-deps
Atualizado 2 anos atrás por justheuristic
update-bullet-points
Atualizado 3 anos atrás por GitHub
update-hivemind
Atualizado 2 anos atrás por Aleksandr Borzunov
update-model
Atualizado 3 anos atrás por Dmitry Baranchuk
update-readme-disclaimers-faq
Atualizado 3 anos atrás por GitHub
update-readme-pics
Atualizado 3 anos atrás por GitHub
update_example_1
Atualizado 2 anos atrás por Artem Chumachenko
vectorized_beam_search
Atualizado 2 anos atrás por Artem Chumachenko
versions
Atualizado 2 anos atrás por GitHub
warn-about-6b-instructions
Atualizado 3 anos atrás por GitHub
wip_triton
Atualizado 1 ano atrás por Max Ryabinin
yozh-dev-branch
Atualizado 2 anos atrás por Just Heuristic