8bit-model
Atualizado há 3 anos atrás por dbaranchuk
8bit_backward
Atualizado há 3 anos atrás por dbaranchuk
8bit_blocks
Atualizado há 3 anos atrás por Tim Dettmers
8bit_model_inference
Atualizado há 3 anos atrás por dbaranchuk
CI
Atualizado há 3 anos atrás por justheuristic
add-sst2-example
Atualizado há 2 anos atrás por Artem Chumachenko
amd-gpus
Atualizado há 2 anos atrás por GitHub
beamsearch
Atualizado há 2 anos atrás por Artem Chumachenko
beat-docker-into-submission
Atualizado há 2 anos atrás por GitHub
bnb-0-41-1
Atualizado há 2 anos atrás por GitHub
bootstrap-peers
Atualizado há 2 anos atrás por Aleksandr Borzunov
borzunov-patch-1
Atualizado há 2 anos atrás por GitHub
borzunov-patch-2
Atualizado há 2 anos atrás por GitHub
borzunov-patch-3
Atualizado há 1 ano atrás por GitHub
bump
Atualizado há 1 ano atrás por GitHub
cache
Atualizado há 2 anos atrás por GitHub
client
Atualizado há 3 anos atrás por justheuristic
client-attempt2
Atualizado há 3 anos atrás por justheuristic
client-convenience
Atualizado há 2 anos atrás por Aleksandr Borzunov
dbaranchuk-patch-1
Atualizado há 3 anos atrás por GitHub
debug-leak
Atualizado há 2 anos atrás por Your Name
declare_adapters
Atualizado há 2 anos atrás por Your Name
deep-prompt-tuning
Atualizado há 3 anos atrás por dbaranchuk
deep_prompt_inference
Atualizado há 2 anos atrás por justheuristic
demo-1
Atualizado há 3 anos atrás por justheuristic
diff
Atualizado há 3 anos atrás por justheuristic
diff-compression
Atualizado há 2 anos atrás por justheuristic
distributed-deep-ptune
Atualizado há 3 anos atrás por justheuristic
download_8bit_weights
Atualizado há 2 anos atrás por Max Ryabinin
efficient-forward-backward
Atualizado há 3 anos atrás por dbaranchuk
empty-weights
Atualizado há 2 anos atrás por Aleksandr Borzunov
enable-rebalancing
Atualizado há 2 anos atrás por Aleksandr Borzunov
examples_fix_hivemind
Atualizado há 2 anos atrás por GitHub
extract-module-container
Atualizado há 2 anos atrás por Aleksandr Borzunov
facelift
Atualizado há 3 anos atrás por justheuristic
fault-tolerant-inference
Atualizado há 2 anos atrás por Aleksandr Borzunov
fix-auth-token
Atualizado há 3 anos atrás por justheuristic
fix-branch-name
Atualizado há 3 anos atrás por GitHub
fix-cache
Atualizado há 3 anos atrás por justheuristic
fix-ci
Atualizado há 3 anos atrás por justheuristic
fix-convert-8bit
Atualizado há 3 anos atrás por dbaranchuk
fix-distr-seq-cls
Atualizado há 3 anos atrás por dbaranchuk
fix-docker
Atualizado há 1 ano atrás por GitHub
fix-inference-retry
Atualizado há 1 ano atrás por Aleksandr Borzunov
fix-joining-announce
Atualizado há 2 anos atrás por Aleksandr Borzunov
fix-master-ci
Atualizado há 3 anos atrás por GitHub
fix-nf4-and-dtypes
Atualizado há 2 anos atrás por Aleksandr Borzunov
fix-pb2
Atualizado há 2 anos atrás por justheuristic
fix-protobuf
Atualizado há 2 anos atrás por Aleksandr Borzunov
fix-ptune
Atualizado há 2 anos atrás por Aleksandr Borzunov
fix-readme
Atualizado há 2 anos atrás por justheuristic
fix-rebalancing-issues
Atualizado há 2 anos atrás por Aleksandr Borzunov
fix-requirements
Atualizado há 2 anos atrás por Aleksandr Borzunov
fix-seq-backward-recovery
Atualizado há 3 anos atrás por GitHub
fix-too-many-open-files
Atualizado há 2 anos atrás por Aleksandr Borzunov
fix3
Atualizado há 2 anos atrás por justheuristic
forward-backward-timeouts
Atualizado há 2 anos atrás por Aleksandr Borzunov
forward_backward
Atualizado há 1 ano atrás por Denis Mazur
forward_kwargs
Atualizado há 1 ano atrás por Your Name
friendly-timeout-errors
Atualizado há 2 anos atrás por Aleksandr Borzunov
generation
Atualizado há 3 anos atrás por Artem Chumachenko
generation-inference
Atualizado há 2 anos atrás por Artem Chumachenko
get_sequence
Atualizado há 3 anos atrás por justheuristic
hf_quantization_integration
Atualizado há 1 ano atrás por vahe1994
hivemind-1.1.4
Atualizado há 2 anos atrás por Aleksandr Borzunov
hivemind-dht-fork-process
Atualizado há 2 anos atrás por GitHub
hotfix_bnb
Atualizado há 2 anos atrás por justheuristic
inference_chain
Atualizado há 3 anos atrás por justheuristic
instruction-readability-style
Atualizado há 2 anos atrás por GitHub
investigate-segfault
Atualizado há 2 anos atrás por justheuristic
justheuristic-patch-1
Atualizado há 3 anos atrás por GitHub
justheuristic-patch-2
Atualizado há 3 anos atrás por GitHub
justheuristic-patch-3
Atualizado há 2 anos atrás por GitHub
justheuristic-patch-4
Atualizado há 2 anos atrás por GitHub
justheuristic-patch-5
Atualizado há 2 anos atrás por GitHub
lm_head
Atualizado há 3 anos atrás por GitHub
load-balancing
Atualizado há 3 anos atrás por Aleksandr Borzunov
lora_from_hub
Atualizado há 1 ano atrás por Artem Chumachenko
lru
Atualizado há 2 anos atrás por Your Name
main
Atualizado há 1 ano atrás por GitHub
main_fix
Atualizado há 3 anos atrás por justheuristic
measure-throughput
Atualizado há 3 anos atrás por Aleksandr Borzunov
measurements
Atualizado há 2 anos atrás por Your Name
memory_savings
Atualizado há 3 anos atrás por justheuristic
mockup
Atualizado há 3 anos atrás por justheuristic
multiple-experts
Atualizado há 3 anos atrás por justheuristic
no-cpufeature
Atualizado há 2 anos atrás por Aleksandr Borzunov
no_qkv_merge
Atualizado há 1 ano atrás por Max Ryabinin
optimize_seq
Atualizado há 3 anos atrás por justheuristic
partial_rollback
Atualizado há 1 ano atrás por Your Name
payload-size
Atualizado há 1 ano atrás por GitHub
petals-readme-title
Atualizado há 3 anos atrás por GitHub
pip-installable
Atualizado há 2 anos atrás por Aleksandr Borzunov
pip-installable-v2
Atualizado há 2 anos atrás por Aleksandr Borzunov
priority-tasks
Atualizado há 2 anos atrás por justheuristic
processing_attention
Atualizado há 2 anos atrás por Artem Chumachenko
prompt-inference
Atualizado há 3 anos atrás por Artem Chumachenko
prompt-tuning
Atualizado há 3 anos atrás por GitHub
ptune-example-personachat
Atualizado há 2 anos atrás por artek0chumak
ptune-wip
Atualizado há 3 anos atrás por justheuristic
pytest-verbose
Atualizado há 3 anos atrás por GitHub
qkv_merge
Atualizado há 1 ano atrás por Max Ryabinin
readme-clarifications
Atualizado há 2 anos atrás por justheuristic
readme-release
Atualizado há 3 anos atrás por GitHub
remove-remote-block
Atualizado há 3 anos atrás por justheuristic
rename-test-model
Atualizado há 3 anos atrás por GitHub
repetition-penalty
Atualizado há 2 anos atrás por Aleksandr Borzunov
rpc
Atualizado há 3 anos atrás por Dmitry Baranchuk
rtfd
Atualizado há 2 anos atrás por GitHub
sequence
Atualizado há 3 anos atrás por justheuristic
server-dtypes
Atualizado há 2 anos atrás por justheuristic
server-increase-startup-timeout
Atualizado há 2 anos atrás por GitHub
server-logging
Atualizado há 2 anos atrás por Aleksandr Borzunov
server-timeouts
Atualizado há 2 anos atrás por Aleksandr Borzunov
speculative_inference
Atualizado há 11 meses atrás por Your Name
speculative_test
Atualizado há 1 ano atrás por xtinkt
standardize
Atualizado há 3 anos atrás por justheuristic
step_metadata
Atualizado há 1 ano atrás por Your Name
support-backend-dtypes
Atualizado há 3 anos atrás por dbaranchuk
test-push
Atualizado há 3 anos atrás por justheuristic
test-with-jf160m
Atualizado há 1 ano atrás por Your Name
test_branch
Atualizado há 1 ano atrás por xtinkt
test_main
Atualizado há 1 ano atrás por Your Name
test_opt_serving
Atualizado há 2 anos atrás por Max Ryabinin
test_set_position
Atualizado há 1 ano atrás por GitHub
upd-deps
Atualizado há 2 anos atrás por justheuristic
update-bullet-points
Atualizado há 3 anos atrás por GitHub
update-hivemind
Atualizado há 2 anos atrás por Aleksandr Borzunov
update-model
Atualizado há 3 anos atrás por Dmitry Baranchuk
update-readme-disclaimers-faq
Atualizado há 3 anos atrás por GitHub
update-readme-pics
Atualizado há 3 anos atrás por GitHub
update_example_1
Atualizado há 2 anos atrás por Artem Chumachenko
vectorized_beam_search
Atualizado há 2 anos atrás por Artem Chumachenko
versions
Atualizado há 2 anos atrás por GitHub
warn-about-6b-instructions
Atualizado há 3 anos atrás por GitHub
wip_triton
Atualizado há 1 ano atrás por Max Ryabinin
yozh-dev-branch
Atualizado há 2 anos atrás por Just Heuristic