8bit-model
Актуализирани преди 3 години от dbaranchuk
8bit_backward
Актуализирани преди 3 години от dbaranchuk
8bit_blocks
Актуализирани преди 3 години от Tim Dettmers
8bit_model_inference
Актуализирани преди 3 години от dbaranchuk
CI
Актуализирани преди 3 години от justheuristic
add-sst2-example
Актуализирани преди 2 години от Artem Chumachenko
amd-gpus
Актуализирани преди 2 години от GitHub
beamsearch
Актуализирани преди 2 години от Artem Chumachenko
beat-docker-into-submission
Актуализирани преди 2 години от GitHub
bnb-0-41-1
Актуализирани преди 2 години от GitHub
bootstrap-peers
Актуализирани преди 2 години от Aleksandr Borzunov
borzunov-patch-1
Актуализирани преди 2 години от GitHub
borzunov-patch-2
Актуализирани преди 2 години от GitHub
borzunov-patch-3
Актуализирани преди 1 година от GitHub
bump
Актуализирани преди 1 година от GitHub
cache
Актуализирани преди 2 години от GitHub
client
Актуализирани преди 3 години от justheuristic
client-attempt2
Актуализирани преди 3 години от justheuristic
client-convenience
Актуализирани преди 2 години от Aleksandr Borzunov
dbaranchuk-patch-1
Актуализирани преди 3 години от GitHub
debug-leak
Актуализирани преди 2 години от Your Name
declare_adapters
Актуализирани преди 2 години от Your Name
deep-prompt-tuning
Актуализирани преди 3 години от dbaranchuk
deep_prompt_inference
Актуализирани преди 2 години от justheuristic
demo-1
Актуализирани преди 3 години от justheuristic
diff
Актуализирани преди 3 години от justheuristic
diff-compression
Актуализирани преди 2 години от justheuristic
distributed-deep-ptune
Актуализирани преди 3 години от justheuristic
download_8bit_weights
Актуализирани преди 2 години от Max Ryabinin
efficient-forward-backward
Актуализирани преди 3 години от dbaranchuk
empty-weights
Актуализирани преди 2 години от Aleksandr Borzunov
enable-rebalancing
Актуализирани преди 2 години от Aleksandr Borzunov
examples_fix_hivemind
Актуализирани преди 2 години от GitHub
extract-module-container
Актуализирани преди 2 години от Aleksandr Borzunov
facelift
Актуализирани преди 3 години от justheuristic
fault-tolerant-inference
Актуализирани преди 2 години от Aleksandr Borzunov
fix-auth-token
Актуализирани преди 3 години от justheuristic
fix-branch-name
Актуализирани преди 3 години от GitHub
fix-cache
Актуализирани преди 3 години от justheuristic
fix-ci
Актуализирани преди 3 години от justheuristic
fix-convert-8bit
Актуализирани преди 3 години от dbaranchuk
fix-distr-seq-cls
Актуализирани преди 3 години от dbaranchuk
fix-docker
Актуализирани преди 1 година от GitHub
fix-inference-retry
Актуализирани преди 1 година от Aleksandr Borzunov
fix-joining-announce
Актуализирани преди 2 години от Aleksandr Borzunov
fix-master-ci
Актуализирани преди 3 години от GitHub
fix-nf4-and-dtypes
Актуализирани преди 2 години от Aleksandr Borzunov
fix-pb2
Актуализирани преди 2 години от justheuristic
fix-protobuf
Актуализирани преди 2 години от Aleksandr Borzunov
fix-ptune
Актуализирани преди 2 години от Aleksandr Borzunov
fix-readme
Актуализирани преди 2 години от justheuristic
fix-rebalancing-issues
Актуализирани преди 2 години от Aleksandr Borzunov
fix-requirements
Актуализирани преди 2 години от Aleksandr Borzunov
fix-seq-backward-recovery
Актуализирани преди 3 години от GitHub
fix-too-many-open-files
Актуализирани преди 2 години от Aleksandr Borzunov
fix3
Актуализирани преди 2 години от justheuristic
forward-backward-timeouts
Актуализирани преди 2 години от Aleksandr Borzunov
forward_backward
Актуализирани преди 1 година от Denis Mazur
forward_kwargs
Актуализирани преди 1 година от Your Name
friendly-timeout-errors
Актуализирани преди 2 години от Aleksandr Borzunov
generation
Актуализирани преди 3 години от Artem Chumachenko
generation-inference
Актуализирани преди 2 години от Artem Chumachenko
get_sequence
Актуализирани преди 3 години от justheuristic
hf_quantization_integration
Актуализирани преди 1 година от vahe1994
hivemind-1.1.4
Актуализирани преди 2 години от Aleksandr Borzunov
hivemind-dht-fork-process
Актуализирани преди 2 години от GitHub
hotfix_bnb
Актуализирани преди 2 години от justheuristic
inference_chain
Актуализирани преди 3 години от justheuristic
instruction-readability-style
Актуализирани преди 2 години от GitHub
investigate-segfault
Актуализирани преди 2 години от justheuristic
justheuristic-patch-1
Актуализирани преди 3 години от GitHub
justheuristic-patch-2
Актуализирани преди 3 години от GitHub
justheuristic-patch-3
Актуализирани преди 2 години от GitHub
justheuristic-patch-4
Актуализирани преди 2 години от GitHub
justheuristic-patch-5
Актуализирани преди 2 години от GitHub
lm_head
Актуализирани преди 3 години от GitHub
load-balancing
Актуализирани преди 3 години от Aleksandr Borzunov
lora_from_hub
Актуализирани преди 1 година от Artem Chumachenko
lru
Актуализирани преди 2 години от Your Name
main
Актуализирани преди 1 година от GitHub
main_fix
Актуализирани преди 3 години от justheuristic
measure-throughput
Актуализирани преди 3 години от Aleksandr Borzunov
measurements
Актуализирани преди 2 години от Your Name
memory_savings
Актуализирани преди 3 години от justheuristic
mockup
Актуализирани преди 3 години от justheuristic
multiple-experts
Актуализирани преди 3 години от justheuristic
no-cpufeature
Актуализирани преди 2 години от Aleksandr Borzunov
no_qkv_merge
Актуализирани преди 1 година от Max Ryabinin
optimize_seq
Актуализирани преди 3 години от justheuristic
partial_rollback
Актуализирани преди 1 година от Your Name
payload-size
Актуализирани преди 1 година от GitHub
petals-readme-title
Актуализирани преди 3 години от GitHub
pip-installable
Актуализирани преди 2 години от Aleksandr Borzunov
pip-installable-v2
Актуализирани преди 2 години от Aleksandr Borzunov
priority-tasks
Актуализирани преди 2 години от justheuristic
processing_attention
Актуализирани преди 2 години от Artem Chumachenko
prompt-inference
Актуализирани преди 3 години от Artem Chumachenko
prompt-tuning
Актуализирани преди 3 години от GitHub
ptune-example-personachat
Актуализирани преди 2 години от artek0chumak
ptune-wip
Актуализирани преди 3 години от justheuristic
pytest-verbose
Актуализирани преди 3 години от GitHub
qkv_merge
Актуализирани преди 1 година от Max Ryabinin
readme-clarifications
Актуализирани преди 2 години от justheuristic
readme-release
Актуализирани преди 3 години от GitHub
remove-remote-block
Актуализирани преди 3 години от justheuristic
rename-test-model
Актуализирани преди 3 години от GitHub
repetition-penalty
Актуализирани преди 2 години от Aleksandr Borzunov
rpc
Актуализирани преди 3 години от Dmitry Baranchuk
rtfd
Актуализирани преди 2 години от GitHub
sequence
Актуализирани преди 3 години от justheuristic
server-dtypes
Актуализирани преди 2 години от justheuristic
server-increase-startup-timeout
Актуализирани преди 2 години от GitHub
server-logging
Актуализирани преди 2 години от Aleksandr Borzunov
server-timeouts
Актуализирани преди 2 години от Aleksandr Borzunov
speculative_inference
Актуализирани преди 11 месеца от Your Name
speculative_test
Актуализирани преди 1 година от xtinkt
standardize
Актуализирани преди 3 години от justheuristic
step_metadata
Актуализирани преди 1 година от Your Name
support-backend-dtypes
Актуализирани преди 3 години от dbaranchuk
test-push
Актуализирани преди 3 години от justheuristic
test-with-jf160m
Актуализирани преди 1 година от Your Name
test_branch
Актуализирани преди 1 година от xtinkt
test_main
Актуализирани преди 1 година от Your Name
test_opt_serving
Актуализирани преди 2 години от Max Ryabinin
test_set_position
Актуализирани преди 1 година от GitHub
upd-deps
Актуализирани преди 2 години от justheuristic
update-bullet-points
Актуализирани преди 3 години от GitHub
update-hivemind
Актуализирани преди 2 години от Aleksandr Borzunov
update-model
Актуализирани преди 3 години от Dmitry Baranchuk
update-readme-disclaimers-faq
Актуализирани преди 3 години от GitHub
update-readme-pics
Актуализирани преди 3 години от GitHub
update_example_1
Актуализирани преди 2 години от Artem Chumachenko
vectorized_beam_search
Актуализирани преди 2 години от Artem Chumachenko
versions
Актуализирани преди 2 години от GitHub
warn-about-6b-instructions
Актуализирани преди 3 години от GitHub
wip_triton
Актуализирани преди 1 година от Max Ryabinin
yozh-dev-branch
Актуализирани преди 2 години от Just Heuristic