3 lat temu · c5493b9baf
--- a/arguments.py
+++ b/arguments.py
@@ -9,8 +9,8 @@ from transformers import TrainingArguments
 
															 class HFTrainerArguments(TrainingArguments):
														
 
															     """Arguments for huggingface/transformers.Trainer"""
														
 
															     dataloader_num_workers: int = 1
														
 
															-    per_device_train_batch_size: int = 1
														
 
															-    per_device_eval_batch_size: int = 1
														
 
															+    per_device_train_batch_size: int = 2
														
 
															+    per_device_eval_batch_size: int = 2
														
 
															     gradient_accumulation_steps: int = 1
														
 
															     text_seq_length: int = 256
														
--- a/data.py
+++ b/data.py
@@ -34,7 +34,7 @@ def preprocess_batch(batch, tokenizer, max_sequence_length: int):
 
															 def make_dataset(
														
 
															     tokenizer,
														
 
															     *,
														
 
															-    shuffle_buffer_size: int = 10 ** 4,
														
 
															+    shuffle_buffer_size: int = 8192,
														
 
															     shuffle_seed: Optional[int],
														
 
															     preprocessing_batch_size: int = 256,
														
 
															     max_sequence_length: int,