3 jaren geleden · c5493b9baf
--- a/arguments.py
+++ b/arguments.py
@@ -9,8 +9,8 @@ from transformers import TrainingArguments
 
				 class HFTrainerArguments(TrainingArguments):
			
 
				     """Arguments for huggingface/transformers.Trainer"""
			
 
				     dataloader_num_workers: int = 1
			
 
				-    per_device_train_batch_size: int = 1
			
 
				-    per_device_eval_batch_size: int = 1
			
 
				+    per_device_train_batch_size: int = 2
			
 
				+    per_device_eval_batch_size: int = 2
			
 
				     gradient_accumulation_steps: int = 1
			
 
				     text_seq_length: int = 256
			
 
				 
			
--- a/data.py
+++ b/data.py
@@ -34,7 +34,7 @@ def preprocess_batch(batch, tokenizer, max_sequence_length: int):
 
				 def make_dataset(
			
 
				     tokenizer,
			
 
				     *,
			
 
				-    shuffle_buffer_size: int = 10 ** 4,
			
 
				+    shuffle_buffer_size: int = 8192,
			
 
				     shuffle_seed: Optional[int],
			
 
				     preprocessing_batch_size: int = 256,
			
 
				     max_sequence_length: int,