Merge pull request #16 from ROCmSoftwarePlatform/adabeyta_update_hf_training

amathews-amd · web-flow · commit 24b288f43fbf · 2022-09-09T08:41:44.000-05:00
Removed hardcoded warmup steps.
diff --git a/src/transformers/trainer.py b/src/transformers/trainer.py
@@ -1876,8 +1876,8 @@ def _inner_training_loop(
 
         metrics = speed_metrics("train", start_time, num_samples=num_train_samples, num_steps=self.state.max_steps)
 
-        total_samples = args.max_steps*total_train_batch_size if args.max_steps > 0  else num_examples*num_train_epochs
-        perf_samples = total_samples - 10*total_train_batch_size
+        total_samples = self.state.global_step*total_train_batch_size if args.max_steps > 0 else num_examples*num_train_epochs
+        perf_samples = total_samples - self.args.warmup_steps*total_train_batch_size
         stable_train_metrics = speed_metrics("stable_train", start_train_stable_time, perf_samples)
 
         self.store_flos()
diff --git a/src/transformers/training_args.py b/src/transformers/training_args.py
@@ -568,7 +568,7 @@ class TrainingArguments:
     warmup_ratio: float = field(
         default=0.0, metadata={"help": "Linear warmup over warmup_ratio fraction of total steps."}
     )
-    warmup_steps: int = field(default=0, metadata={"help": "Linear warmup over warmup_steps."})
+    warmup_steps: int = field(default=10, metadata={"help": "Linear warmup over warmup_steps."})
 
     log_level: Optional[str] = field(
         default="passive",

Original file line number	Diff line number	Diff line change
`@@ -568,7 +568,7 @@ class TrainingArguments:`
`568`	`568`	`warmup_ratio: float = field(`
`569`	`569`	`default=0.0, metadata={"help": "Linear warmup over warmup_ratio fraction of total steps."}`
`570`	`570`	`)`
`571`		`- warmup_steps: int = field(default=0, metadata={"help": "Linear warmup over warmup_steps."})`
	`571`	`+ warmup_steps: int = field(default=10, metadata={"help": "Linear warmup over warmup_steps."})`
`572`	`572`
`573`	`573`	`log_level: Optional[str] = field(`
`574`	`574`	`default="passive",`