hllj
/

non-qa-sft-zephyr-7b-beta-v1

@@ -1,13 +1,13 @@
 {
     "epoch": 0.03,
     "eval_loss": 0.8876652717590332,
-    "eval_runtime": 113.7341,
     "eval_samples": 650,
-    "eval_samples_per_second": 5.715,
     "eval_steps_per_second": 1.433,
     "train_loss": 1.0970729541778566,
-    "train_runtime": 357.3025,
     "train_samples": 5845,
-    "train_samples_per_second": 0.56,
-    "train_steps_per_second": 0.14
 }

 {
     "epoch": 0.03,
     "eval_loss": 0.8876652717590332,
+    "eval_runtime": 113.7754,
     "eval_samples": 650,
+    "eval_samples_per_second": 5.713,
     "eval_steps_per_second": 1.433,
     "train_loss": 1.0970729541778566,
+    "train_runtime": 345.3617,
     "train_samples": 5845,
+    "train_samples_per_second": 0.579,
+    "train_steps_per_second": 0.145
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.03,
     "eval_loss": 0.8876652717590332,
-    "eval_runtime": 113.7341,
     "eval_samples": 650,
-    "eval_samples_per_second": 5.715,
     "eval_steps_per_second": 1.433
 }

 {
     "epoch": 0.03,
     "eval_loss": 0.8876652717590332,
+    "eval_runtime": 113.7754,
     "eval_samples": 650,
+    "eval_samples_per_second": 5.713,
     "eval_steps_per_second": 1.433
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.03,
     "train_loss": 1.0970729541778566,
-    "train_runtime": 357.3025,
     "train_samples": 5845,
-    "train_samples_per_second": 0.56,
-    "train_steps_per_second": 0.14
 }

 {
     "epoch": 0.03,
     "train_loss": 1.0970729541778566,
+    "train_runtime": 345.3617,
     "train_samples": 5845,
+    "train_samples_per_second": 0.579,
+    "train_steps_per_second": 0.145
 }

trainer_state.json CHANGED Viewed

@@ -29,8 +29,8 @@
     {
       "epoch": 0.02,
       "eval_loss": 0.9467611908912659,
-      "eval_runtime": 113.3606,
-      "eval_samples_per_second": 5.734,
       "eval_steps_per_second": 1.438,
       "step": 25
     },
@@ -55,7 +55,7 @@
     {
       "epoch": 0.03,
       "eval_loss": 0.8876652717590332,
-      "eval_runtime": 114.0086,
       "eval_samples_per_second": 5.701,
       "eval_steps_per_second": 1.43,
       "step": 50
@@ -65,9 +65,9 @@
       "step": 50,
       "total_flos": 4008716634423296.0,
       "train_loss": 1.0970729541778566,
-      "train_runtime": 357.3025,
-      "train_samples_per_second": 0.56,
-      "train_steps_per_second": 0.14
     }
   ],
   "logging_steps": 10,

     {
       "epoch": 0.02,
       "eval_loss": 0.9467611908912659,
+      "eval_runtime": 113.3365,
+      "eval_samples_per_second": 5.735,
       "eval_steps_per_second": 1.438,
       "step": 25
     },
     {
       "epoch": 0.03,
       "eval_loss": 0.8876652717590332,
+      "eval_runtime": 114.0209,
       "eval_samples_per_second": 5.701,
       "eval_steps_per_second": 1.43,
       "step": 50
       "step": 50,
       "total_flos": 4008716634423296.0,
       "train_loss": 1.0970729541778566,
+      "train_runtime": 345.3617,
+      "train_samples_per_second": 0.579,
+      "train_steps_per_second": 0.145
     }
   ],
   "logging_steps": 10,