Training in progress, step 25

Files changed (7) hide show

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ffcae6fbcd3ab48ddb27ac36a4307ce80c23389ed305f6c13af21c3774251b28
-size 218196746

 version https://git-lfs.github.com/spec/v1
+oid sha256:5a65b50967390cfef35f29c0c558040200984c1dc16570052ecad9979dae852d
+size 872508554

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4507cecfab4aed7b850ede3e6b20862e39e7aafc5cefba9750cc95b8301e63a4
 size 872450448

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0db23340a233d6a10240667d8ba287a38e66b15ecd1d863fee3447be11638b8
 size 872450448

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 0.03,
-    "eval_loss": 1.1997405290603638,
-    "eval_runtime": 112.9062,
     "eval_samples": 650,
-    "eval_samples_per_second": 5.757,
-    "eval_steps_per_second": 1.444,
-    "train_loss": 1.4715181255340577,
-    "train_runtime": 335.1031,
     "train_samples": 5845,
-    "train_samples_per_second": 0.597,
-    "train_steps_per_second": 0.149
 }

 {
     "epoch": 0.03,
+    "eval_loss": 0.8876652717590332,
+    "eval_runtime": 113.1958,
     "eval_samples": 650,
+    "eval_samples_per_second": 5.742,
+    "eval_steps_per_second": 1.44,
+    "train_loss": 1.0970729541778566,
+    "train_runtime": 344.8794,
     "train_samples": 5845,
+    "train_samples_per_second": 0.58,
+    "train_steps_per_second": 0.145
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.03,
-    "eval_loss": 1.1997405290603638,
-    "eval_runtime": 112.9062,
     "eval_samples": 650,
-    "eval_samples_per_second": 5.757,
-    "eval_steps_per_second": 1.444
 }

 {
     "epoch": 0.03,
+    "eval_loss": 0.8876652717590332,
+    "eval_runtime": 113.1958,
     "eval_samples": 650,
+    "eval_samples_per_second": 5.742,
+    "eval_steps_per_second": 1.44
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.03,
-    "train_loss": 1.4715181255340577,
-    "train_runtime": 335.1031,
     "train_samples": 5845,
-    "train_samples_per_second": 0.597,
-    "train_steps_per_second": 0.149
 }

 {
     "epoch": 0.03,
+    "train_loss": 1.0970729541778566,
+    "train_runtime": 344.8794,
     "train_samples": 5845,
+    "train_samples_per_second": 0.58,
+    "train_steps_per_second": 0.145
 }

trainer_state.json CHANGED Viewed

@@ -17,64 +17,64 @@
     {
       "epoch": 0.01,
       "learning_rate": 2.838778253789822e-05,
-      "loss": 1.7137,
       "step": 10
     },
     {
       "epoch": 0.01,
       "learning_rate": 2.1314021436425026e-05,
-      "loss": 1.5219,
       "step": 20
     },
     {
       "epoch": 0.02,
-      "eval_loss": 1.2538621425628662,
-      "eval_runtime": 112.7562,
-      "eval_samples_per_second": 5.765,
-      "eval_steps_per_second": 1.446,
       "step": 25
     },
     {
       "epoch": 0.02,
       "learning_rate": 1.1522697745987076e-05,
-      "loss": 1.4272,
       "step": 30
     },
     {
       "epoch": 0.03,
       "learning_rate": 3.2280092208200853e-06,
-      "loss": 1.401,
       "step": 40
     },
     {
       "epoch": 0.03,
       "learning_rate": 0.0,
-      "loss": 1.3156,
       "step": 50
     },
     {
       "epoch": 0.03,
-      "eval_loss": 1.1997405290603638,
-      "eval_runtime": 113.4502,
-      "eval_samples_per_second": 5.729,
-      "eval_steps_per_second": 1.437,
       "step": 50
     },
     {
       "epoch": 0.03,
       "step": 50,
-      "total_flos": 3919242130882560.0,
-      "train_loss": 1.4715181255340577,
-      "train_runtime": 335.1031,
-      "train_samples_per_second": 0.597,
-      "train_steps_per_second": 0.149
     }
   ],
   "logging_steps": 10,
   "max_steps": 50,
   "num_train_epochs": 1,
   "save_steps": 25,
-  "total_flos": 3919242130882560.0,
   "trial_name": null,
   "trial_params": null
 }

     {
       "epoch": 0.01,
       "learning_rate": 2.838778253789822e-05,
+      "loss": 1.5421,
       "step": 10
     },
     {
       "epoch": 0.01,
       "learning_rate": 2.1314021436425026e-05,
+      "loss": 1.1665,
       "step": 20
     },
     {
       "epoch": 0.02,
+      "eval_loss": 0.9467611908912659,
+      "eval_runtime": 113.1765,
+      "eval_samples_per_second": 5.743,
+      "eval_steps_per_second": 1.44,
       "step": 25
     },
     {
       "epoch": 0.02,
       "learning_rate": 1.1522697745987076e-05,
+      "loss": 0.9964,
       "step": 30
     },
     {
       "epoch": 0.03,
       "learning_rate": 3.2280092208200853e-06,
+      "loss": 0.9493,
       "step": 40
     },
     {
       "epoch": 0.03,
       "learning_rate": 0.0,
+      "loss": 0.8357,
       "step": 50
     },
     {
       "epoch": 0.03,
+      "eval_loss": 0.8876652717590332,
+      "eval_runtime": 114.0148,
+      "eval_samples_per_second": 5.701,
+      "eval_steps_per_second": 1.43,
       "step": 50
     },
     {
       "epoch": 0.03,
       "step": 50,
+      "total_flos": 4008716634423296.0,
+      "train_loss": 1.0970729541778566,
+      "train_runtime": 344.8794,
+      "train_samples_per_second": 0.58,
+      "train_steps_per_second": 0.145
     }
   ],
   "logging_steps": 10,
   "max_steps": 50,
   "num_train_epochs": 1,
   "save_steps": 25,
+  "total_flos": 4008716634423296.0,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf7b7d3708042371320e5cc19f2093931cd4f9e404337a086c3d1743671d6c8a
 size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce4fc530190fc50faa5c41b7996377ae6495a8c82a8243129b1546cca66170e8
 size 4664