BluebrainAI
/

rotating-head-gp-gpt2-medium-wikitext

Feature Extraction

rotating-head-gpt2

Generated from Trainer

Model card Files Files and versions

shivanandmn commited on Mar 18

Commit

8ffbf38

·

verified ·

1 Parent(s): c98c6b3

Model save

Files changed (4) hide show

all_results.json +3 -3
train_results.json +3 -3
trainer_state.json +3 -3
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -11,7 +11,7 @@
     "perplexity": 24.39002046460787,
     "total_flos": 1.0587061010143642e+18,
     "train_loss": 0.0,
-    "train_runtime": 0.6657,
-    "train_samples_per_second": 856247.444,
-    "train_steps_per_second": 13385.204
 }

     "perplexity": 24.39002046460787,
     "total_flos": 1.0587061010143642e+18,
     "train_loss": 0.0,
+    "train_runtime": 0.6897,
+    "train_samples_per_second": 826370.638,
+    "train_steps_per_second": 12918.158
 }

train_results.json CHANGED Viewed

@@ -2,7 +2,7 @@
     "epoch": 5.0,
     "total_flos": 1.0587061010143642e+18,
     "train_loss": 0.0,
-    "train_runtime": 0.6657,
-    "train_samples_per_second": 856247.444,
-    "train_steps_per_second": 13385.204
 }

     "epoch": 5.0,
     "total_flos": 1.0587061010143642e+18,
     "train_loss": 0.0,
+    "train_runtime": 0.6897,
+    "train_samples_per_second": 826370.638,
+    "train_steps_per_second": 12918.158
 }

trainer_state.json CHANGED Viewed

@@ -823,9 +823,9 @@
       "step": 8910,
       "total_flos": 1.0587061010143642e+18,
       "train_loss": 0.0,
-      "train_runtime": 0.6657,
-      "train_samples_per_second": 856247.444,
-      "train_steps_per_second": 13385.204
     }
   ],
   "logging_steps": 100,

       "step": 8910,
       "total_flos": 1.0587061010143642e+18,
       "train_loss": 0.0,
+      "train_runtime": 0.6897,
+      "train_samples_per_second": 826370.638,
+      "train_steps_per_second": 12918.158
     }
   ],
   "logging_steps": 100,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f310d1f2acbf9b789d07f19240d1ba587465af941995b095af8542bac8d1d00e
 size 5560

 version https://git-lfs.github.com/spec/v1
+oid sha256:b64acc06a54753e3c90d36e5fc570d0909cca6d16e044cd9018ae585d3fb3c51
 size 5560