Training in progress, step 64000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +297 -5

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4431a569e16eb6669f33895a534eefcadcc6125a0fcf8243e551a17cbe6b776e
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:926ed83f6e74d30dd04cd576ac59c6374f40022ad71666f1151acf89ef6a727f
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b5c6c8f3d8741838a0a0349b3de3a3bd22b9e28163b525970af04b332fd7c349
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:63b80956cda8d577cf7bfd206ddcea2443accc461272fcb58c947316dd066ab0
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7dc3fe5842c642250bc8fc58f8686955286eff74353ef4cfdb5c91b975ca0c5b
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:c8a9e9fcdb822872caeabe3003c6e6517d9f7eeb88433b860fc3482c1c47480d
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:31d1175317fe37be2b1293cac47d5356f1e200c454ceace1ce4e9dd0eded0aa5
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:1da3ebf38e6de5f93a849d5bb335be74fb8ae94c32eaa092e9a693e9450f5852
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d63d134ebc965a606838bb6f037c88484af3b1856e8a790a7b2291b1079013ce
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:f0f4b19a41457d0a78e68093b636e25cec379bf5b743c5d43b46b713a83c2f2b
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -2,9 +2,9 @@
   "best_global_step": 52000,
   "best_metric": 0.9908199660129274,
   "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-52000",
-  "epoch": 1.92,
   "eval_steps": 4000,
-  "global_step": 60000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4388,6 +4388,298 @@
       "eval_samples_per_second": 130.728,
       "eval_steps_per_second": 8.171,
       "step": 60000
     }
   ],
   "logging_steps": 100,
@@ -4402,7 +4694,7 @@
         "early_stopping_threshold": 0.0
       },
       "attributes": {
-        "early_stopping_patience_counter": 2
       }
     },
     "TrainerControl": {
@@ -4411,12 +4703,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 2.5479625112655552e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

   "best_global_step": 52000,
   "best_metric": 0.9908199660129274,
   "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-52000",
+  "epoch": 2.048,
   "eval_steps": 4000,
+  "global_step": 64000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 130.728,
       "eval_steps_per_second": 8.171,
       "step": 60000
+    },
+    {
+      "epoch": 1.9232,
+      "grad_norm": 0.016066577285528183,
+      "learning_rate": 1.2346837881219905e-05,
+      "loss": 0.0324,
+      "step": 60100
+    },
+    {
+      "epoch": 1.9264000000000001,
+      "grad_norm": 1.0818510055541992,
+      "learning_rate": 1.2333996789727128e-05,
+      "loss": 0.0333,
+      "step": 60200
+    },
+    {
+      "epoch": 1.9296,
+      "grad_norm": 1.9333336353302002,
+      "learning_rate": 1.2321155698234351e-05,
+      "loss": 0.0465,
+      "step": 60300
+    },
+    {
+      "epoch": 1.9327999999999999,
+      "grad_norm": 0.015184523537755013,
+      "learning_rate": 1.2308314606741574e-05,
+      "loss": 0.031,
+      "step": 60400
+    },
+    {
+      "epoch": 1.936,
+      "grad_norm": 3.1265370845794678,
+      "learning_rate": 1.2295473515248797e-05,
+      "loss": 0.0265,
+      "step": 60500
+    },
+    {
+      "epoch": 1.9392,
+      "grad_norm": 0.06526759266853333,
+      "learning_rate": 1.228263242375602e-05,
+      "loss": 0.0396,
+      "step": 60600
+    },
+    {
+      "epoch": 1.9424000000000001,
+      "grad_norm": 0.051179856061935425,
+      "learning_rate": 1.2269791332263244e-05,
+      "loss": 0.0457,
+      "step": 60700
+    },
+    {
+      "epoch": 1.9456,
+      "grad_norm": 0.012131915427744389,
+      "learning_rate": 1.2256950240770467e-05,
+      "loss": 0.0377,
+      "step": 60800
+    },
+    {
+      "epoch": 1.9487999999999999,
+      "grad_norm": 6.335480690002441,
+      "learning_rate": 1.224410914927769e-05,
+      "loss": 0.0378,
+      "step": 60900
+    },
+    {
+      "epoch": 1.952,
+      "grad_norm": 0.6301658749580383,
+      "learning_rate": 1.2231268057784913e-05,
+      "loss": 0.0442,
+      "step": 61000
+    },
+    {
+      "epoch": 1.9552,
+      "grad_norm": 0.3388197124004364,
+      "learning_rate": 1.2218426966292136e-05,
+      "loss": 0.0489,
+      "step": 61100
+    },
+    {
+      "epoch": 1.9584000000000001,
+      "grad_norm": 0.007041617762297392,
+      "learning_rate": 1.220558587479936e-05,
+      "loss": 0.0384,
+      "step": 61200
+    },
+    {
+      "epoch": 1.9616,
+      "grad_norm": 0.10959050804376602,
+      "learning_rate": 1.2192744783306582e-05,
+      "loss": 0.0463,
+      "step": 61300
+    },
+    {
+      "epoch": 1.9647999999999999,
+      "grad_norm": 3.765045642852783,
+      "learning_rate": 1.2179903691813806e-05,
+      "loss": 0.043,
+      "step": 61400
+    },
+    {
+      "epoch": 1.968,
+      "grad_norm": 2.442903757095337,
+      "learning_rate": 1.2167062600321029e-05,
+      "loss": 0.0431,
+      "step": 61500
+    },
+    {
+      "epoch": 1.9712,
+      "grad_norm": 3.0291242599487305,
+      "learning_rate": 1.2154221508828252e-05,
+      "loss": 0.0439,
+      "step": 61600
+    },
+    {
+      "epoch": 1.9744000000000002,
+      "grad_norm": 0.1264086663722992,
+      "learning_rate": 1.2141380417335475e-05,
+      "loss": 0.029,
+      "step": 61700
+    },
+    {
+      "epoch": 1.9776,
+      "grad_norm": 0.09380912035703659,
+      "learning_rate": 1.2128539325842698e-05,
+      "loss": 0.05,
+      "step": 61800
+    },
+    {
+      "epoch": 1.9808,
+      "grad_norm": 0.012730620801448822,
+      "learning_rate": 1.211569823434992e-05,
+      "loss": 0.0235,
+      "step": 61900
+    },
+    {
+      "epoch": 1.984,
+      "grad_norm": 0.04120282083749771,
+      "learning_rate": 1.2102857142857143e-05,
+      "loss": 0.0342,
+      "step": 62000
+    },
+    {
+      "epoch": 1.9872,
+      "grad_norm": 0.22701594233512878,
+      "learning_rate": 1.2090016051364366e-05,
+      "loss": 0.0499,
+      "step": 62100
+    },
+    {
+      "epoch": 1.9904,
+      "grad_norm": 0.005121626891195774,
+      "learning_rate": 1.2077174959871589e-05,
+      "loss": 0.0223,
+      "step": 62200
+    },
+    {
+      "epoch": 1.9936,
+      "grad_norm": 4.5423583984375,
+      "learning_rate": 1.2064333868378812e-05,
+      "loss": 0.0351,
+      "step": 62300
+    },
+    {
+      "epoch": 1.9968,
+      "grad_norm": 0.6799706816673279,
+      "learning_rate": 1.2051492776886035e-05,
+      "loss": 0.0374,
+      "step": 62400
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 0.4670400023460388,
+      "learning_rate": 1.2038651685393258e-05,
+      "loss": 0.0389,
+      "step": 62500
+    },
+    {
+      "epoch": 2.0032,
+      "grad_norm": 0.0014514782233163714,
+      "learning_rate": 1.2025810593900481e-05,
+      "loss": 0.0407,
+      "step": 62600
+    },
+    {
+      "epoch": 2.0064,
+      "grad_norm": 10.322093963623047,
+      "learning_rate": 1.2012969502407705e-05,
+      "loss": 0.0364,
+      "step": 62700
+    },
+    {
+      "epoch": 2.0096,
+      "grad_norm": 0.7346168160438538,
+      "learning_rate": 1.2000128410914928e-05,
+      "loss": 0.063,
+      "step": 62800
+    },
+    {
+      "epoch": 2.0128,
+      "grad_norm": 15.471858978271484,
+      "learning_rate": 1.1987287319422153e-05,
+      "loss": 0.0365,
+      "step": 62900
+    },
+    {
+      "epoch": 2.016,
+      "grad_norm": 0.22428256273269653,
+      "learning_rate": 1.1974446227929376e-05,
+      "loss": 0.0437,
+      "step": 63000
+    },
+    {
+      "epoch": 2.0192,
+      "grad_norm": 5.6665849685668945,
+      "learning_rate": 1.1961605136436599e-05,
+      "loss": 0.0448,
+      "step": 63100
+    },
+    {
+      "epoch": 2.0224,
+      "grad_norm": 0.011902675963938236,
+      "learning_rate": 1.1948764044943822e-05,
+      "loss": 0.0309,
+      "step": 63200
+    },
+    {
+      "epoch": 2.0256,
+      "grad_norm": 0.01199142262339592,
+      "learning_rate": 1.1935922953451045e-05,
+      "loss": 0.0181,
+      "step": 63300
+    },
+    {
+      "epoch": 2.0288,
+      "grad_norm": 0.2028602510690689,
+      "learning_rate": 1.1923081861958268e-05,
+      "loss": 0.0433,
+      "step": 63400
+    },
+    {
+      "epoch": 2.032,
+      "grad_norm": 0.05186166614294052,
+      "learning_rate": 1.1910240770465491e-05,
+      "loss": 0.0349,
+      "step": 63500
+    },
+    {
+      "epoch": 2.0352,
+      "grad_norm": 8.039327621459961,
+      "learning_rate": 1.1897399678972715e-05,
+      "loss": 0.0447,
+      "step": 63600
+    },
+    {
+      "epoch": 2.0384,
+      "grad_norm": 0.013709252700209618,
+      "learning_rate": 1.1884558587479938e-05,
+      "loss": 0.0264,
+      "step": 63700
+    },
+    {
+      "epoch": 2.0416,
+      "grad_norm": 0.12741540372371674,
+      "learning_rate": 1.187171749598716e-05,
+      "loss": 0.0285,
+      "step": 63800
+    },
+    {
+      "epoch": 2.0448,
+      "grad_norm": 38.967525482177734,
+      "learning_rate": 1.1858876404494384e-05,
+      "loss": 0.0406,
+      "step": 63900
+    },
+    {
+      "epoch": 2.048,
+      "grad_norm": 10.748799324035645,
+      "learning_rate": 1.1846035313001607e-05,
+      "loss": 0.0358,
+      "step": 64000
+    },
+    {
+      "epoch": 2.048,
+      "eval_accuracy": 0.99072,
+      "eval_f1": 0.9907211797405157,
+      "eval_loss": 0.038402359932661057,
+      "eval_precision": 0.990739513426471,
+      "eval_recall": 0.99072,
+      "eval_runtime": 764.7435,
+      "eval_samples_per_second": 130.763,
+      "eval_steps_per_second": 8.173,
+      "step": 64000
     }
   ],
   "logging_steps": 100,
         "early_stopping_threshold": 0.0
       },
       "attributes": {
+        "early_stopping_patience_counter": 3
       }
     },
     "TrainerControl": {
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 2.7177787451207846e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

Training in progress, step 64000, checkpoint

🎉 Free Image Generator Now Available!