zerozeroz
/

Qwen2.5-Coder-7B

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

zerozeroz commited on Mar 27

Commit

3097beb

·

verified ·

1 Parent(s): f87c4cb

Model save

Files changed (4) hide show

all_results.json +4 -4
config.json +1 -1
train_results.json +4 -4
trainer_state.json +21 -8

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "total_flos": 0.0,
-    "train_loss": 2.596636219443127e-05,
-    "train_runtime": 4869.9523,
     "train_samples": 374,
-    "train_samples_per_second": 0.154,
-    "train_steps_per_second": 0.026
 }

 {
     "total_flos": 0.0,
+    "train_loss": 5.371543848591428e-07,
+    "train_runtime": 142.6302,
     "train_samples": 374,
+    "train_samples_per_second": 5.258,
+    "train_steps_per_second": 0.876
 }

config.json CHANGED Viewed

@@ -23,7 +23,7 @@
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.48.1",
-  "use_cache": false,
   "use_sliding_window": false,
   "vocab_size": 152064
 }

   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.48.1",
+  "use_cache": true,
   "use_sliding_window": false,
   "vocab_size": 152064
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "total_flos": 0.0,
-    "train_loss": 2.596636219443127e-05,
-    "train_runtime": 4869.9523,
     "train_samples": 374,
-    "train_samples_per_second": 0.154,
-    "train_steps_per_second": 0.026
 }

 {
     "total_flos": 0.0,
+    "train_loss": 5.371543848591428e-07,
+    "train_runtime": 142.6302,
     "train_samples": 374,
+    "train_samples_per_second": 5.258,
+    "train_steps_per_second": 0.876
 }

trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.992,
   "eval_steps": 500,
-  "global_step": 125,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1634,13 +1634,26 @@
       "step": 125
     },
     {
-      "epoch": 1.992,
-      "step": 125,
       "total_flos": 0.0,
-      "train_loss": 2.596636219443127e-05,
-      "train_runtime": 4869.9523,
-      "train_samples_per_second": 0.154,
-      "train_steps_per_second": 0.026
     }
   ],
   "logging_steps": 1,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 2.032,
   "eval_steps": 500,
+  "global_step": 126,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "step": 125
     },
     {
+      "completion_length": 70.72916984558105,
+      "epoch": 2.032,
+      "grad_norm": 0.921072382478298,
+      "kl": 0.067626953125,
+      "learning_rate": 8.425867412190091e-11,
+      "loss": 0.0001,
+      "reward": 0.8045242130756378,
+      "reward_std": 0.41052111983299255,
+      "rewards/correct_code_reward_func": 0.3750000149011612,
+      "rewards/len_reward_func": 0.42952418327331543,
+      "step": 126
+    },
+    {
+      "epoch": 2.032,
+      "step": 126,
       "total_flos": 0.0,
+      "train_loss": 5.371543848591428e-07,
+      "train_runtime": 142.6302,
+      "train_samples_per_second": 5.258,
+      "train_steps_per_second": 0.876
     }
   ],
   "logging_steps": 1,