Upload folder using huggingface_hub

Files changed (6) hide show

args.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "batch_size": 2,
-  "accum_iter": 8,
   "epochs": 2,
   "warmup_epochs": 0.001,
   "lr": 0.0002,
@@ -8,25 +8,25 @@
   "wd": 0.1,
   "clip_grad": 4.0,
   "init_from": null,
-  "data_config": "/mnt/petrelfs/xinyi/synbol/Lumina-MDDM/configs/data.yaml",
   "cache_ann_on_disk": true,
   "length_clustering": true,
   "num_workers": 16,
   "pin_mem": true,
   "seed": 0,
-  "output_dir": "output/Lumina-MDDM-8B-Joint-bs1024-lr2e-4-randomm01_mask-pretraining-stage1-final",
   "save_interval": 1,
-  "save_iteration_interval": 10000,
   "only_save_trainable": false,
   "ckpt_max_keep": 2,
   "auto_resume": true,
-  "resume_path": "/mnt/petrelfs/xinyi/synbol/Lumina-MDDM/output/Lumina-MDDM-8B-Joint-bs1024-lr2e-4-random01_mask-pretraining-stage1-final/epoch0-iter129999",
   "model_parallel_size": 1,
   "data_parallel": "sdp",
   "precision": "bf16",
   "grad_precision": "fp32",
   "checkpointing": false,
-  "max_seq_len": 1344,
   "mask_image_logits": false,
   "dropout": 0.05,
   "z_loss_weight": 1e-05,

 {
+  "batch_size": 4,
+  "accum_iter": 4,
   "epochs": 2,
   "warmup_epochs": 0.001,
   "lr": 0.0002,
   "wd": 0.1,
   "clip_grad": 4.0,
   "init_from": null,
+  "data_config": "/mnt/petrelfs/xinyi/synbol_code/Lumina-MDDM/configs/data.yaml",
   "cache_ann_on_disk": true,
   "length_clustering": true,
   "num_workers": 16,
   "pin_mem": true,
   "seed": 0,
+  "output_dir": "output/Lumina-MDDM-8B-Joint-bs1024-lr2e-4-randomm01_mask-pretraining-stage2-512-T",
   "save_interval": 1,
+  "save_iteration_interval": 5000,
   "only_save_trainable": false,
   "ckpt_max_keep": 2,
   "auto_resume": true,
+  "resume_path": "/mnt/petrelfs/xinyi/synbol_code/Lumina-MDDM/output/Lumina-MDDM-8B-Joint-bs1024-lr2e-4-randomm01_mask-pretraining-stage2/epoch0-iter59999",
   "model_parallel_size": 1,
   "data_parallel": "sdp",
   "precision": "bf16",
   "grad_precision": "fp32",
   "checkpointing": false,
+  "max_seq_len": 2048,
   "mask_image_logits": false,
   "dropout": 0.05,
   "z_loss_weight": 1e-05,

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "/mnt/petrelfs/xinyi/synbol/Lumina-MDDM/output/Lumina-MDDM-8B-Joint-bs1024-lr2e-4-random01_mask-pretraining-stage1-final/epoch0-iter129999",
   "activation_type": "silu",
   "alibi": false,
   "alibi_bias_max": 8.0,

 {
+  "_name_or_path": "/mnt/petrelfs/xinyi/synbol_code/Lumina-MDDM/output/Lumina-MDDM-8B-Joint-bs1024-lr2e-4-randomm01_mask-pretraining-stage2/epoch0-iter59999",
   "activation_type": "silu",
   "alibi": false,
   "alibi_bias_max": 8.0,

model-00001-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4328276ab22bead0feb684bce6fb0edf965ec53845ab7810ff5ecbc2349885a5
+size 4927587832

model-00002-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6be25d7f27214ccbeb3cdb2179e26a9cbfac05b5c739fba8a16ed9b4d371a3f6
+size 4932693832

model-00003-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:34cd45fe298c104e0f21f1c6a83b95a7b98a5a91a8e8fe1254b0ee505db81955
+size 4999819560

model-00004-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6eb3e4dc080813b648cf501a600352fe60faa87529f7423e0a245d01f3b85976
+size 1303544192