sapientinc
/

HRM-checkpoint-ARC-2

Model card Files Files and versions Community

imone commited on Jul 21

Commit

ee2c595

·

verified ·

1 Parent(s): e11817d

Upload folder using huggingface_hub

Files changed (3) hide show

.gitattributes +1 -0
all_config.yaml +35 -0
checkpoint +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+checkpoint filter=lfs diff=lfs merge=lfs -text

all_config.yaml ADDED Viewed

	@@ -0,0 +1,35 @@

+arch:
+  H_cycles: 2
+  H_layers: 4
+  L_cycles: 2
+  L_layers: 4
+  expansion: 4
+  halt_exploration_prob: 0.1
+  halt_max_steps: 16
+  hidden_size: 512
+  loss:
+    loss_type: stablemax_cross_entropy
+    name: losses@ACTLossHead
+  name: hrm.hrm_act_v1@HierarchicalReasoningModel_ACTV1
+  num_heads: 8
+  pos_encodings: rope
+  puzzle_emb_ndim: 512
+beta1: 0.9
+beta2: 0.95
+checkpoint_every_eval: true
+checkpoint_path: checkpoints/Arc-2-aug-1000 ACT-torch/HierarchicalReasoningModel_ACTV1
+  bright-mustang
+data_path: data/arc-2-aug-1000
+epochs: 100000
+eval_interval: 10000
+eval_save_outputs: []
+global_batch_size: 768
+lr: 0.0001
+lr_min_ratio: 1.0
+lr_warmup_steps: 2000
+project_name: Arc-2-aug-1000 ACT-torch
+puzzle_emb_lr: 0.01
+puzzle_emb_weight_decay: 0.1
+run_name: HierarchicalReasoningModel_ACTV1 bright-mustang
+seed: 0
+weight_decay: 0.1

checkpoint ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:58719e51da6cd7712eb4197f908fbfdc88403ee48c42a3a92bab9f9c968df64d
+size 2250983821