silx-ai
/

QuasarV4-Tiny

infinity_former

Model card Files Files and versions

eyad-silx commited on Jun 20

Commit

7c99f7a

·

verified ·

1 Parent(s): 6551eef

Update config.json

Files changed (1) hide show

config.json +8 -3

config.json CHANGED Viewed

@@ -1,8 +1,13 @@
 {
-  "architectures": [
     "InfinityFormerForCausalLM"
   ],
   "attention_probs_dropout_prob": 0.1,
   "gate_init_bias": -2.0,
   "gradient_checkpointing_frequency": 1,
   "gradient_checkpointing_use_reentrant": true,
@@ -16,7 +21,7 @@
   "max_position_embeddings": 812,
   "memory_compression_frequency": 100,
   "memory_compression_ratio": 0.5,
-  "model_type": "infinityformer",
   "num_attention_heads": 12,
   "num_hidden_layers": 54,
   "num_memory_scales": 3,
@@ -27,7 +32,7 @@
   "use_gating": true,
   "use_gradient_checkpointing": false,
   "use_multi_scale_memory": true,
-  "use_return_dict": true,
   "use_rotary_embeddings": true,
   "vocab_size": 151669
 }

 {
+"architectures": [
     "InfinityFormerForCausalLM"
   ],
   "attention_probs_dropout_prob": 0.1,
+  "auto_map": {
+    "AutoConfig": "silx-ai/QuasarV4-Tiny--configuration_quasrav4.QuasraV4Config",
+    "AutoModelForCausalLM": "silx-ai/QuasarV4-Tiny--modeling_quasrav4.QuasraV4ForCausalLM"
+  },
   "gate_init_bias": -2.0,
   "gradient_checkpointing_frequency": 1,
   "gradient_checkpointing_use_reentrant": true,
   "max_position_embeddings": 812,
   "memory_compression_frequency": 100,
   "memory_compression_ratio": 0.5,
+  "model_type": "quasarv4",
   "num_attention_heads": 12,
   "num_hidden_layers": 54,
   "num_memory_scales": 3,
   "use_gating": true,
   "use_gradient_checkpointing": false,
   "use_multi_scale_memory": true,
   "use_rotary_embeddings": true,
   "vocab_size": 151669
 }