nvidia
/

parakeet-ctc-1.1b

Automatic Speech Recognition

hf-asr-leaderboard

Model card Files Files and versions

nithinraok commited on Jul 8

Commit

e576832

·

1 Parent(s): 085a3de

adding safetensor model

Signed-off-by: nithinraok <[email protected]>

Files changed (3) hide show

config.json +59 -0
model.safetensors +3 -0
preprocessor_config.json +21 -0

config.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+  "architectures": [
+    "FastConformerForCTC"
+  ],
+  "blank_token_id": 0,
+  "bos_token_id": 1,
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": true,
+  "eos_token_id": 2,
+  "fastconformer_config": {
+    "activation_dropout": 0.1,
+    "activation_function": "silu",
+    "architectures": [
+      "FastConformerModel"
+    ],
+    "attention_bias": false,
+    "attention_dropout": 0.1,
+    "conv_kernel_size": 9,
+    "d_model": 1024,
+    "dropout": 0.1,
+    "dropout_emb": 0.0,
+    "encoder_attention_heads": 8,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.1,
+    "encoder_layers": 42,
+    "head_dim": 128,
+    "hidden_act": "silu",
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "max_position_embeddings": 2048,
+    "mlp_bias": false,
+    "model_type": "fastconformer",
+    "nemo_decoder_type": "nemo.collections.asr.modules.ConvASRDecoder",
+    "nemo_encoder_type": "nemo.collections.asr.modules.ConformerEncoder",
+    "nemo_model_name": "nvidia/parakeet-ctc-1.1b",
+    "nemo_model_type": "parakeet",
+    "num_attention_heads": 8,
+    "num_hidden_layers": 42,
+    "num_key_value_heads": 8,
+    "num_mel_bins": 80,
+    "pretraining_tp": 1,
+    "rms_norm_eps": 1e-06,
+    "rope_scaling": null,
+    "rope_theta": 10000.0,
+    "subsampling_conv_channels": 256,
+    "subsampling_factor": 8,
+    "use_bias": true,
+    "use_cache": true,
+    "vocab_size": 1024,
+    "xscaling": true
+  },
+  "model_type": "fastconformer_for_ctc",
+  "pad_token_id": 0,
+  "torch_dtype": "float32",
+  "transformers_version": "4.53.0.dev0",
+  "vocab_size": 1025
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:55a59b38ff5e4773e5d836fb997e2b3529fe44406c86ba1d5009f1c29df06a3d
+size 4250700812

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "f_max": 8000,
+  "f_min": 0,
+  "feature_extractor_type": "FastConformerFeatureExtractor",
+  "feature_size": 80,
+  "hop_length": 160,
+  "mag_power": 2.0,
+  "mel_norm": "slaney",
+  "mel_scale": "htk",
+  "n_fft": 512,
+  "n_mels": 80,
+  "normalize": "per_feature",
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "preemph": 0.97,
+  "return_attention_mask": true,
+  "sampling_rate": 16000,
+  "win_length": 400,
+  "window_size": 0.025,
+  "window_stride": 0.01
+}