razhan
/

whisper-small-me

@@ -16,35 +16,23 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [openai/whisper-small](https://huggingface.co/openai/whisper-small) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.4680
-- Mazanderani Bleu: 0.0
-- Mazanderani Chrf: 0.0
-- Mazanderani Wer: 0.9419
-- Mazanderani Cer: 0.4586
-- Gilaki Bleu: 0.0
-- Gilaki Chrf: 0.0
-- Gilaki Wer: 0.9789
-- Gilaki Cer: 0.4864
-- Zazaki Bleu: 0.0
-- Zazaki Chrf: 0.0
-- Zazaki Wer: 1.0074
-- Zazaki Cer: 0.8905
-- Laki Kurdish Bleu: 0.0
-- Laki Kurdish Chrf: 0.0
-- Laki Kurdish Wer: 0.6814
-- Laki Kurdish Cer: 0.2116
-- Talysh Bleu: 0.0
-- Talysh Chrf: 0.0
 - Talysh Wer: 1.0
 - Talysh Cer: 0.5
-- Hawrami Bleu: 0.0
-- Hawrami Chrf: 0.0
-- Hawrami Wer: 0.3160
-- Hawrami Cer: 0.0656
-- Southern Kurdish Bleu: 0.0
-- Southern Kurdish Chrf: 0.0
-- Southern Kurdish Wer: 0.6534
-- Southern Kurdish Cer: 0.2319
 ## Model description
@@ -64,23 +52,28 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
-- train_batch_size: 64
-- eval_batch_size: 32
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- lr_scheduler_warmup_steps: 10
-- num_epochs: 4.0
 - mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Mazanderani Bleu | Mazanderani Chrf | Mazanderani Wer | Mazanderani Cer | Gilaki Bleu | Gilaki Chrf | Gilaki Wer | Gilaki Cer | Zazaki Bleu | Zazaki Chrf | Zazaki Wer | Zazaki Cer | Laki Kurdish Bleu | Laki Kurdish Chrf | Laki Kurdish Wer | Laki Kurdish Cer | Talysh Bleu | Talysh Chrf | Talysh Wer | Talysh Cer | Hawrami Bleu | Hawrami Chrf | Hawrami Wer | Hawrami Cer | Southern Kurdish Bleu | Southern Kurdish Chrf | Southern Kurdish Wer | Southern Kurdish Cer |
-|:-------------:|:-----:|:----:|:---------------:|:----------------:|:----------------:|:---------------:|:---------------:|:-----------:|:-----------:|:----------:|:----------:|:-----------:|:-----------:|:----------:|:----------:|:-----------------:|:-----------------:|:----------------:|:----------------:|:-----------:|:-----------:|:----------:|:----------:|:------------:|:------------:|:-----------:|:-----------:|:---------------------:|:---------------------:|:--------------------:|:--------------------:|
-| 1.1637        | 1.0   | 653  | 1.5382          | 0.0              | 0.0              | 0.9516          | 0.4696          | 0.0         | 0.0         | 0.9719     | 0.4789     | 0.0         | 0.0         | 1.0147     | 0.8900     | 0.0               | 0.0               | 0.7374           | 0.2241           | 0.0         | 0.0         | 1.0        | 0.5        | 0.0          | 0.0          | 0.3587      | 0.0754      | 0.0                   | 0.0                   | 0.6440               | 0.2060               |
-| 0.9336        | 2.0   | 1306 | 1.4697          | 0.0              | 0.0              | 0.9485          | 0.4687          | 0.0         | 0.0         | 0.9729     | 0.4833     | 0.0         | 0.0         | 1.0098     | 0.8910     | 0.0               | 0.0               | 0.7051           | 0.2182           | 0.0         | 0.0         | 1.0        | 0.5        | 0.0          | 0.0          | 0.3318      | 0.0690      | 0.0                   | 0.0                   | 0.6282               | 0.2022               |
-| 0.4965        | 3.0   | 1959 | 1.4548          | 0.0              | 0.0              | 0.9440          | 0.4593          | 0.0         | 0.0         | 0.9794     | 0.4867     | 0.0         | 0.0         | 1.0049     | 0.8941     | 0.0               | 0.0               | 0.6904           | 0.2173           | 0.0         | 0.0         | 1.0        | 0.5        | 0.0          | 0.0          | 0.3227      | 0.0681      | 0.0                   | 0.0                   | 0.6381               | 0.2090               |
-| 0.5566        | 4.0   | 2612 | 1.4680          | 0.0              | 0.0              | 0.9419          | 0.4586          | 0.0         | 0.0         | 0.9789     | 0.4864     | 0.0         | 0.0         | 1.0074     | 0.8905     | 0.0               | 0.0               | 0.6814           | 0.2116           | 0.0         | 0.0         | 1.0        | 0.5        | 0.0          | 0.0          | 0.3160      | 0.0656      | 0.0                   | 0.0                   | 0.6534               | 0.2319               |
 ### Framework versions

 This model is a fine-tuned version of [openai/whisper-small](https://huggingface.co/openai/whisper-small) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4509
+- Mazanderani Wer: 0.5278
+- Mazanderani Cer: 0.1615
+- Gilaki Wer: 0.9176
+- Gilaki Cer: 0.3175
+- Zazaki Wer: 0.6324
+- Zazaki Cer: 0.2020
+- Laki Kurdish Wer: 0.4904
+- Laki Kurdish Cer: 0.1247
 - Talysh Wer: 1.0
 - Talysh Cer: 0.5
+- Hawrami Wer: 0.3459
+- Hawrami Cer: 0.0708
+- Southern Kurdish Wer: 0.4930
+- Southern Kurdish Cer: 0.1718
+- Avg Wer: 0.6296
+- Avg Cer: 0.2212
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
+- train_batch_size: 128
+- eval_batch_size: 128
 - seed: 42
+- distributed_type: multi-GPU
+- num_devices: 2
+- total_train_batch_size: 256
+- total_eval_batch_size: 256
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 100
+- num_epochs: 5.0
 - mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Mazanderani Wer | Mazanderani Cer | Gilaki Wer | Gilaki Cer | Zazaki Wer | Zazaki Cer | Laki Kurdish Wer | Laki Kurdish Cer | Talysh Wer | Talysh Cer | Hawrami Wer | Hawrami Cer | Southern Kurdish Wer | Southern Kurdish Cer | Avg Wer | Avg Cer |
+|:-------------:|:-----:|:----:|:---------------:|:---------------:|:---------------:|:----------:|:----------:|:----------:|:----------:|:----------------:|:----------------:|:----------:|:----------:|:-----------:|:-----------:|:--------------------:|:--------------------:|:-------:|:-------:|
+| 0.6946        | 1.0   | 82   | 0.7662          | 0.8120          | 0.3224          | 0.9556     | 0.3751     | 1.0270     | 1.0389     | 0.7939           | 0.2733           | 0.9167     | 0.3333     | 0.5246      | 0.1155      | 0.6801               | 0.2192               | 0.8157  | 0.3825  |
+| 0.3864        | 2.0   | 164  | 0.5172          | 0.6093          | 0.1846          | 0.9579     | 0.3454     | 0.7451     | 0.2813     | 0.5644           | 0.1547           | 1.0        | 0.5        | 0.3806      | 0.0773      | 0.5484               | 0.1743               | 0.6865  | 0.2454  |
+| 0.3234        | 3.0   | 246  | 0.4686          | 0.5476          | 0.1652          | 0.9633     | 0.3514     | 0.6740     | 0.2363     | 0.5231           | 0.1362           | 1.0        | 0.5        | 0.3533      | 0.0722      | 0.4936               | 0.1674               | 0.6507  | 0.2327  |
+| 0.2786        | 4.0   | 328  | 0.4527          | 0.5278          | 0.1596          | 0.9083     | 0.3179     | 0.6422     | 0.2133     | 0.5047           | 0.1334           | 1.0        | 0.5        | 0.3485      | 0.0732      | 0.4948               | 0.1769               | 0.6323  | 0.2249  |
+| 0.2586        | 5.0   | 410  | 0.4509          | 0.5278          | 0.1615          | 0.9176     | 0.3175     | 0.6324     | 0.2020     | 0.4904           | 0.1247           | 1.0        | 0.5        | 0.3459      | 0.0708      | 0.4930               | 0.1718               | 0.6296  | 0.2212  |
 ### Framework versions

generation_config.json CHANGED Viewed

@@ -150,7 +150,6 @@
     "<|yo|>": 50325,
     "<|zh|>": 50260
   },
-  "language": "persian",
   "max_initial_timestamp_index": 50,
   "max_length": 448,
   "no_timestamps_token_id": 50363,

     "<|yo|>": 50325,
     "<|zh|>": 50260
   },
   "max_initial_timestamp_index": 50,
   "max_length": 448,
   "no_timestamps_token_id": 50363,