IlyaGusev
/

saiga_llama3_8b

Text Generation

text-generation-inference

Model card Files Files and versions

IlyaGusev commited on Jul 4, 2024

Commit

5bb9917

·

verified ·

1 Parent(s): 7fa5874

Update README.md

Files changed (1) hide show

README.md +10 -1

README.md CHANGED Viewed

@@ -165,6 +165,7 @@ v2:
 * Framework: https://github.com/tatsu-lab/alpaca_eval
 * Evaluator: alpaca_eval_cot_gpt4_turbo_fn
 | model | length_controlled_winrate |  win_rate | standard_error  | avg_length |
 |-----|-----|-----|-----|-----|
 |chatgpt_4_turbo | 76.04 | 90.00 |1.46 | 1270 |
@@ -177,4 +178,12 @@ v2:
 |saiga_llama3_8b, v4  | 43.64  | 65.90 | 2.31 | 1200 |
 |saiga_llama3_8b, v3  | 36.97  | 61.08 | 2.38 | 1162 |
 |saiga_llama3_8b, v2  | 33.07  | 48.19 | 2.45 | 1166 |
-|saiga_mistral_7b  | 23.38  | 35.99 | 2.34 | 949  |

 * Framework: https://github.com/tatsu-lab/alpaca_eval
 * Evaluator: alpaca_eval_cot_gpt4_turbo_fn
+Pivot: chatgpt_3_5_turbo
 | model | length_controlled_winrate |  win_rate | standard_error  | avg_length |
 |-----|-----|-----|-----|-----|
 |chatgpt_4_turbo | 76.04 | 90.00 |1.46 | 1270 |
 |saiga_llama3_8b, v4  | 43.64  | 65.90 | 2.31 | 1200 |
 |saiga_llama3_8b, v3  | 36.97  | 61.08 | 2.38 | 1162 |
 |saiga_llama3_8b, v2  | 33.07  | 48.19 | 2.45 | 1166 |
+|saiga_mistral_7b  | 23.38  | 35.99 | 2.34 | 949  |
+Pivot: sfr
+| model | length_controlled_winrate |  win_rate | standard_error  | avg_length |
+|-----|-----|-----|-----|-----|
+| sfr | 50.00 |  50.00 | 0.00 | 1215 |
+| saiga_llama3_8b, v7 |  48.95  |  49.16  | 2.46  | 1266 |
+| saiga_llama3_8b, v6 | 46.91 | 47.23 | 2.45 | 1262 |
+| suzume_8b | 43.69  | 48.19 | 2.46 | 1325 |