Update README.md
Browse files
README.md
CHANGED
@@ -15,29 +15,28 @@ should probably proofread and complete it, then remove this comment. -->
|
|
15 |
|
16 |
# 구음장애 환자를 위한 음성인식 모델
|
17 |
|
18 |
-
##
|
19 |
-
|
20 |
|
21 |
-
## 프로젝트
|
22 |
-
|
23 |
|
24 |
-
##
|
|
|
|
|
|
|
25 |
|
26 |
-
|
|
|
|
|
27 |
|
28 |
-
##
|
29 |
|
30 |
-
|
|
|
31 |
|
32 |
-
|
33 |
|
34 |
-
More information needed
|
35 |
-
|
36 |
-
## Training procedure
|
37 |
-
|
38 |
-
### Training hyperparameters
|
39 |
-
|
40 |
-
The following hyperparameters were used during training:
|
41 |
- learning_rate: 5e-07
|
42 |
- train_batch_size: 8
|
43 |
- eval_batch_size: 8
|
@@ -48,7 +47,7 @@ The following hyperparameters were used during training:
|
|
48 |
- num_epochs: 1
|
49 |
- mixed_precision_training: Native AMP
|
50 |
|
51 |
-
###
|
52 |
|
53 |
| Training Loss | Epoch | Step | Validation Loss | Wer |
|
54 |
|:-------------:|:-----:|:----:|:---------------:|:-------:|
|
|
|
15 |
|
16 |
# 구음장애 환자를 위한 음성인식 모델
|
17 |
|
18 |
+
## 프로젝트 정보
|
19 |
+
재단법인 미래와 소프트웨어와 함께하는 제 3회아이디어 공모전
|
20 |
|
21 |
+
## 프로젝트 명
|
22 |
+
"구음장애 음성 데이터를 활용한 고령 환자의 의사소통 개선방안"
|
23 |
|
24 |
+
## 모델 설명
|
25 |
+
- **openai/whisper-large-v3**에 대한 파인튜닝 모델
|
26 |
+
- 본 모델은 "구음장애 음성 데이터를 활용한 고령 환자의 의사소통 개선방안" 프로젝트의 구음장애환자들에 대한 한국어 음성인식 모델임. OpenAI의 Whisper 모델을 파인튜닝 하여 구음장애의 음성적 특성을 반영한 모델을 구축하였음.
|
27 |
+
- 오른쪽 "Inference API"를 통해 음성인식 모델을 테스트 해볼 수 있습니다.
|
28 |
|
29 |
+
## 학습 모델
|
30 |
+
- **Paper**: Radford, A., Kim, J. W., Xu, T., Brockman, G., McLeavey, C., & Sutskever, I. (2023, July). Robust speech recognition via large-scale weak supervision. In International Conference on Machine Learning (pp. 28492-28518). PMLR.
|
31 |
+
- **URL**: https://proceedings.mlr.press/v202/radford23a.html
|
32 |
|
33 |
+
## 학습 데이터
|
34 |
|
35 |
+
- AIHub "구음장애 음성 데이터" (KOR)
|
36 |
+
- URL: https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=608
|
37 |
|
38 |
+
### 학습 파라미터
|
39 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
40 |
- learning_rate: 5e-07
|
41 |
- train_batch_size: 8
|
42 |
- eval_batch_size: 8
|
|
|
47 |
- num_epochs: 1
|
48 |
- mixed_precision_training: Native AMP
|
49 |
|
50 |
+
### 학습 결과
|
51 |
|
52 |
| Training Loss | Epoch | Step | Validation Loss | Wer |
|
53 |
|:-------------:|:-----:|:----:|:---------------:|:-------:|
|