Update README.md
Browse files
README.md
CHANGED
@@ -40,32 +40,6 @@ Command r plus 모델을 이용하여 자체 구축한 RAG 특화 데이터셋,
|
|
40 |
}
|
41 |
```
|
42 |
|
43 |
-
## 학습 환경 및 파라미터
|
44 |
-
- 튜닝 환경
|
45 |
-
- H100(80GB) * 8
|
46 |
-
- 파라미터
|
47 |
-
- tokenizer_model_mex_length 4500
|
48 |
-
- use_flash_attn True
|
49 |
-
- num_train_epochs 3.0
|
50 |
-
- weight_decay 0.001
|
51 |
-
- lr_scheduler_type "linear"
|
52 |
-
- per_device_train_batch_size 1
|
53 |
-
- gradient_accumulation_steps 64
|
54 |
-
- learning_rate 5e-06
|
55 |
-
- bf16 True
|
56 |
-
- deepspeed ds_stage2.json
|
57 |
-
|
58 |
-
## 사용 데이터셋
|
59 |
-
- AIhub 16 행정 문서 대상 기계독해 데이터
|
60 |
-
- AIhub 17 뉴스 기사 기계독해 데이터
|
61 |
-
- AIhub 21 도서자료 기계독해
|
62 |
-
- AIhub 149 표 정보 질의응답 데이터
|
63 |
-
- AIhub 150 숫자연산 기계독해 데이터
|
64 |
-
- AIhub 151 금융, 법률 문서 기계독해 데이터
|
65 |
-
- kyujinpy/KoCoT_2000
|
66 |
-
- MarkrAI/KoCommercial-Dataset
|
67 |
-
- CarrotAI/ko-instruction-dataset
|
68 |
-
- heegyu/CoT-collection-ko
|
69 |
|
70 |
## RAG Prompt
|
71 |
```
|
@@ -115,6 +89,33 @@ response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
|
|
115 |
print(response)
|
116 |
```
|
117 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
118 |
## Contact us
|
119 |
- 써로마인드
|
120 |
- 서울시 관악구 남부순환로 1802, 2층
|
|
|
40 |
}
|
41 |
```
|
42 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
43 |
|
44 |
## RAG Prompt
|
45 |
```
|
|
|
89 |
print(response)
|
90 |
```
|
91 |
|
92 |
+
## 학습 환경 및 파라미터
|
93 |
+
- 튜닝 환경
|
94 |
+
- H100(80GB) * 8
|
95 |
+
- 파라미터
|
96 |
+
- tokenizer_model_mex_length 4500
|
97 |
+
- use_flash_attn True
|
98 |
+
- num_train_epochs 3.0
|
99 |
+
- weight_decay 0.001
|
100 |
+
- lr_scheduler_type "linear"
|
101 |
+
- per_device_train_batch_size 1
|
102 |
+
- gradient_accumulation_steps 64
|
103 |
+
- learning_rate 5e-06
|
104 |
+
- bf16 True
|
105 |
+
- deepspeed ds_stage2.json
|
106 |
+
|
107 |
+
## 사용 데이터셋
|
108 |
+
- AIhub 16 행정 문서 대상 기계독해 데이터
|
109 |
+
- AIhub 17 뉴스 기사 기계독해 데이터
|
110 |
+
- AIhub 21 도서자료 기계독해
|
111 |
+
- AIhub 149 표 정보 질의응답 데이터
|
112 |
+
- AIhub 150 숫자연산 기계독해 데이터
|
113 |
+
- AIhub 151 금융, 법률 문서 기계독해 데이터
|
114 |
+
- kyujinpy/KoCoT_2000
|
115 |
+
- MarkrAI/KoCommercial-Dataset
|
116 |
+
- CarrotAI/ko-instruction-dataset
|
117 |
+
- heegyu/CoT-collection-ko
|
118 |
+
-
|
119 |
## Contact us
|
120 |
- 써로마인드
|
121 |
- 서울시 관악구 남부순환로 1802, 2층
|