daebum commited on
Commit
05514cc
·
verified ·
1 Parent(s): 1ff9998

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +27 -26
README.md CHANGED
@@ -40,32 +40,6 @@ Command r plus 모델을 이용하여 자체 구축한 RAG 특화 데이터셋,
40
  }
41
  ```
42
 
43
- ## 학습 환경 및 파라미터
44
- - 튜닝 환경
45
- - H100(80GB) * 8
46
- - 파라미터
47
- - tokenizer_model_mex_length 4500
48
- - use_flash_attn True
49
- - num_train_epochs 3.0
50
- - weight_decay 0.001
51
- - lr_scheduler_type "linear"
52
- - per_device_train_batch_size 1
53
- - gradient_accumulation_steps 64
54
- - learning_rate 5e-06
55
- - bf16 True
56
- - deepspeed ds_stage2.json
57
-
58
- ## 사용 데이터셋
59
- - AIhub 16 행정 문서 대상 기계독해 데이터
60
- - AIhub 17 뉴스 기사 기계독해 데이터
61
- - AIhub 21 도서자료 기계독해
62
- - AIhub 149 표 정보 질의응답 데이터
63
- - AIhub 150 숫자연산 기계독해 데이터
64
- - AIhub 151 금융, 법률 문서 기계독해 데이터
65
- - kyujinpy/KoCoT_2000
66
- - MarkrAI/KoCommercial-Dataset
67
- - CarrotAI/ko-instruction-dataset
68
- - heegyu/CoT-collection-ko
69
 
70
  ## RAG Prompt
71
  ```
@@ -115,6 +89,33 @@ response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
115
  print(response)
116
  ```
117
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
118
  ## Contact us
119
  - 써로마인드
120
  - 서울시 관악구 남부순환로 1802, 2층
 
40
  }
41
  ```
42
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
43
 
44
  ## RAG Prompt
45
  ```
 
89
  print(response)
90
  ```
91
 
92
+ ## 학습 환경 및 파라미터
93
+ - 튜닝 환경
94
+ - H100(80GB) * 8
95
+ - 파라미터
96
+ - tokenizer_model_mex_length 4500
97
+ - use_flash_attn True
98
+ - num_train_epochs 3.0
99
+ - weight_decay 0.001
100
+ - lr_scheduler_type "linear"
101
+ - per_device_train_batch_size 1
102
+ - gradient_accumulation_steps 64
103
+ - learning_rate 5e-06
104
+ - bf16 True
105
+ - deepspeed ds_stage2.json
106
+
107
+ ## 사용 데이터셋
108
+ - AIhub 16 행정 문서 대상 기계독해 데이터
109
+ - AIhub 17 뉴스 기사 기계독해 데이터
110
+ - AIhub 21 도서자료 기계독해
111
+ - AIhub 149 표 정보 질의응답 데이터
112
+ - AIhub 150 숫자연산 기계독해 데이터
113
+ - AIhub 151 금융, 법률 문서 기계독해 데이터
114
+ - kyujinpy/KoCoT_2000
115
+ - MarkrAI/KoCommercial-Dataset
116
+ - CarrotAI/ko-instruction-dataset
117
+ - heegyu/CoT-collection-ko
118
+ -
119
  ## Contact us
120
  - 써로마인드
121
  - 서울시 관악구 남부순환로 1802, 2층