Add v2022 model and ckpt

Files changed (5) hide show

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ license: "mit"
 ** Updates on 2022.10.08 **
-- KcELECTRA-base-v2022 (구 v2022-dev) 모델 이름이 변경되었습니다.
 - 위 모델의 세부 스코어를 추가하였습니다.
 - 기존 KcELECTRA-base(v2021) 대비 대부분의 downstream task에서 ~1%p 수준의 성능 향상이 있습니다.

 ** Updates on 2022.10.08 **
+- KcELECTRA-base-v2022 (구 v2022-dev) 모델 이름이 변경되었습니다. --> KcELECTRA-base 레포의 `v2022`로 통합되었습니다.
 - 위 모델의 세부 스코어를 추가하였습니다.
 - 기존 KcELECTRA-base(v2021) 대비 대부분의 downstream task에서 ~1%p 수준의 성능 향상이 있습니다.

config.json CHANGED Viewed

@@ -15,7 +15,7 @@
   "max_position_embeddings": 512,
   "model_type": "electra",
   "type_vocab_size": 2,
-  "vocab_size": 50135,
   "pad_token_id": 0,
   "tokenizer_class": "BertTokenizer"
 }

   "max_position_embeddings": 512,
   "model_type": "electra",
   "type_vocab_size": 2,
+  "vocab_size": 54343,
   "pad_token_id": 0,
   "tokenizer_class": "BertTokenizer"
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dfb914aabf4627728d6494d8acda390a2f26200850a519f4bb55f1297c0ec86a
-size 498271049

 version https://git-lfs.github.com/spec/v1
+oid sha256:3460bb4187cdda4fbc6c8d7dfb97779e43660a86091dc9d1f01810eb5264fe53
+size 511193709

tf_model.h5 DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:24b7d452434e965544fc79ab8c56937ef8ea7a153a626381dd09ee8738b4fd42
-size 498456784

vocab.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff