|
--- |
|
license: mit |
|
language: |
|
- th |
|
base_model: |
|
- allenai/olmOCR-7B-0225-preview |
|
pipeline_tag: image-text-to-text |
|
--- |
|
# 😃 FineTune olmOCR ให้ภาษาไทยดีขึ้น |
|
|
|
ทดสอบ เพิ่มภาษาไทย <br> |
|
ทดสอบ เพิ่มเลขภาษาไทย <br> |
|
|
|
olmOCR เป็นโอเพ่นซอร์ส OCR (Optical Character Recognition) <br> |
|
ที่ใช้สำหรับแปลงข้อความ จาก PDF file มาเป็นข้อความ ( TEXT ) มันถูกออกแบบมาเพื่อรองรับการใช้งานที่มีประสิทธิภาพสูงและสามารถปรับแต่งได้ตามความต้องการ <br> |
|
<br> |
|
✅ รองรับหลายภาษา และรูปแบบตารางได้ – สามารถใช้งานได้กับตัวอักษรหลากหลายภาษา <br> |
|
✅ Opensource – สามารถนำไปพัฒนาและปรับแต่งได้ตามต้องการ มีทั้ง Model weight , Finetune dataset และ Inference Code <br> |
|
✅ ความแม่นยำสูง – ใช้ Vision Language Model และ Finetune 250K เอกสาร <br> |
|
✅ มี API และ CLI – สามารถรันผ่าน Command Line หรือเรียกใช้ผ่าน API (vLLM , SGlang ) <br> |
|
<br> |
|
Base Model : Qwen2-VL-7B-Instruct |
|
GitHub : https://github.com/allenai/olmocr |
|
|
|
😃สอบถาม : |
|
อดุลย์ นันทะแก้ว email [email protected] <br> |
|
LINE : adunnan <br> |
|
FaceBook : https://www.facebook.com/adun.nantakaew <br> |
|
Page : https://www.facebook.com/softpowergroup <br> |