Adun
/

olmOCR-7B-thai-v2

Image-Text-to-Text

Model card Files Files and versions

olmOCR-7B-thai-v2 / README.md

Adun's picture

Update README.md

b98e57b verified 4 months ago

|

history blame contribute delete

1.87 kB

	---
	license: mit
	language:
	- th
	base_model:
	- allenai/olmOCR-7B-0225-preview
	pipeline_tag: image-text-to-text
	---
	# 😃 FineTune olmOCR ให้ภาษาไทยดีขึ้น

	ทดสอบ เพิ่มภาษาไทย <br>
	ทดสอบ เพิ่มเลขภาษาไทย <br>

	olmOCR เป็นโอเพ่นซอร์ส OCR (Optical Character Recognition) <br>
	ที่ใช้สำหรับแปลงข้อความ จาก PDF file มาเป็นข้อความ ( TEXT ) มันถูกออกแบบมาเพื่อรองรับการใช้งานที่มีประสิทธิภาพสูงและสามารถปรับแต่งได้ตามความต้องการ <br>
	<br>
	✅ รองรับหลายภาษา และรูปแบบตารางได้ – สามารถใช้งานได้กับตัวอักษรหลากหลายภาษา <br>
	✅ Opensource – สามารถนำไปพัฒนาและปรับแต่งได้ตามต้องการ มีทั้ง Model weight , Finetune dataset และ Inference Code <br>
	✅ ความแม่นยำสูง – ใช้ Vision Language Model และ Finetune 250K เอกสาร <br>
	✅ มี API และ CLI – สามารถรันผ่าน Command Line หรือเรียกใช้ผ่าน API (vLLM , SGlang ) <br>
	<br>
	Base Model : Qwen2-VL-7B-Instruct
	GitHub : https://github.com/allenai/olmocr

	😃สอบถาม :
	อดุลย์ นันทะแก้ว email [email protected] <br>
	LINE : adunnan <br>
	FaceBook : https://www.facebook.com/adun.nantakaew <br>
	Page : https://www.facebook.com/softpowergroup <br>