เคยไหม ปวดหัวกับ OCR แปลงเอกสารราชการไทย-อังกฤษ
ออกมาใช้ไม่ได้เลย แยกไม่ออก ต้องนั่งแก้เองทีละบรรทัด
Typhoon OCR มาช่วยแก้ไข ไม่ใช่แค่ อ่านข้อความ อย่างเดียว
แต่เข้าใจบริบท ว่าตรงไหน คือ ตาราง, กราฟ, หัวข้อย่อย จนถึง
แยกแยะเลขไทยได้อย่างแม่นยำ

19 พฤษภาคม 2568 บริษัท SCB 10X เปิดตัว Typhoon OCR สามารถสแกนเอกสาร และตีความผลลัพธ์ออกมาเป็นตัวอักษรและตัวเลขในเอกสารทั้งหมด
Pain Point:
ระบบ OCR ทั่วไป อ่านตัวหนังสือได้ดี แต่พอเจอเอกสารจริงที่มีตาราง กราฟ หรือ Layouts ซับซ้อน มักแปลงออกมาแล้วใช้งานไม่ได้ เพราะไม่เข้าใจโครงสร้างและบริบทของเอกสาร ยิ่งเป็นภาษาไทยหรือเอกสารราชการที่มีเลขไทยเยอะ ๆ ก็ยิ่งแปลงผิดบ่อย ต้องนั่งแก้เองทีละจุดให้เสียเวลา
ฟีเจอร์:
- AI อ่านเอกสารเก่งขึ้น อ่านได้ทั้งตัวหนังสือและโครงสร้าง เช่น ตาราง, กราฟ, หัวข้อ
- เข้าใจข้อมูลจริง ๆ สามารถจัดเป็น Markdown หรือ HTML ใช้งานต่อได้เลย
- รองรับทั้ง PDF ที่มี metadata หรือภาพ JPEG/PNG ก็แปลงได้หมด
- รองรับ 2 ภาษาไทย-อังกฤษครบ เลขไทยแยกออกชัด 99.99 %
- Open-Source ใช้ฟรี โหลดใช้เองหรือเรียกผ่าน API เพื่อต่อยอดระบบใหญ่ก็ได้
เหมาะกับงานต่าง ๆ:
- การสร้างข้อมูลเพื่อการสืบค้น
- การแยกวิเคราะห์และเข้าใจเอกสาร
- การอ่านตาราง แผนภูมิ และแบบฟอร์มอย่างแม่นยำ
ตัวอย่าง
ตารางการเงิน: แยกข้อมูลจากตารางที่มีความซับซ้อนได้อย่างแม่นยำ รวมถึงเซลล์ที่ merge รวมกันที่อาจเกิดขึ้น ก็ไม่ทำให้การทำงานมีปัญหา

แผนภูมิ: สามารถอ่านรูปภาพกราฟต่างๆ และแปลงข้อมูลเชิงสถิติเป็นข้อความ Markdown ที่เข้าใจง่าย

เอกสารราชการ: Typhoon OCR รองรับการถอดเอกสารราชการและ รองรับระบบตัวเลขไทย ความแม่นยำสูงถึง ๙๙.๙๙๙ เปอร์เซนต์ (99.999%)

ลายมือ: อ่านลายมือรูปแบบหลากหลายได้ โดยอาจมีข้อผิดพลาดเล็กน้อยโดยเฉลี่ยเพียง 0.1% ขึ้นอยู่กับลายมือ

ใบเสร็จและบิล: ทดสอบแล้วพบว่ารองรับเอกสารที่หลากหลาย ถึงแม้จะอยู่ภายนอกขอบเขตที่ทางเราตั้งใจเทรนโดยเฉพาะ อย่างเอกสารเช่น บิลค่าน้ำ ค่าไฟ

ทดลองใช้งานได้ที่ OCR Playground
Link: https://ocr.opentyphoon.ai/
ดาวน์โหลด model weight จาก Hugging Face นำไปปรับใช้หรือเทรนต่อได้ทันที Link: https://huggingface.co/scb10x/typhoon-ocr-7b
ใช้งานผ่าน API – สามารถใช้งาน Typhoon OCR ผ่าน API ได้แล้ว เหมาะสำหรับการใช้งานจริงที่เข้มข้นที่ต้องการรับมือการหลายเอกสาร ดูรายละเอียดการใช้ API ได้ที่ docs.opentyphoon.ai
ข้อสรุป:
Typhoon OCR เป็นเทคโนโลยีที่ตอบโจทย์จริงสำหรับคนทำงานออฟฟิศ, นักวิจัย, นักพัฒนา หรือใครก็ตามที่ต้องจัดการกับเอกสารจำนวนมาก ทั้งภาษาไทยและอังกฤษ



