เคยไหม ปวดหัวกับ OCR แปลงเอกสารราชการไทย-อังกฤษ

ออกมาใช้ไม่ได้เลย แยกไม่ออก ต้องนั่งแก้เองทีละบรรทัด

Typhoon OCR มาช่วยแก้ไข ไม่ใช่แค่ อ่านข้อความ อย่างเดียว

แต่เข้าใจบริบท ว่าตรงไหน คือ ตาราง, กราฟ, หัวข้อย่อย จนถึง

แยกแยะเลขไทยได้อย่างแม่นยำ

19 พฤษภาคม 2568 บริษัท SCB 10X เปิดตัว Typhoon OCR สามารถสแกนเอกสาร และตีความผลลัพธ์ออกมาเป็นตัวอักษรและตัวเลขในเอกสารทั้งหมด

Pain Point:

ระบบ OCR ทั่วไป อ่านตัวหนังสือได้ดี แต่พอเจอเอกสารจริงที่มีตาราง กราฟ หรือ Layouts ซับซ้อน มักแปลงออกมาแล้วใช้งานไม่ได้ เพราะไม่เข้าใจโครงสร้างและบริบทของเอกสาร ยิ่งเป็นภาษาไทยหรือเอกสารราชการที่มีเลขไทยเยอะ ๆ ก็ยิ่งแปลงผิดบ่อย ต้องนั่งแก้เองทีละจุดให้เสียเวลา

ฟีเจอร์:

  • AI อ่านเอกสารเก่งขึ้น อ่านได้ทั้งตัวหนังสือและโครงสร้าง เช่น ตาราง, กราฟ, หัวข้อ
  • เข้าใจข้อมูลจริง ๆ สามารถจัดเป็น Markdown หรือ HTML ใช้งานต่อได้เลย
  • รองรับทั้ง PDF ที่มี metadata หรือภาพ JPEG/PNG ก็แปลงได้หมด
  • รองรับ 2 ภาษาไทย-อังกฤษครบ เลขไทยแยกออกชัด 99.99 %
  • Open-Source ใช้ฟรี โหลดใช้เองหรือเรียกผ่าน API เพื่อต่อยอดระบบใหญ่ก็ได้

เหมาะกับงานต่าง ๆ:

  • การสร้างข้อมูลเพื่อการสืบค้น
  • การแยกวิเคราะห์และเข้าใจเอกสาร
  • การอ่านตาราง แผนภูมิ และแบบฟอร์มอย่างแม่นยำ

ตัวอย่าง

ตารางการเงิน: แยกข้อมูลจากตารางที่มีความซับซ้อนได้อย่างแม่นยำ รวมถึงเซลล์ที่ merge รวมกันที่อาจเกิดขึ้น ก็ไม่ทำให้การทำงานมีปัญหา

แผนภูมิ: สามารถอ่านรูปภาพกราฟต่างๆ และแปลงข้อมูลเชิงสถิติเป็นข้อความ Markdown ที่เข้าใจง่าย

เอกสารราชการ: Typhoon OCR รองรับการถอดเอกสารราชการและ รองรับระบบตัวเลขไทย ความแม่นยำสูงถึง ๙๙.๙๙๙ เปอร์เซนต์ (99.999%)

ลายมือ: อ่านลายมือรูปแบบหลากหลายได้ โดยอาจมีข้อผิดพลาดเล็กน้อยโดยเฉลี่ยเพียง 0.1% ขึ้นอยู่กับลายมือ

ใบเสร็จและบิล: ทดสอบแล้วพบว่ารองรับเอกสารที่หลากหลาย ถึงแม้จะอยู่ภายนอกขอบเขตที่ทางเราตั้งใจเทรนโดยเฉพาะ อย่างเอกสารเช่น บิลค่าน้ำ ค่าไฟ

ทดลองใช้งานได้ที่ OCR Playground

Link: https://ocr.opentyphoon.ai/

ดาวน์โหลด model weight จาก Hugging Face นำไปปรับใช้หรือเทรนต่อได้ทันที Link: https://huggingface.co/scb10x/typhoon-ocr-7b

ใช้งานผ่าน API – สามารถใช้งาน Typhoon OCR ผ่าน API ได้แล้ว เหมาะสำหรับการใช้งานจริงที่เข้มข้นที่ต้องการรับมือการหลายเอกสาร ดูรายละเอียดการใช้ API ได้ที่ docs.opentyphoon.ai

ข้อสรุป:

Typhoon OCR เป็นเทคโนโลยีที่ตอบโจทย์จริงสำหรับคนทำงานออฟฟิศ, นักวิจัย, นักพัฒนา หรือใครก็ตามที่ต้องจัดการกับเอกสารจำนวนมาก ทั้งภาษาไทยและอังกฤษ

Source:

Open Typhoon, Huggingface