27 พฤศจิกายน 2568 SCB10X ได้เปิดตัวผลิตภัณฑ์ใหม่ที่ทำให้คนไทยฝั่งอีสานนั้นปประหลาดใจ มีชื่อว่า Typhoon ISAN มาพร้อมกับ Typhoon ASR และคลังชุดข้อมูลสำหรับการออกเสียงและการถอดเสียงภาษาอีสานที่แม่นยำ ดีพอ ๆ กับ Gemini 2.5 Pro

ที่มาของการพัฒนา Typhoon ISAN

  • ทีม Typhoon มองเห็นปัญหาว่า AI เสียงที่มีอยู่ในตลาดตอนนี้ โดยเฉพาะของต่างประเทศยังไม่ค่อยรู้เรื่องภาษาถิ่นเลย เน้นแต่ภาษาไทยกลาง เวลาใช้กับคนอีสานจริง ๆ มันจดคำผิด, ฟังไม่รู้เรื่อง, ข้อมูลเสียงคุณภาพดีสำหรับเอามาฝึก AI ก็หายากมาก ๆ จึงมีความตั้งใจว่า อยากให้เทคฯ เป็นของคนไทยจริง ด้วยการรวมทีมทั้งนักภาษาศาสตร์ นักวิจัย วิศวกร และคนสายธุรกิจ มาช่วยกันสร้างทั้งฐานข้อมูล ทั้งเครื่องมือ

และอีกเหตุผลนึง คือ ประเทศไทยมีผู้ใช้งานภาษาอีสานราว 20 ล้านคน คิดเป็น 1 ใน 3 ของประชากรทั้งประเทศ สร้างมูลค่า GDP รวมกว่า 180,000 ล้านบาท หรือประมาณ 10% ของมูลค่าเศรษฐกิจไทย มีแรงงานที่ใช้ภาษาอีสานทำงานในหลากหลายอุตสาหกรรม และมีวัฒนธรรมที่เป็นเอกลักษณ์ อย่างไรก็ตาม ภาษาอีสานเป็นภาษาพูดที่ยังไม่มีมาตรฐานการเขียนที่ชัดเจน ทีม SCB10X จึงพัฒนาภาษาอีสานนี้ เพื่อรักษาภูมิปัญญาและวัฒนธรรม นำไปสู่การช่วยส่งเสริมเศรษฐกิจดิจิทัลของประเทศในระยะยาว

ความยากของการพัฒนา AI ภาษาถิ่น และ Typhoon ISAN มี 2 ข้อ

  1. ภาษาอีสานเป็นภาษาพูด ไม่มีมาตรฐานการเขียนที่ชัด ทีมเลยต้องช่วยกันวางกติกาการสะกดและถอดเสียงใหม่เกือบทั้งหมด
  2. ภาษาอีสานมีข้อมูลคุณภาพดีน้อยมาก ทีมต้องลงพื้นที่เก็บเสียงเอง คัดเอง กำกับข้อมูลเอง เพื่อให้ได้ชุดข้อมูลที่เอาไปสอน AI ได้จริง

ทีม SCB10X จึงพัฒนา เอา AI โมเดลต่างประเทศมาปรับต่อ แล้วเทรนด้วยข้อมูลภาษาไทยจำนวนมาก ต้นทุนในการถอดเสียง จากการรวบรวมเสียงทั้งหมด 720 ชั่วโมง อยู่ที่ 50 บาท

Typhoon ISAN ประกอบด้วย

1. ISAN Speech Corpus

ชุดข้อมูลภาษาอีสาน พร้อมคำถอดเสียง ที่ทีม Typhoon ลงพื้นที่ไปอัดเสียงจากหลายจังหวัด มีทั้งข้อมูล (Metadata) ว่าใครมาจากไหน สำเนียงประมาณไหน เอาไว้เป็นฐานข้อมูลให้คนเอาไปสร้าง/เทรน AI หรือใช้ทำงานวิจัยต่อได้แบบเปิดเผย ไม่ได้เก็บไว้คนเดียว

1.1. Isan Speech Transcription Convention

– แนวทางการถอดเสียงพูดอีสานเป็นอักษรไทย ได้รับการตรวจสอบ จากผู้เชี่ยวชาญในภาษาศาสตร์อีสานโดยตรง

1.2. Isan Spelling Standard

  • ระบบการสะกดคำภาษาอีสาน

1.3. Isan Phonetic Dictionary

  • พจนานุกรมคำอ่านอีสาน แสดงการออกเสียงจริงของแต่ละคำในภาษาอีสาน

1.4. การจัดกลุ่มสำเนียงอีสาน (Isan Dialect Classification)

รายงานเชิงวิเคราะห์เกี่ยวกับความแตกต่างของสำเนียงอีสานในแต่ละจังหวัดทางภาคอีสาน ใช้ลักษณะทางภาษาศาสตร์ในการจัดกลุ่ม

อ่านต่อและดาวน์โหลดได้ที่นี่

2. Typhoon ISAN ASR Open-Source ถอดเสียงพูดเป็นข้อความภาษาอีสาน

สำหรับการถอดเสียงพูดเป็นข้อความภาษาอีสาน ต้นทุนอยู่ที่ 8 สตางค์/ชั่วโมง ถูกกว่า Whisper 156 เท่า และถูกกว่าบริการของ Google และ Azure ถึง 400 เท่า

  • ใช้สถาปัตยกรรม NVIDIA NeMo fast Conformer-transducer-large มาปรับแต่ง
  • ขนาดโมเดล 115 ล้านพารามิเตอร์
  • รองรับการ Streaming/Real-time
  • รองรับภาษาอีสานและภาษาไทยกลาง (ภาษาไทย)
  • ไม่ต้องพึ่ง Cloud ก็รันได้ไว

3. Typhoon ISAN TTS โมเดลสังเคราห์เสียงภาษาอีสาน

  • สังเคราะห์เสียงภาษาอีสาน
  • คุณภาพเสียงใกล้เคียงมนุษย์
  • ขับเคลื่อนด้วย LLM
  • ตอบสนองแบบเรียลไทม์
เทียบผลคะแนน Benchmark ระหว่าง Typhoon ISAN ASR, Whisper และ Gemini 2.5 Pro

VDO สาธิตผลลัพธ์

ข้อสรุป:

Typhoon ISAN คือ ชุดงานที่ทำให้เสียงและคำเว้าบ้านเฮากลายเป็นของที่โลกดิจิทัลเข้าใจได้ ทั้งคลังเสียง โมเดลที่ฟังออก และระบบที่พูดสำเนียงอีสานกลับมาได้อย่างเป็นธรรมชาติ ให้เข้าถึงคนพื้นที่มากขึ้น เป็นการยกภาษาถิ่นให้มีตัวตนในโลกเทคโนโลยี เปิดทางให้เกิดบริการใหม่ และโอกาสใหม่ของคนอีสานที่ได้ใช้ภาษาแม่ของตัวเองเต็มที่

Source:

สดจากงาน SCB10X Typhoon เฮ็ดให้ AI ใจอีสาน, OpenTyphoon, Post-Today