เมื่อก่อนเวลาแปลเนื้อหาที่มีภาษาอินเดีย มักเจอปัญหาการแปลไม่ตรงความหมาย หรือแปลแล้ว เนื้อหาเสียหายกับงานเอกสารวิชาการ กฎหมาย หรือเว็บไซต์ที่มี HTML

ล่าสุด Sarvam เปิดตัว Sarvam-Translate แปลภาษาได้ 22 ภาษาอินเดีย พร้อม claim ว่า แปลได้เป็นธรรมชาติ และรักษาโครงสร้างไฟล์ เช่น LaTeX, HTML, Code, SRT ได้ดีเลิศ

7 มิถุนายน 2568 บริษัท Sarvam เปิดตัว Sarvam – Translate AI แปลภาษาอินเดียแม่นยำมาก สามารถแปลงไฟล์ต้นฉบับเป็นภาษาอินเดีย โดยรักษาโครงสร้างแม่นยำ 100 %

ทำไมน่าสนใจ

– ใช้ AI ของ Google อย่าง Gemma3-4B-IT มาปรับแต่งเอง เพื่อเน้นภาษาอินเดียโดยเฉพาะ

– ผ่านการประเมินโดยผู้เชี่ยวชาญทางภาษา ทั้งเรื่อง fluency, faithfulness และความเหมาะสมทางวัฒนธรรม

– ผลการทดสอบอัตโนมัติชี้ว่า แปลได้แม่นยำมากกว่า 4.9/5 ใน 15 ภาษา สำหรับการแปลแบบมีโครงสร้าง

ฟีเจอร์หลักของ Sarvam-Translate

1. รองรับ 22 ภาษาอินเดีย

ได้แก่ Hindi, Bengali, Marathi, Telugu, Tamil, Gujarati, Urdu, Kannada, Odia, Malayalam, Punjabi, Assamese, Maithili, Santali, Kashmiri, Nepali, Sindhi, Dogri, Konkani, Manipuri (Meitei), Bodo, Sanskrit

2. แปลข้อความยาว (Long-form text)

– สามารถแปลย่อหน้าหรือบทความเต็มที่มีเนื้อหาเชิงลึกได้อย่างเป็นธรรมชาติ

3. รักษาโครงสร้างไฟล์ขณะแปล

– แปล HTML โดยไม่ทำลายแท็กและรูปแบบ

– แปล Markdown, LaTeX โดยไม่เปลี่ยนสมการทางวิทยาศาสตร์

– แปล Code เช่น Python, JavaScript โดยแปลเฉพาะคอมเมนต์ ไม่แตะโค้ดจริง

– แปล Subtitle (.srt) พร้อมรักษา timing และรูปแบบ

4. รองรับงานเฉพาะทาง

– เอกสารวิชาการ (Math, Chemistry equations)

– เอกสารกฎหมาย

– นิทานพื้นบ้าน / งานเขียนเชิงสร้างสรรค์

– โพสต์โซเชียลมีเดียที่มี slang และ emoji

5. แปลสำนวน นิทาน และบริบททางวัฒนธรรมได้

ไม่ใช่แค่แปลตรงตัว แต่พยายามรักษาโทน อารมณ์ และความหมายของภาษาแม่ไว้

6. แยกแยะและไม่แปลข้อความภาษาอื่นที่ฝังอยู่ในเอกสาร เช่น ชื่อคน, คำศัพท์ภาษาอังกฤษ, ตัวเลข, หรือภาษาจีนในเอกสาร

7. ประสิทธิภาพในการประมวลผลสูง + รองรับ API

– ใช้ระบบ TensorRT และ FP8 เพื่อเพิ่มความเร็วในการประมวลผล

– ใช้งานผ่าน Sarvam API Store และ Playground

– มีโมเดล Open Weights ให้ดาวน์โหลดบน Hugging Face

8. ผลประเมินโดยมนุษย์และการทดสอบอัตโนมัติ

– ชนะโมเดลดัง ๆ เช่น Gemma3-27B-IT, Llama-3.1-405B-FP8 ในหลายภาษา

– คะแนนความแม่นยำ > 4.9/5 สำหรับการแปลแบบมีโครงสร้างใน 15 ภาษา

ประโยชน์

– ทำให้เว็บไซต์และเนื้อหาออนไลน์เข้าถึงได้ทุกภาษาอินเดีย ไม่ต้องกลัวว่า HTML จะพัง

– ช่วยนักเรียน นักวิจัย แปลเอกสารวิชาการ สมการคณิตศาสตร์ สมการเคมี ได้โดยไม่เปลี่ยนแปลงเนื้อหาทางเทคนิค

– แปล Subtitle (SRT) พร้อมรักษา timing และ style ได้ทันที แค่คลิกเดียว

ราคาและการใช้งาน

– ใช้งานผ่าน API Store ของ Sarvam โดยตรง

– โมเดลแบบ Open Weights ดาวน์โหลดได้บน Hugging Face เพื่อปรับแต่งต่อยอดเองได้

– สามารถลองใช้ได้ผ่าน Playground บนเว็บของ Sarvam

เหมาะกับใคร

– นักพัฒนาเว็บที่ต้องการแปลเว็บไซต์เป็นภาษาอินเดียโดยไม่เสีย HTML

– นักเรียน นักวิจัยที่ต้องการแปลเอกสารวิชาการ

– ภาครัฐที่ต้องการสื่อสารกับประชาชนในภาษาท้องถิ่น

– Content Creator ที่อยากขยายคอนเทนต์ไปยังกลุ่มผู้ชมภาษาอินเดีย

ข้อสรุป:

Sarvam-Translate เป็นก้าวแรกในการทำให้ภาษาอินเดียทั้ง 22 ภาษามีบทบาทจริงในโลกดิจิทัล ไม่ว่าจะเป็นการศึกษา การสื่อสารของภาครัฐ หรือสร้างคอนเทนต์

Source: