เคยสงสัยไหมว่าโลมาคุยกันยังไง, มีภาษาแบบมนุษย์หรือเปล่า นักวิทยาศาสตร์พยายามหาคำตอบเรื่องนี้มานานกว่าหลายทศวรรษ แต่วันนี้ เราอาจเข้าใกล้คำตอบมากขึ้นอีกก้าวหนึ่งแล้ว เมื่อ Google เปิดตัว DolphinGemma โมเดล AI แปลภาษาโลมาตัวแรกของโลก

ย้อนเหตุการณ์

14 เมษายน 2025 Google ประกาศความสำเร็จครั้งใหญ่ ผ่านโปรเจกต์ DolphinGemma โมเดล AI ที่ออกแบบมาเพื่อถอดรหัสเสียงร้องและพฤติกรรมการสื่อสารของโลมาลายจุดแอตแลนติก (Stenella frontalis) โครงการนี้เกิดจากความร่วมมือระหว่าง Google DeepMind, สถาบันเทคโนโลยีจอร์เจีย และ Wild Dolphin Project (WDP) ซึ่งเป็นองค์กรที่ศึกษาโลมาในธรรมชาติมาตั้งแต่ปี 1985

โมเดลมีขนาดประมาณ 400 ล้านพารามิเตอร์

ขั้นตอนการทำงานของ DolhinGenma

1. เก็บข้อมูลเสียงของโลมา

2. แปลงเป็นข้อมูลดิจิทัล ใช้ SoundStream tokenizer ของ Google แปลงเสียงโลมาให้กลายเป็นข้อมูลดิจิทัลที่ AI เข้าใจ

3. วิเคราะห์รูปแบบเสียง เรียนรู้โครงสร้างของเสียง

4. สร้างเสียงใหม่ เพื่อทดลองใช้ตอบโต้ เช่น ส่งเสียงสังเคราะห์ไปหาโลมา

5. คาดการณ์เสียงถัดไป

6. เชื่อมโยงกับระบบ CHAT เพื่อทดสอบการสื่อสาร 2 ทาง

7. นำผลลัพธ์ที่ได้มาวิเคราะห์เพิ่มเติม ปรับแต่งโมเดลให้แม่นยำขึ้น และขยายไปศึกษาสายพันธุ์โลมาชนิดอื่นๆ

ทั้งหมดนี้ทำได้บนโทรศัพท์ Pixel 9

ความสามารถของ DolphinGenma

– ฟังและวิเคราะห์เสียง: ถอดรหัสเสียงร้องของโลมาลายจุดแอตแลนติกและค้นหารูปแบบที่ซ่อนอยู่

– สร้างเสียงโลมาใหม่: ผลิตเสียงสังเคราะห์เพื่อทดลองตอบโต้กับโลมา

– ทำงานแบบเรียลไทม์: ใช้ Pixel 9 ประมวลผลเสียงใต้น้ำได้ทันที

DolphinGemma ไม่ใช่แค่ AI ธรรมดา สามารถสร้างเสียง เหมือนโลมา ได้ และยังเล็กพอที่จะทำงานบนสมาร์ทโฟน Pixel 9 ของ Google อีกด้วย

นักวิจัยสามารถใช้โทรศัพท์เพื่อบันทึก เปรียบเทียบ วิเคราะห์ข้อมูล และตอบโต้กับโลมาได้ทันที และยังใช้พลังงานน้อยกว่าและสะดวกกว่าอุปกรณ์เดิมมากๆ นี่ทำให้นักวิจัยสามารถทำงานในมหาสมุทรได้ง่ายขึ้น

ข้อเสียเปรียบ:

– ยังต้องฝึกฝนเพิ่ม: แม้จะเก่ง แต่ DolphinGemma อาจต้องปรับแต่งสำหรับสายพันธุ์หรือสถานการณ์ใหม่ๆ

– ไม่เข้าใจความหมายเต็ม 100%: ตอนนี้แค่จับรูปแบบเสียง ยังไม่รู้แน่ชัดว่าโลมา “คิดอะไร”

– ข้อมูลต้องเยอะ: ต้องใช้ฐานข้อมูลใหญ่ๆ ถึงจะแม่นยำ ถ้าข้อมูลน้อย อาจพลาดได้ง่าย

ข้อสรุป:

DolphinGemma เป็นตัวอย่างของ AI ที่ช่วยถอดรหัสข้อมูลซับซ้อน ซึ่งผู้นำและนักธุรกิจสามารถประยุกต์ใช้ในอุตสาหกรรมต่างๆ เช่น การวิเคราะห์เสียงลูกค้าหรือการพัฒนาผลิตภัณฑ์ใหม่ โดยโมเดลนี้ช่วยลดเวลาและต้นทุนในการประมวลผลข้อมูล นำไปสู่การตัดสินใจที่แม่นยำและสร้างนวัตกรรมได้เร็วขึ้น

Source:

Youtube, Posttoday, Blog Google