ลองจินตนาการถึงวงสนทนาที่ AI ไม่ได้แค่ตอบตามสั่ง แต่รู้จักพูดแทรกและรับส่งมุกได้เนียนกริบ เหมือนนั่งคุยกับเพื่อนจริงๆ

10 กุมภาพันธ์ 2569 Google Research เผยแพร่โปรเจคใหม่ ชื่อว่า DialogLab คือ เครื่องมือปั้นวงแชทอัจฉริยะ ที่จะทำให้ AI Agent ของคุณมีจังหวะการคุยที่ลื่นไหลและมีชีวิตชีวา จนแยกไม่ออกว่าใคร คือ คนหรือหุ่นยนต์เลย

ปัญหาที่โลก AI กำลังเจอ (The Pain Points)

  • นักออกแบบ AI เจอปัญหาความตึง 2 แบบ:
  1. แบบ Scripted (บทเป๊ะ): ควบคุมได้ดี แต่หุ่นยนต์สุดๆ คนคุยด้วยแล้วเบื่อเพราะ AI ปรับตัวตามสถานการณ์ไม่ได้
  2. แบบ Generative (ปล่อยจอย):
    • ไหลลื่นดีแต่คุมทิศทางไม่ได้เลย บทจะออกทะเลก็กู่ไม่กลับ
  3. Workflow ที่กระจัดกระจาย: จะทำแชทกลุ่มทีต้องเขียนโค้ดวุ่นวาย ตั้งค่าเสียง ตั้งค่าท่าทางแยกกันหมด

เจาะลึก Framework: 2 มิติ 3 ขั้นตอน

  • หัวใจของ DialogLab คือ การแยกโครงสร้างสังคมออกจากจังหวะการคุย
  1. มิติที่ 1: Group Dynamics (โครงสร้างกลุ่ม)
    • Parties: แบ่งคนในวงแชทเป็นกลุ่มย่อย (เช่น ฝั่งผู้นำเสนอ และ ฝั่งคนฟัง) เพื่อกำหนดบทบาทที่ต่างกัน
    • Elements: กำหนดตัวละคร (Avatar) และ สื่อประกอบ (เช่น สไลด์หรือรูปภาพ) ที่จะใช้ร่วมกันในวงสนทนา
  2. มิติที่ 2: Conversation Flow Dynamics (จังหวะการคุย)
    • Snippets: แบ่งการคุยเป็นช่วงๆ (เช่น ช่วงเกริ่น, ช่วงถาม-ตอบ),.
    • Turn-taking Rules: กำหนดกฎการพูด เช่น ใครอยากพูดต้องยกมือ (Hand-raising) หรือจะคุยกันแบบอิสระ (Free Discussion)
    • Advanced Settings: ใส่ความ Real ด้วยการตั้งค่าการพูดแทรก (Interruptions) หรือการตอบรับเบาๆ (Backchannels) เช่น การพยักหน้าหรือส่งเสียง ‘อือฮึ’.

Workflow การทำงาน: Author-Test-Verify

  • Stage 1: Authoring (ออกแบบ): ใช้หน้าจอแบบ Visual Drag-and-drop ลากตัวละครมาใส่ จัดกลุ่ม และตั้งค่าบุคลิกผ่าน Inspector Panel ได้ง่ายๆ โดยไม่ต้องเขียนโค้ดเยอะ,,.
  • Stage 2: Testing (ลองของจริง): ไฮไลท์ คือ Simulated-human mode ครับ เราสามารถตั้งค่าให้ AI ตัวหนึ่งสวมรอยเป็นมนุษย์จอมป่วนที่ชอบพูดแทรก เปลี่ยนเรื่องคุย หรือแสดงอารมณ์ฉุนเฉียว เพื่อดูว่า AI ตัวอื่นๆ ในกลุ่มจะรับมือและกู้สถานการณ์กลับมาได้ไหม
  • Stage 3: Verification (ตรวจการบ้าน): มี Dashboard สรุปผลให้ดูว่า ใครพูดเยอะเกินไปไหม (Participation Balance), คุยตรงประเด็นหรือเปล่า (Topic Coherence) และบรรยากาศการคุยเป็นยังไง (Sentiment),.

Insight และผลการทดสอบ (AI ตัวไหนรอด?)

  • AI ที่มีความคิดเป็นของตัวเอง (Autonomous) รอดกว่า: จากการทดสอบพบว่า คนชอบ AI ที่กล้าพูดแทรกหรือแสดงความเห็นเองมากกว่า AI ที่รอให้คนเรียกชื่อค่อยตอบ (Reactive) เพราะมันดูสดและมีชีวิตชีวากว่า
  1. Human Control คือ จุดสมดุล: ผู้ทดสอบชอบโหมดที่คนสามารถ จิ้มสั่ง ให้ AI เปลี่ยนทิศทางการคุยได้แบบ Real-time เพราะทำให้รู้สึกว่าได้ร่วมสร้างบทสนทนาไปพร้อมกับ AI.
  2. ใช้งานได้หลากหลาย: ตั้งแต่การซ้อมนำเสนอผลงาน, การจำลองดีเบตทางประวัติศาสตร์ (เช่น โสเครตีส ปะทะ ขงจื๊อ), ไปจนถึงการออกแบบบทพูดในเกม

ข้อจำกัดที่ต้องรู้

  • Hallucinations: AI ยังมีโอกาสมโนข้อมูลปลอมขึ้นมาได้.
  • ความสมจริงของตัวละคร: ตอนนี้ท่าทาง (Gestures) ของ Avatar ยังจำกัด และระบบการพูดแทรกยังไม่เนียนกริบเหมือนคนจริงๆ ที่คุยทับกันแบบไม่เป็นระเบียบ

ข้อสรุป:

DialogLab คือเครื่องมือที่ช่วยให้นักพัฒนาไม่ต้องสุ่มเดาผลลัพธ์ แต่สามารถกำกับ และ ซ้อมวงแชทกลุ่ม AI ให้เป๊ะและเป็นธรรมชาติที่สุดก่อนใช้งานจริง

Source:

Google Research