วิธีทดสอบ AI แบบเดิมไม่ได้ผล จึงลองใหม่ด้วยเกม Minecraft เพื่อให้โมเดล AI แข่งขันกันสร้างสรรค์ผลงานในเกมตามคำสั่งผู้ใช้ครับ เพียงแค่กดโหวตว่าอันไหนดูดีกว่า โดยไม่ต้องอ่านโค้ด และไม่เสี่ยงจากการทดลองผ่านสนามจริง
20 มี.ค. 2025 – Adi Singh เด็กม.ปลายจากอเมริกา ปล่อยเว็บ MC-Bench ให้ AI สร้างสรรค์ผลงานใน Minecraft ตามคำสั่ง เช่น กระท่อมริมทะเล หรือ ตุ๊กตาหิมะ แล้วให้คนโหวตว่าผลงานไหนถูกใจ โดยไม่รู้ว่าแต่ละชิ้นเป็นฝีมือ AI ตัวไหนจนกว่าจะโหวตเสร็จ

จุดเด่น:
ไม่ต้องเก่งโค้ดก็ร่วมสนุกได้ เพราะ Minecraft เป็นเกมที่คนทั่วโลกรู้จัก (ขายไปแล้วกว่า 200 ล้านชุด) แค่ดูภาพก็ตัดสินได้ว่า ภาพแบบไหนสมจริงกว่า
แบรนด์ใหญ่สนับสนุน – Google, OpenAI, Anthropic และ Alibaba ให้ใช้โมเดลฟรีเพื่อทดสอบ ไม่เกี่ยวกับการออกแบบเว็บ
ตัวอย่างผลลัพธ์:
- GPT-4 สร้างตุ๊กตาหิมะได้เนียน แต่บางครั้งก็ลืมใส่ถุงมือ
- Claude 3.7 Sonnet ทำกระท่อมริมทะเลได้สวย แต่หลังคาเอียงผิดมุม
- โมเดลจาก Alibaba สร้างสับปะรดได้ใกล้เคียงของจริงที่สุด!
อนาคต
Adi Singh ผู้พัฒนา MC-Bench เผยว่ากำลังพัฒนา “โหมดธุรกิจ” ที่จะให้บริษัทสร้างโจทย์เฉพาะ เช่น “ให้ AI วางแผนโลจิสติกส์ในเกม” แล้ววัดผลแบบอัตโนมัติ คาดเปิดตัวไตรมาส 4 ปีนี้
ข้อสรุป:
MC-Bench คือ เครื่องมือวัดศักยภาพ AI ที่ใช้ได้จริง ถ้าคุณอยากนำ AI มาต่อยอดธุรกิจแบบไม่หลงทาง และ Adi Singh เชื่อว่าเกมเป็นพื้นที่ปลอดภัยสำหรับฝึก AI ให้คิดเป็นขั้นตอน โดยไม่ต้องเสี่ยงทดลองในโลกจริง
เข้าใช้งาน MC-Bench ผ่านลิงก์ข้างล่างนี้
Link: https://mcbench.ai/