วิธีทดสอบ AI แบบเดิมไม่ได้ผล จึงลองใหม่ด้วยเกม Minecraft เพื่อให้โมเดล AI แข่งขันกันสร้างสรรค์ผลงานในเกมตามคำสั่งผู้ใช้ครับ เพียงแค่กดโหวตว่าอันไหนดูดีกว่า โดยไม่ต้องอ่านโค้ด และไม่เสี่ยงจากการทดลองผ่านสนามจริง

20 มี.ค. 2025 – Adi Singh เด็กม.ปลายจากอเมริกา ปล่อยเว็บ MC-Bench ให้ AI สร้างสรรค์ผลงานใน Minecraft ตามคำสั่ง เช่น กระท่อมริมทะเล หรือ ตุ๊กตาหิมะ แล้วให้คนโหวตว่าผลงานไหนถูกใจ โดยไม่รู้ว่าแต่ละชิ้นเป็นฝีมือ AI ตัวไหนจนกว่าจะโหวตเสร็จ

หน้าแรกของการเล่น MC-Bench มีโจาาทย์มาและทำการเลือก เมื่อเลือกครบ ก็มีคะแนน และเฉลยว่า โครงสร้างสถาปัตยกรรมของภาพแต่ละภาพ ใช้โมเดลไหน สร้างสรรค์ขึ้นมา

จุดเด่น:

👉 ไม่ต้องเก่งโค้ดก็ร่วมสนุกได้ เพราะ Minecraft เป็นเกมที่คนทั่วโลกรู้จัก (ขายไปแล้วกว่า 200 ล้านชุด) แค่ดูภาพก็ตัดสินได้ว่า ภาพแบบไหนสมจริงกว่า

👉 แบรนด์ใหญ่สนับสนุน – Google, OpenAI, Anthropic และ Alibaba ให้ใช้โมเดลฟรีเพื่อทดสอบ ไม่เกี่ยวกับการออกแบบเว็บ

ตัวอย่างผลลัพธ์:

  1. GPT-4 สร้างตุ๊กตาหิมะได้เนียน แต่บางครั้งก็ลืมใส่ถุงมือ
  2. Claude 3.7 Sonnet ทำกระท่อมริมทะเลได้สวย แต่หลังคาเอียงผิดมุม
  3. โมเดลจาก Alibaba สร้างสับปะรดได้ใกล้เคียงของจริงที่สุด!

อนาคต

Adi Singh ผู้พัฒนา MC-Bench เผยว่ากำลังพัฒนา “โหมดธุรกิจ” ที่จะให้บริษัทสร้างโจทย์เฉพาะ เช่น “ให้ AI วางแผนโลจิสติกส์ในเกม” แล้ววัดผลแบบอัตโนมัติ คาดเปิดตัวไตรมาส 4 ปีนี้

ข้อสรุป:

MC-Bench คือ เครื่องมือวัดศักยภาพ AI ที่ใช้ได้จริง ถ้าคุณอยากนำ AI มาต่อยอดธุรกิจแบบไม่หลงทาง และ Adi Singh เชื่อว่าเกมเป็นพื้นที่ปลอดภัยสำหรับฝึก AI ให้คิดเป็นขั้นตอน โดยไม่ต้องเสี่ยงทดลองในโลกจริง

เข้าใช้งาน MC-Bench ผ่านลิงก์ข้างล่างนี้

Link: https://mcbench.ai/

Source:

Minecraft-Bench, Techcrunch