19 กรกฎาคม 2568 บริษัท ARC Prize เปิดตัว AGI-3 ระบบ AI สามารถรับมือกับปัญหาใหม่ๆ ได้ดีเพียงใด โดยที่ไม่มีการฝึก AI ช่วยจับความสามารถที่พึ่งพาประสบการณ์ได้ชัดๆ
ARC-AGI-3 ทดสอบ AI โดยให้เล่นเกมในกริดที่ไม่มีคำอธิบายหรือคำใบ้ใด ๆ เป็นตัวกลางในการทดสอบ ทำให้วัดได้ละเอียดขึ้นว่า AI คิดอย่างไร วางแผนแบบไหน และมีการจดจำกับปรับตัวหรือไม่

ตัว Benchmark ใช้แนวคิด Interactive Reasoning Benchmark (IRB) เพิ่มความซับซ้อนของการโต้ตอบ และการแก้ปัญหาในระยะยาว ทำให้เห็นภาพชัดว่า AI ตัวไหนมีสัญญาณของการเข้าใกล้ AGI จริง
Developer กล่าวว่า วิธีนี้เป็นการเลียนแบบมนุษย์ เพื่อสำรวจ วางแผน และปรับตัวเมื่อเจอสิ่งใหม่ ๆ ซึ่งเป็นทักษะที่ระบบ AI ในปัจจุบันยังเข้าไม่ถึงเลย
ผลลัพธ์ในการประเมินวัดว่า AI เรียนรู้และแก้เกมใหม่ได้เร็วแค่ไหน โดยไม่มีคำใบ้ ผ่านการลองผิดลองถูก ยิ่งใช้ครั้งน้อยและเข้าใจลึก คะแนนยิ่งสูง เปรียบเทียบโดยตรงกับมนุษย์ที่เล่นเกมเดียวกัน

นอกจากนี้ บริษัท HuggingFace จัดการแข่งขัน sprint พร้อมรางวัล 10,000 ดอลลาร์สหรัฐ ผู้เข้าร่วมมีเวลา 4 สัปดาห์ในการสร้างและส่งผลงาน agent ที่ทำคะแนนได้ดีที่สุด โดยใช้ API ที่ทีมงานเตรียมไว้ให้
API สำหรับร่วมการแข่งขัน: https://x.com/arcprize/status/1946260376951398590
ARC-AGI-3 เปิดเต็มรูปแบบในปี 2026
ทดลองเล่น: https://three.arcprize.org/
ข้อสรุป
ARC-AGI-3 Benchmark ที่ใช้เข็มทิศชี้ทางให้ AI ไปสู่การเรียนรู้เป็น ผลลัพธ์นี้จะขับเคลื่อนงานวิจัย, ออกแบบระบบอัจฉริยะจริง, และเร่งความใกล้เคียงของ AGI ในอนาคต