19 กรกฎาคม 2568 บริษัท ARC Prize เปิดตัว AGI-3 ระบบ AI สามารถรับมือกับปัญหาใหม่ๆ ได้ดีเพียงใด โดยที่ไม่มีการฝึก AI ช่วยจับความสามารถที่พึ่งพาประสบการณ์ได้ชัดๆ

ARC-AGI-3 ทดสอบ AI โดยให้เล่นเกมในกริดที่ไม่มีคำอธิบายหรือคำใบ้ใด ๆ เป็นตัวกลางในการทดสอบ ทำให้วัดได้ละเอียดขึ้นว่า AI คิดอย่างไร วางแผนแบบไหน และมีการจดจำกับปรับตัวหรือไม่

ตัว Benchmark ใช้แนวคิด Interactive Reasoning Benchmark (IRB) เพิ่มความซับซ้อนของการโต้ตอบ และการแก้ปัญหาในระยะยาว ทำให้เห็นภาพชัดว่า AI ตัวไหนมีสัญญาณของการเข้าใกล้ AGI จริง

Developer กล่าวว่า วิธีนี้เป็นการเลียนแบบมนุษย์ เพื่อสำรวจ วางแผน และปรับตัวเมื่อเจอสิ่งใหม่ ๆ ซึ่งเป็นทักษะที่ระบบ AI ในปัจจุบันยังเข้าไม่ถึงเลย

ผลลัพธ์ในการประเมินวัดว่า AI เรียนรู้และแก้เกมใหม่ได้เร็วแค่ไหน โดยไม่มีคำใบ้ ผ่านการลองผิดลองถูก ยิ่งใช้ครั้งน้อยและเข้าใจลึก คะแนนยิ่งสูง เปรียบเทียบโดยตรงกับมนุษย์ที่เล่นเกมเดียวกัน

🏢 นอกจากนี้ บริษัท HuggingFace จัดการแข่งขัน sprint พร้อมรางวัล 10,000 ดอลลาร์สหรัฐ ผู้เข้าร่วมมีเวลา 4 สัปดาห์ในการสร้างและส่งผลงาน agent ที่ทำคะแนนได้ดีที่สุด โดยใช้ API ที่ทีมงานเตรียมไว้ให้

API สำหรับร่วมการแข่งขัน: https://x.com/arcprize/status/1946260376951398590

ARC-AGI-3 เปิดเต็มรูปแบบในปี 2026

ทดลองเล่นhttps://three.arcprize.org/

ข้อสรุป

ARC-AGI-3 Benchmark ที่ใช้เข็มทิศชี้ทางให้ AI ไปสู่การเรียนรู้เป็น ผลลัพธ์นี้จะขับเคลื่อนงานวิจัย, ออกแบบระบบอัจฉริยะจริง, และเร่งความใกล้เคียงของ AGI ในอนาคต

Source:

ARC Prize, The AI Signal, The Decoder, X