ARC เปิดตัว AGI ใช้เกมเป็นบททดสอบ เปิดโปงช่องว่างความฉลาด AI vs มนุษย์

19 กรกฎาคม 2568 บริษัท ARC Prize เปิดตัว AGI-3 ระบบ AI สามารถรับมือกับปัญหาใหม่ๆ ได้ดีเพียงใด โดยที่ไม่มีการฝึก AI ช่วยจับความสามารถที่พึ่งพาประสบการณ์ได้ชัดๆ

ARC-AGI-3 ทดสอบ AI โดยให้เล่นเกมในกริดที่ไม่มีคำอธิบายหรือคำใบ้ใด ๆ เป็นตัวกลางในการทดสอบ ทำให้วัดได้ละเอียดขึ้นว่า AI คิดอย่างไร วางแผนแบบไหน และมีการจดจำกับปรับตัวหรือไม่

ตัว Benchmark ใช้แนวคิด Interactive Reasoning Benchmark (IRB) เพิ่มความซับซ้อนของการโต้ตอบ และการแก้ปัญหาในระยะยาว ทำให้เห็นภาพชัดว่า AI ตัวไหนมีสัญญาณของการเข้าใกล้ AGI จริง

Developer กล่าวว่า วิธีนี้เป็นการเลียนแบบมนุษย์ เพื่อสำรวจ วางแผน และปรับตัวเมื่อเจอสิ่งใหม่ ๆ ซึ่งเป็นทักษะที่ระบบ AI ในปัจจุบันยังเข้าไม่ถึงเลย

ผลลัพธ์ในการประเมินวัดว่า AI เรียนรู้และแก้เกมใหม่ได้เร็วแค่ไหน โดยไม่มีคำใบ้ ผ่านการลองผิดลองถูก ยิ่งใช้ครั้งน้อยและเข้าใจลึก คะแนนยิ่งสูง เปรียบเทียบโดยตรงกับมนุษย์ที่เล่นเกมเดียวกัน

นอกจากนี้ บริษัท HuggingFace จัดการแข่งขัน sprint พร้อมรางวัล 10,000 ดอลลาร์สหรัฐ ผู้เข้าร่วมมีเวลา 4 สัปดาห์ในการสร้างและส่งผลงาน agent ที่ทำคะแนนได้ดีที่สุด โดยใช้ API ที่ทีมงานเตรียมไว้ให้

API สำหรับร่วมการแข่งขัน: https://x.com/arcprize/status/1946260376951398590

ARC-AGI-3 เปิดเต็มรูปแบบในปี 2026

ทดลองเล่น: https://three.arcprize.org/

ข้อสรุป

ARC-AGI-3 Benchmark ที่ใช้เข็มทิศชี้ทางให้ AI ไปสู่การเรียนรู้เป็น ผลลัพธ์นี้จะขับเคลื่อนงานวิจัย, ออกแบบระบบอัจฉริยะจริง, และเร่งความใกล้เคียงของ AGI ในอนาคต

Source:

ARC Prize, The AI Signal, The Decoder, X

ARC เปิดตัว AGI ใช้เกมเป็นบททดสอบ เปิดโปงช่องว่างความฉลาด AI vs มนุษย์

ข้อสรุป

Source:

Related Contents

12 เล่ม Google Books ขุมทรัพย์สุดขอบโลก AI

สั่งเล่นเกมครั้งเดียวด้วย Agent Google Deepmind เปิดตัว SIMA 2 AI เพื่อนเล่น คิด เรียนรู้เกม 3D รุ่นใหม่เอง

โมเดลเล็ก แก้ปัญหาไว Google Research ปล่อย SRL วิธีสอน AI ทีละ Steps แก้โจทย์โหดได้มากขึ้น 74%