ช่วงนี้หลายคนใช้ AI ช่วยงานกันเยอะ…แต่ปัญหาคลาสสิก คือ ตอบเก่ง แต่พอเจอโจทย์ซับซ้อน = เริ่มหลุด / ต้องคอยสั่งทีละขั้น / ต้องคอยเลือกเครื่องมือเอง

26 มกราคม 2569 Alibaba ปล่อย Qwen3-Max-Thinking มาแก้จุดนั้นแบบตรง ๆ ด้วย 2 จุดขายหลัก

  1. Adaptive tool-use เลือกใช้เครื่องมือเอง ระหว่างคุยได้เลย
    • Qwen3-Max-Thinking ใช้ Search / Memory / Code Interpreter แบบอัตโนมัติ ไม่ต้องให้คนมานั่งกดเลือกทุกครั้ง ช่วยลดหลอน, หาข้อมูลได้ทันสถานการณ์, คำนวณ/เช็คตรรกะให้ชัวร์ขึ้น
      • ค้นหาและอัปเดตข้อมูลด้วย Search (Tool use)
        • เวลาต้องการข้อมูลล่าสุด/รายละเอียดเฉพาะ มันสามารถเรียก Search เพื่อไปหาแล้วค่อยตอบ (ช่วยลดมั่ว/ลดหลอน)
      • จำบริบทและความชอบของผู้ใช้ด้วย Memory
        • เก็บบริบทที่สำคัญ จากการคุย เพื่อให้ตอบต่อเนื่องแบบรู้ใจมากขึ้น (เช่น โทนภาษา งานที่ทำ เป้าหมาย)
      • คำนวณ/วิเคราะห์ข้อมูลด้วย Code Interpreter
        • รันโค้ดเพื่อคำนวณ วิเคราะห์ตัวเลข ทำตาราง เช็คตรรกะ หรือช่วยงาน data แบบเร็ว ๆ
        • เหมาะกับงานที่ต้องคำนวณให้ชัวร์ มากกว่าคาดเดา
  2. Test-time scaling (โหมดคิดหนัก)
    • ใช้วิธีคิดเป็นรอบ + ทบทวนตัวเอง ทำให้ Reasoning ดีขึ้นบนหลายงาน เช่น GPQA 90.3 → 92.8 และ HLE (w/ tools) 55.8 → 58.3
    • รวมถึง แก้โจทย์คณิตยาก ๆ (ได้ 98.0 บน HMMT Feb) จนถึง Agentic Search
      • เขียนโค้ด + ช่วยดีบัก (Coding)
        • ช่วยเขียนโค้ดตามโจทย์, อธิบายโค้ด, ช่วยไล่บั๊ก
        • ทำงานแนว coding challenge หรือโจทย์เชิงระบบได้ดีขึ้น
      • ทำงานแบบ Agentic ได้ (Agent capabilities)
        • ช่วยแตกงานเป็นขั้นตอน ทำให้เป็นชิ้น ๆ เช่น ค้นข้อมูล → สรุป → ทำเป็นแผน → ทำเป็นคำตอบ สุดท้าย
        • เหมาะกับงานจริงในองค์กร เช่น วิจัย, วางแผน, drafting, workflow

ข้อสรุป:

Qwen3-Max-Thinking AI ที่เด่นเรื่องคิดเป็น Steps แก้โจทย์ซับซ้อนได้มั่นคงขึ้น และตอบงานยาก ๆ แบบไม่หลุดง่าย หยิบตัวช่วยที่จำเป็นมาใช้เอง ทำให้ข้อมูลชัดขึ้นและผิดพลาดน้อยลง

Source:

Blog Qwen, Testing Catalog, X (Qwen)