Adaptation-of-Agentic-AI

18 ธันวาคม 2568 เว็บ Arxiv ได้เผยแพร่ Papers นึงชื่อว่า Adaptation of Agentic AI เสนอ Framework แบบใหม่ เพื่อจัดระเบียบวิธีการปรับตัวเหล่านี้ให้เข้าใจง่าย โดยแบ่งตาม 2 ฝั่งใหญ่ ๆ คือ ตัว Agent กับ เครื่องมือ และ สัญญาณที่ใช้บอกว่าทำดี/ไม่ดี ก็มาจากคนละทางได้ด้วย

การ Adaptation จึงกลายเป็นประเด็นหลักเพื่อทำให้ระบบได้ ผลงานดีขึ้น + เชื่อถือได้ขึ้น + ไปได้หลายสถานการณ์ขึ้น

Agentic AI คืออะไร + Adaptation คืออะไร (ในมุมคนทำระบบ)

  • Agentic AI เป็นระบบที่รับรู้สภาพแวดล้อม → เรียกใช้เครื่องมือภายนอก → มีความจำ → ทำงานหลายขั้นเพื่อปิดงาน
  • Adaptation คือ การไปปรับชิ้นส่วนของระบบ เพื่อให้มันทำงานได้ดีขึ้นและนิ่งขึ้น เส้นทางการปรับหลัก ๆ เป็น 2 ทางที่คนวงการคุ้นเคยคือ Prompt Engineering กับ Fine-Tuning
  • Prompt Engineering = ปรับวิธีสั่ง/บริบท/ตัวอย่าง ให้โมเดลเล่นบท Agnet ได้ดีขึ้น (เหมือนเราจัดสคริปต์ให้มันทำงานเป็นขั้นเป็นตอน)
  • Fine-Tuning = ปรับพฤติกรรมในตัวโมเดลด้วยข้อมูล/ฟีดแบ็กเพิ่ม

ภาพรวม 4 กล่อง ให้จำง่ายว่า Adaptation ในโลก Agentic AI ถูกจัดเป็น 4 กลุ่มใหญ่: A1, A2, T1, T2

ทำไมต้องแบ่งเป็น A1/A2/T1/T2

  • เพราะ Framework คือ แยกก่อนว่าเราปรับอะไร และ ใช้สัญญาณจากไหนมาบอกว่าทำดีไหม
  1. แกนที่ 1: ปรับ Agent หรือ Tool
    • Agent = foundation model ที่เป็นตัวคิด/วางแผน/สั่งงาน
    • Tool = ส่วนที่เรียกใช้งานได้แยกจากตัวโมเดล เช่น API, โมเดลเฉพาะทาง, subagent หรือแม้แต่ memory
  2. แกนที่ 2: สัญญาณมาจากไหน
    • มาจาก ผลลัพธ์การรันเครื่องมือจริง
    • มาจาก ผลลัพธ์สุดท้ายที่เอเจนต์ตอบ/ทำออกมา

1. A1: ปรับ Agent จากผลงานเครื่องมือ (เน้นเทคนิคการใช้)

  • สอนให้ Agent ใช้เครื่องมือให้เก่งขึ้น โดยดูจากผลลัพธ์ที่ชัดเจนของการใช้เครื่องมือนั้นๆ เช่น เขียนโค้ดแล้วรันผ่านไหม, ค้นหาข้อมูลแล้วได้ตรงหรือเปล่า
  • เน้นฝึกทักษะการใช้เครื่องมือ (Mechanics) ให้แม่นยำ เหมือนฝึกช่างให้ใช้ประแจได้คล่องแคล่ว

2. A2: ปรับ Agent จากผลงานสุดท้าย (เน้นกลยุทธ์การคิด)

  • สอนให้ Agent ฉลาดขึ้นโดยดูจากคำตอบสุดท้ายว่า ดีแค่ไหน ไม่ว่าจะใช้เครื่องมือหรือไม่ก็ตาม
  • เน้นฝึกกลยุทธ์ (Strategy) การคิดและการแก้ปัญหาแบบองค์รวม เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด เหมือนฝึกผู้บริหารให้วางแผนงาน

3. T1: ปรับ Tool แบบอิสระ (เน้นของสำเร็จรูป)

  • สร้างเครื่องมือ (Tools) ที่เก่งเฉพาะทางขึ้นมาต่างหาก โดยไม่ได้ผูกติดกับ Agent ตัวไหนเป็นพิเศษ แล้วค่อยเอามาให้ Agent หยิบไปใช้
  • เน้นความง่ายและหลากหลาย (Plug-and-Play) สร้างครั้งเดียว เอาไปใช้กับ Agent ตัวไหนก็ได้ เหมือนมีกล่องเครื่องมือครบชุดให้เลือกใช้

4. T2: ปรับ Tool โดยมี Agent คุม (เน้นผู้ช่วยรู้ใจ)

  • แทนที่จะไปยุ่งกับ Agent ตัวหลักที่แพงและแก้ยาก เราหันมาสร้าง ผู้ช่วย (Tools/Subagents) ตัวเล็กๆ ที่ปรับจูนมาเพื่อรับใช้ Agent หลักโดยเฉพาะ โดยใช้ผลลัพธ์จาก Agent หลักเป็นตัวสอน
  • เน้นการพลิกมุมมอง แทนที่จะแก้ตัวใหญ่ เรามาสร้างตัวเล็กที่เก่งเฉพาะเรื่องให้มาช่วยงาน ซึ่ง ประหยัดข้อมูลกว่ามาก (บางทีใช้ข้อมูลน้อยกว่า A2 ถึง 70 เท่า!) และไม่ไปกระทบความรู้เดิมของ Agent หลักด้วย

ฝั่ง Agent-centric (A1/A2) ให้ความยืดหยุ่นสูง เพราะมัน “เอาความสามารถไปฝังในตัวโมเดล” ได้ แต่แลกกับ ค่า compute สูง และเสี่ยง catastrophic forgetting (ฝึกเพิ่มแล้วลืมของเดิม)

ฝั่ง Tool-centric (T1/T2) โยกภาระไปที่ ecosystem รอบ ๆ ทำให้ “เป็นชิ้นเป็นส่วน และมักประหยัดข้อมูล/ประหยัดการเปลี่ยนแปลงระบบโดยรวมมากกว่า

Papers นี้ไม่ใช่เรื่องทฤษฎีล้วน

  • Agentic AI ไปอยู่ในงานจริงเยอะ ตั้งแต่งานวิทยาศาสตร์ จนถึง software และ Clinical research และที่น่าสนใจ คือ มันมักไม่ได้ใช้แนวทางเดียวจบ แต่เป็น ลูกผสม ตามงาน ตามข้อจำกัด และตามเครื่องมือที่มี

3 เรื่องใหญ่ที่ ถ้าไม่แก้ Agent จะไปต่อยาก

  • การทำ Agentic AI รุ่นถัดไป ต้องแก้โจทย์เชิงระบบมากขึ้น ไม่ใช่แค่ทำให้ตอบเก่ง โดยชี้ 3 เรื่องหลัก ๆ คือ
  1. Continual adaptation: ทำให้ปรับตัวได้เรื่อย ๆ ในโลกที่เปลี่ยนตลอด
  2. Safe adaptation: ปรับตัวแบบไม่พาระบบไปสู่ความเสี่ยง เช่น reward hacking
  3. Efficient adaptation: ทำให้ปรับได้แม้ทรัพยากรจำกัด (เช่น on-device)

ข้อสรุป:

อนาคตของ Agentic AI ไม่ใช่การมี Super Agent ตัวเดียวที่ทำได้ทุกอย่าง แต่จะเป็นระบบที่ทำงานร่วมกันระหว่าง Agent หลักที่มั่นคงและฉลาด กับ เครือข่ายของ Tools และผู้ช่วยตัวเล็กๆ ที่ปรับตัวได้เก่งและเชี่ยวชาญเฉพาะด้าน

Source:

Papers: https://arxiv.org/pdf/2512.16301

Arxiv: https://arxiv.org/abs/2512.16301