สรุปจากคลิป Youtube: AI Agents, Clearly Explained โดย Jeff Su
- ทุกวันนี้เราแค่พิมพ์ถาม ChatGPT หรือ Gemini ก็ได้คำตอบ แต่ทำไมบางครั้ง Bot ถึงตอบไม่ได้?
- เบื้องหลังมีแค่ 3 ขั้น—LLM > Workflow > Agent—พอแยกให้ออก คุณจะรู้ทันเทคโนโลยีทันที
- มาทำความเข้าใจกันว่า ความแตกต่างระหว่าง LLM-AI Workflow-AI Agent พร้อมตัวอย่างงานจริงที่คุณเจอได้ในที่ทำงาน
1. Large Language Model (LLM) ใส่คำถาม LLM ตอบกลับ – ง่ายๆ
– AI ที่เราพิมพ์ถามแล้วตอบกลับ (เช่น ChatGPT, Gemini, Cluade, Qwen)
ข้อจำกัด
- ไม่รู้ข้อมูลส่วนตัว/ข้อมูลบริษัทของคุณ
- ไม่ทำอะไรเองจนกว่าเราจะสั่ง
ตัวอย่าง
- ขอให้ช่วยร่างอีเมล นัดคุยกาแฟ ทำได้สบาย แต่ถาม พรุ่งนี้ฉันว่างกี่โมง? แล้วไปไม่เป็น เพราะไม่เห็นปฏิทินของเรา
2. AI Workflow ใส่คำถาม AI หาข้อมูลจากที่อื่นก่อน แล้วค่อยตอบ
- เส้นทางการทำงานที่มนุษย์วางให้ LLM เดินตามทีละขั้น
มองให้เห็นภาพกว้าง ๆ
- ถ้าถามเรื่องตารางนัด → ดึงข้อมูลจาก Google Calendar
- ถามสภาพอากาศวันนั้น → ดึงจาก Weather API
- รวมผล → ส่งกลับเป็นข้อความ หรือเสียงก็ยังได้
สิ่งที่ต้องพัฒนา: AI Workflow จะตอบได้เฉพาะสิ่งที่เรากำหนดไว้ล่วงหน้าเท่านั้น ถ้าเจอคำถามนอกเส้นทางก็ ไม่ทราบคำตอบ
3. AI Agent AI เป็นผู้ตัดสินใจ ไม่ใช่มนุษย์
LLM ที่เลื่อนขั้นเป็น คนตัดสินใจเอง Reason + Act
ต่างจาก Workflow?
- Reason คิดเองว่า จะดึงข้อมูลจากไหนก่อน–หลัง เพื่อให้บรรลุ เป้าหมาย ไม่ใช่แค่ทำตามขั้นตอน
- Act ใช้เครื่องมือหลายตัว (API, ฐานข้อมูล, โมเดลอื่น) ได้เอง
- Iterate ตรวจงานตัวเอง แก้ จนกว่าจะได้ผลลัพธ์ที่ดีที่สุดที่สำเร็จตามเป้า
Use Case จริง
Andrew Ng เป็นผู้เชี่ยวชาญด้าน AI ระดับแนวหน้า เขาทำเว็บแสดงการทำงานของ AI agent ถ้าผมพิมพ์คำว่า skier เข้าไป เช่น คนเล่นสกีบนหิมะ AI จะค้นหาในคลิปวิดีโอ หาว่าส่วนไหนตรงกับคำนั้น แล้วส่งคลิปนั้นกลับมาให้ผม
เข้าใจ AI 3 ตัวนี้
LLM = ตอบเมื่อถาม
AI Workflow = ทำตามแผนที่คนวาง
AI Agent = คิดเอง ทำเอง ตรวจเอง ได้ทั้งหมด
ข้อสรุป
หากเราเข้าใจความต่างระหว่าง LLM, AI Workflow และ AI Agent—คุณจะรู้ว่าเมื่อไรควรใช้ AI ช่วยตอบ, จัดการงาน, หรือปล่อยให้คิดและทำงานแทนเราได้เลย สามารถประยุกต์ได้ทุกอย่าง ตั้งแต่ชีวิตประจำวันยันการบริหารทีมและโปรเจกต์ใหญ่ ๆ ในองค์กร หรือ StartUp ครับ