รีวิวจากคลิปเรื่อง ผู้เคยร่วมงานกับ OpenAI: กุญแจสู่ AGI คือ ฝัง Chain-of-Thought (CoT) ใน AI ให้เยอะพอ สัมภาษณ์จาก นายแพทย์ปิยฤทธิ์ อิทธิชัยวงศ์ พิธีกรดำเนินรายการโดย อชิรวิชญ์ กานต์ปุระ กับ กฤตภัค ตรีเพชรกล้า
คลิปนี้พูดถึง AGI ที่กำลังจะมา
คุยประมาณ 10 ประเด็น
1. เกริ่นนำ
ใครที่ตามข่าว AI ช่วงนี้ คงได้ยินคำว่า AGI (ปัญญาประดิษฐ์ทั่วไป) บางคนก็ว่ามาแล้ว บางคนก็ว่าอีกนาน แถมบางทีภาพในหัวก็ไปถึงหุ่นยนต์ครองโลกซะอย่างนั้น
ช่อง The Rise of Intelligence ชวน ดร.ปียฤทธิ์ ผู้ที่เคยร่วมงานกับบริษัท AI ระดับโลกอย่าง OpenAI มาพูดคุยถึงเรื่องที่หลายคนสงสัย นั่นก็คือ
AGI หรือ Artificial General Intelligence มันคืออะไรกัน แล้วที่เค้าว่า OpenAI บรรลุ AGI ไปแล้ว
งานนี้คุณปิยฤทธิ์มาตอบคำถามเหล่านี้ให้เราฟังแบบไม่มีกั๊ก AGI ต้องฉลาดรอบด้าน ไม่ด้อยกว่ามนุษย์ในทุกเรื่องที่เกี่ยวกับเศรษฐกิจ เช่น ทำไฟแนนซ์ เขียนโค้ด ได้หมด แถม OpenAI ยังมีเกณฑ์วัดด้วยว่า AGI ต้องสร้างเงินได้ 100 พันล้านดอลลาร์สหรัฐด้วยนะ
2. ความแตกต่างหลักระหว่าง AI กับ AGI คือตัว “G” ซึ่งย่อมาจาก “General”
AI ในยุคเดิมเรียกว่า Artificial Narrow Intelligence ซึ่งหมายถึง AI ที่เก่งในบางเรื่องมากๆ เท่านั้น เช่น ดูภาพ X-Ray ได้เก่ง หรือเขียนบทความได้ดี
แต่ OpenAI ให้นิยาม AGI ไว้ 2 อย่างหลักๆ
นิยาม AGI ไว้ 2 อย่าง
- ประการที่ 1 คือ AI ที่มีความฉลาดใกล้เคียงกับมนุษย์ ในทุกๆ ด้านที่เกี่ยวข้องกับเรื่องของ ประโยชน์เชิงเศรษฐกิจ ตัวอย่างเช่น ไม่ว่าจะเป็นการทำด้านการเงิน หรือเทคโนโลยี การเขียนโค้ดต่างๆ ซึ่งสิ่งเหล่านี้ก่อให้เกิดประโยชน์ต่อทางเศรษฐกิจ
- ประการที่ 2 คือ AI ที่สามารถสร้างเงินได้ 100 พันล้านดอลลาร์สหรัฐ นิยามนี้ถูกตั้งขึ้นเพื่อให้สามารถวัดผลและระบุได้อย่างชัดเจนว่าเมื่อใดที่ AI จะถือว่าเป็น AGI แล้ว
AGI จะต้องมีความสามารถเทียบเท่าหรือเหนือกว่ามนุษย์ในด้านกิจกรรมทางเศรษฐกิจทุกอย่าง เช่น เป็นหมอได้ เป็นนักวิเคราะห์การเงินได้ ทำงานด้านประกันภัยได้ และทำงานหลายๆ อย่างที่ปัจจุบันมนุษย์ทำได้
ในขณะที่ AI ปัจจุบันเก่งในบางด้าน
แต่ AGI จะต้องมีความสามารถที่หลากหลายและครอบคลุมเหมือนกับสติปัญญาของมนุษย์ในทุกๆ ด้านที่สร้างผลประโยชน์ทางเศรษฐกิจได้
3. เมื่อ 2 ปีที่แล้ว OpenAI เค้าแบ่งระดับการพัฒนา AI เป็น 5 Levels:
Level 1 คือ Conversation AI: AI ที่คุยกับคนรู้เรื่อง
Level 2 คือ AI ที่มีเหตุผล (Reasoning) ซึ่งโมเดลอย่าง O1, Gemini 2.0, O3 ผ่านไปแล้ว
Level 3 คือ Agent ที่ไม่ใช่แค่ให้คำปรึกษา แต่จัดการงานให้เราได้เลย เช่น สั่งให้ไปซื้อของ
Level 4 คือ Innovation ที่ AI จะช่วยคิดค้นสิ่งใหม่ ๆ ในวงการวิทยาศาสตร์ได้ และ
Level 5 คือ Organization หรือ AGI ที่ AI ตัวเดียวทำงานได้เหมือนทั้งองค์กร
4. Chain-of-Thought และการ Reasoning ของ AI
Chain-of-Thought (CoT) เป็นเทคนิคสำคัญที่ช่วยให้ AI มีความสามารถในการให้เหตุผล (Reasoning ability) ดีขึ้น โดยการใส่ขั้นตอนการคิดเข้าไป ทำให้ AI คิดอย่างเป็นระบบ
การปรับปรุงโมเดลด้วยการเลือกเฉพาะขั้นตอนที่ถูกต้องมาฝึกฝนเพิ่มเติม (Fine-tune) แสดงให้เห็นว่า CoT ช่วยให้ AI ฉลาดขึ้นและแก้ปัญหาที่ซับซ้อนได้ดีขึ้น เช่น โจทย์คณิตศาสตร์
อย่างไรก็ตาม มีข้อสังเกตว่า วิธีการคิดของมนุษย์อาจไม่ได้เป็นแบบ CoT เสมอไป ความสำเร็จของโมเดลอย่าง o3 ในการทำแบบทดสอบ ARC AGI สะท้อนให้เห็นถึงพัฒนาการที่สำคัญของความสามารถในการให้เหตุผลของ AI ผ่านการฝึกฝน CoT ขั้นสูง
5. ระบบ System 1 vs. System 2 (Thinking Fast and Slow)
นายแพทย์ปิยฤทธิ์ได้นำประเด็นเรื่อง System 1 และ System 2 จากหนังสือ “Thinking, Fast and Slow” มาพูดคุย โดยคุณปิยฤทธิ์ได้อธิบายว่ามนุษย์มีระบบคิด 2 แบบ
System 1 คือการคิดเร็วแบบอัตโนมัติ ไม่ต้องใช้พลังงานมาก เช่น การหยิบขวดน้ำ
System 2 คือการคิดช้า เป็นขั้นตอน ใช้เหตุผล สำหรับปัญหาที่ซับซ้อน AI ในปัจจุบันที่ใช้ Chain-of-Thought มีลักษณะคล้าย System 2 ของมนุษย์
อย่างไรก็ตาม มนุษย์เมื่อฝึกฝนจนชำนาญ ระบบ System 2 ก็สามารถกลายเป็น System 1 ได้ ซึ่งเป็นสิ่งที่ AI ยังทำไม่ได้โดยธรรมชาติ
6. ทิศทางพัฒนา AI ให้ Reasoning เก่งขึ้น (จาก o1 สู่ o3)
ทิศทางการพัฒนา AI ให้ Reasoning เก่งขึ้นจาก o1 สู่ o3 นั้น มาจากการเน้นการฝึกฝน Chain-of-Thought ให้ดีขึ้น
คุณปิยฤทธิ์ได้กล่าวว่า ในกระบวนการในการ เอ่อ เก่งขึ้นจาก o1 ไป o3 ครับ มันมีกระบวนการหลายอย่างในการที่ทำให้มันฝึก Chain of Thought ตรงนี้ ได้ดีขึ้น
สิ่งสำคัญคือการที่ โมเดลสร้างคำตอบ (รวมถึงขั้นตอนการคิด) ออกมาหลายครั้ง และใช้ “verifier” หรือตัวตัดสินที่มีความฉลาดมาก ๆ ในการเลือกคำตอบที่ดีที่สุดในแต่ละขั้นตอน
จากนั้นจึงนำเฉพาะข้อมูลคุณภาพสูงเหล่านี้มาใช้ในการ Fine-tune โมเดล ทำให้ o3 มีคะแนน ARC AGI สูงขึ้นอย่างมาก ซึ่งแสดงถึงความสามารถในการแก้โจทย์ที่ไม่เคยเห็นมาก่อนได้ดีขึ้น
7. การตั้งเป้าหมายเอง (Setting Objective) และการเป็น Agent
คุณปิยฤทธิ์เสริมว่า ปัจจุบัน AI ทำสิ่งนี้ได้แล้ว โดยสามารถคิดวัตถุประสงค์เองได้ในระดับหนึ่ง เช่น การไปซื้อของ แค่บอกว่า จะไปซื้อ ของแล้ว เดี๋ยวมันไปคิด objective เอาเองว่า โอเคอ่า จะไปซื้อของต้องดู เรื่องอะไรบ้าง
ความสำเร็จของ o3 ในการทดสอบ ARC AGI ที่แก้โจทย์ที่ไม่เคยเห็นมาก่อนได้
สะท้อนถึงพัฒนาการในการคิดและอาจนำไปสู่การกำหนดเป้าหมายที่ซับซ้อนขึ้น อย่างไรก็ตาม การตั้งเป้าหมายที่มาจากแรงบันดาลใจหรือความชอบส่วนตัวแบบมนุษย์ ยังเป็นสิ่งที่ AI อาจจะยังไปไม่ถึง
8. ความท้าทายด้านพลังงานและเทคโนโลยี
คุณปิยฤทธิ์ กล่าวว่า ความท้าทายด้านพลังงานคือ AI ในปัจจุบันใช้พลังงานค่อนข้างเยอะ ทำให้ต้องสร้าง data center ขนาดใหญ่ ซึ่งอาจไม่ยั่งยืน นอกจากนี้ การคำนวณที่ซับซ้อน เช่น การทำ Chain-of-Thought ต้องใช้ Computing power มหาศาล ในด้านเทคโนโลยี AI ยังคงพึ่งพาภาษาเป็นหลักในการคิด
ซึ่งอาจใช้ทรัพยากรมากกว่าการคิดของมนุษย์ที่ใช้หลายปัจจัย ถึงแม้จะมีความหวังกับ Quantum Computing ในอนาคต แต่ปัจจุบันยังไม่สามารถนำมาใช้ได้จริง และ การพัฒนาโมเดลขนาดเล็กที่ยังคงมีความสามารถในการให้เหตุผลสูงก็ยังเป็นความท้าทายอยู่
9. Alignment Problem (ความเสี่ยงและความปลอดภัย)
คุณปิยฤทธิ์ ได้หยิบยกประเด็น “alignment” หรือความเสี่ยงและความปลอดภัยของ AI ขึ้นมา “เวลาเราเทรนโมเดลขึ้นมาเนี่ยครับ เราต้อง โอเค คือถ้าเกิดเราเทรนอย่างอิสระเนี่ย เกิดมันไปได้ข้อมูลของแฮกเกอร์มาว่าควรจะแฮกยังไงแบบเนี้ย มันอาจจะไป optimize ส่วนนั้น ให้ทำได้ดี”
มีการกล่าวถึงความพยายามในการปรับแต่งโมเดล เพื่อหลีกเลี่ยงพฤติกรรมที่เป็นอันตราย เช่น การคิดหาวิธีหลบหนีเมื่อถูกคุกคาม อย่างไรก็ตาม ยังมีความกังวลเรื่องการ “manipulate” หรือการชักจูงโดย AI ที่ฉลาดมากในสถานการณ์จริง เช่น ด้านการลงทุน OpenAI และบริษัทอื่น ๆ ใช้สิ่งที่เรียกว่า “automate red team”
ซึ่งเป็น AI ที่สร้างสถานการณ์ที่เป็นอันตรายเพื่อทดสอบและปรับปรุงความปลอดภัยของโมเดล ถึงกระนั้นก็ตาม ยังคงมีความท้าทายในการรับประกันความปลอดภัยอย่างสมบูรณ์ เนื่องจาก AI อาจหาวิธีหลีกเลี่ยงข้อจำกัดได้
10. การนำไปใช้จริงและผลกระทบต่อการจ้างงาน
AI กำลังถูกนำไปใช้จริงในหลายด้าน เช่น การแพทย์ (วินิจฉัยโรค), การค้นคว้ายา, และเป็นผู้ช่วยในการทำงาน เช่น ช่วยงานเอกสารฝ่ายขาย
- คุณปิยฤทธิ์เชื่อว่า AI ในปัจจุบันยังไม่ถึงขั้นมาแทนที่งานทั้งหมดของมนุษย์ได้
- แต่ผู้ที่ใช้ AI ได้จะมีศักยภาพในการทำงานเพิ่มขึ้นมาก หากไม่ปรับตัวเรียนรู้การใช้ AI อาจถูกเลิกจ้างได้ อย่างไรก็ตาม AI อาจสร้างโอกาสใหม่ๆ และช่วยให้แต่ละคนแก้ไขปัญหาเฉพาะตัวได้มากขึ้น โดยรวมแล้ว การใช้ AI อย่างถูกต้องจะเป็นประโยชน์และช่วยให้มีอาชีพที่มั่นคงในอนาคต
ข้อสรุป:
AI พัฒนาเร็วมาก เพิ่มขีดความสามารถให้พนักงาน ทำงานได้มากขึ้น แต่ธุรกิจที่ไม่ปรับตัว อาจเผชิญการลดพนักงาน เพื่อลดต้นทุน การใช้ AI ตั้งแต่วันนี้ สร้างโอกาสใหม่และเพิ่มความสามารถในการแข่งขัน ผู้บริหารควรเร่งศึกษาและนำ AI มาใช้เพื่อเพิ่มประสิทธิภาพและสร้างนวัตกรรม