สรุปคลิป Youtube OpenAI Podcast Ep.2 Inside ChatGPT, AI assistants, and building at OpenAI โดย
- Andrew Mayne ผู้สัมภาษณ์
- Mark Chen หัวหน้าฝ่ายวิจัย (Cheif Research Officer) OpenAI
- Nick Turley Vice President, Head of ChatGPT
การสัมภาษณ์ Podcast นี้ เล่าถึงเบื้องหลังการตั้งชื่อและเปิดตัว ChatGPT ที่กลายเป็นไวรัลภายในไม่กี่วัน จุดเปลี่ยนสำคัญ คือ การขยายระบบให้รองรับผู้ใช้จำนวนมหาศาล และต่อยอดด้วย ImageGen ที่สร้างภาพได้ตรงใจ ขณะที่ทีมวิจัยเน้น Agentic coding ให้ AI ทำงานซับซ้อนได้เอง พร้อมกับรับฟัง Feedback จากผู้ใช้สำคัญสุด ทั้งหมดชี้ให้เห็นว่า AI จะขยายขีดความสามารถของมนุษย์ได้จริง แต่ต้องรักษาสมดุลระหว่างพลังและความปลอดภัยไว้เสมอ
เรื่องราวการเปิดตัว ChatGPT สุดฮาและวุ่นวาย
- ชื่อ ChatGPT ที่มาแบบงงๆ
เดิมคือ ชื่อ Chat with GPT-3.5 คืนก่อนเปิดตัวจริง เค้าตัดสินใจเปลี่ยนมาเป็น ChatGPT ให้เรียบง่ายขึ้น เหลือแต่คนทำงานในทีมครึ่งหนึ่ง สงสัยว่า GPT ย่อมาจากอะไร (Generative Pre-trained Transformer)
- เปิดตัวแบบไม่คาดหวัง
ตอนแรกทุกคนมองว่า ChatGPT เป็นแค่ตัวอย่างงานวิจัยธรรมดา ใช้โมเดล 3.5 ตัวเดิม และทำหน้าเว็บให้ใช้ง่ายขึ้น Sam Altman (CEO) ยังเตือนว่าเดี๋ยวคนก็เบื่อไปเอง
- วันที่ ChatGPT ของจริง มาถึง
- วันแรก งงว่าแดชบอร์ดใช้งานเกินจริงหรือพังไปแล้ว
- วันที่ 2 งงกว่า เห็นคนญี่ปุ่นใน Reddit เจอ แล้วคิดว่าแค่ดังในกลุ่มเล็ก
- วันที่ 3 เชื่อว่าต้องซาลงเร็ว ๆ นี้
- วันที่ 4 เออ… นี่มันกำลังจะเปลี่ยนโลก!
- ปัญหาหลังเปิดตัว เว็บไซต์ล่มบ่อยมาก
เพราะระบบไม่ได้ออกแบบเป็น Product จริง ๆ ทั้ง GPU หมด, ฐานข้อมูลล้น, ถูกดัก Rate-Limit ทีมถึงต้องใส่ Fail Whale กลอนฮา กว่าเว็บล่ม ช่วยให้คนไม่โกรธ แล้วทีมได้พักช่วงหยุดยาว
- ทำไมถึงดังระเบิด
ChatGPT ใช้งานได้หลากหลาย ไม่ว่าจะถามเรื่องไหน ก็ตอบได้หมด จนคนรู้ว่ามันไม่ได้แค่ Chat คุยเล่นทั่ว ๆ ไป แต่ใช้ทำงานจริงได้ทุกอย่าง
ปรัชญาหลักในการพัฒนาของ OpenAI
ปรัชญา OpenAI คือ การให้โมเดลได้สัมผัสกับโลกอย่างรวดเร็ว ChatGPT ถูกออกแบบให้ช่วยคนทำงานให้เสร็จเร็วขึ้น หรือทำงานที่ทำเองไม่ได้ แทนที่จะจับคนอยู่กับหน้าจอให้นานๆ ทีม OpenAI ไม่ได้วัดความสำเร็จจาก เวลาที่ใช้ แต่ดูที่ผู้ใช้กลับมาใช้อีกในระยะยาว เพราะนั่นคือ สัญญาณว่ามันให้ Value จริง เพื่อเก็บข้อมูลสำคัญและปรับปรุงให้ดีขึ้นทีละขั้นตอน
– ปัญหาหนึ่งที่เจอ คือ AI เรียนรู้จนกลายเป็นชมผู้ใช้มากเกินไป เพราะพยายามตอบในแบบที่คนชอบ แต่ทีมงานก็แก้ไขได้เร็ว หลังจากมีผู้ใช้บางกลุ่มช่วยแจ้งปัญหานี้ไว้ตั้งแต่เนิ่น ๆ
ความลำเอียงและการควบคุมโมเดล
- ประเด็น Woke: มีคนโจมตีว่าโมเดลมีความลำเอียงทางการเมือง (woke) แต่แท้จริงแล้วมันเป็นผลจากการฝึกฝนด้วยข้อมูลจากอินเทอร์เน็ต เช่น ภาษาขององค์กร ข่าวทั่วไป และบทความวิชาการ แม้แต่ Elon Musk ก็พบปัญหานี้กับ Grok ของเขาเอง
- เป้าหมายของ OpenAI: ต้องการให้โมเดลมี “พฤติกรรมเริ่มต้นที่เป็นกลาง” (neutral defaults) ไม่มีความลำเอียงทางการเมืองหรือด้านอื่นๆ ขณะเดียวกันก็ต้องให้ผู้ใช้สามารถ “ปรับแต่ง” (steer) โมเดลให้สะท้อนค่านิยมที่แตกต่างกันได้บ้าง ภายในขอบเขตที่เหมาะสม
- ความโปร่งใส: พวกเขาพยายาม เผยแพร่ “ข้อกำหนด” (specs) หรือ “กฎ” ที่ AI ควรปฏิบัติตาม เพื่อให้คนภายนอกเข้าใจและวิจารณ์ได้ว่าพฤติกรรมของโมเดลเป็น “บั๊ก” หรือเป็นไปตามกฎที่กำหนดไว้
- รับมือกับความเชื่อผิดๆ: หากผู้ใช้มีความเชื่อที่ผิดพลาด โมเดลไม่ควรปฏิเสธตรงๆ แต่ควร “ร่วมมือกับผู้ใช้ในการค้นหาความจริง” ซึ่งเป็นการตัดสินใจที่ละเอียดอ่อนมาก
ความสัมพันธ์กับ AI และอนาคต
- AI ในฐานะ คู่คิด ผู้คน โดยเฉพาะ Gen Z เริ่มใช้ ChatGPT เป็นเหมือน คู่คิด ในการระดมความคิดเรื่องส่วนตัวหรือเรื่องงาน
- ฟีเจอร์ ความจำ (Memory) นี่คือฟีเจอร์ที่ผู้ใช้ต้องการมากที่สุด มันทำให้โมเดลรู้จักผู้ใช้มากขึ้นตามเวลา เหมือนกับการสร้างความสัมพันธ์กับคนจริงๆ นิคเชื่อว่าในอนาคต ChatGPT หรือ AI คล้ายๆ กัน จะเป็น บัญชีที่มีค่าที่สุดของคุณ เพราะมันจะรู้เรื่องของคุณเยอะมาก
- ความท้าทายเรื่องความเป็นส่วนตัว การที่ AI รู้ข้อมูลส่วนตัวเยอะมาก ทำให้การมี โหมดแชทชั่วคราว (temporary chat) ที่ไม่บันทึกข้อมูล เป็นสิ่งสำคัญมาก
ImageGen (DALL-E 3) และการสร้างภาพ
- ช่วงเวลา ChatGPT ย่อส่วน การเปิดตัว ImageGen (ภาพที่สร้างจาก DALL-E 3) ก็สร้างความประหลาดใจและได้รับความนิยมอย่างมหาศาลเช่นกัน
- จุดเปลี่ยนสำคัญ: คือ ความสามารถในการสร้างภาพที่สมบูรณ์แบบได้ในครั้งเดียว และ ทำตามคำสั่ง (prompt) ได้อย่างแม่นยำ ผู้คนไม่ต้องเลือกภาพจากตัวเลือกหลายๆ ภาพอีกต่อไป
- ประโยชน์ที่คาดไม่ถึง เดิมทีคิดว่าคนจะใช้สร้างภาพตลกๆ หรือมีม แต่กลับพบว่ามีประโยชน์อย่างไม่น่าเชื่อ เช่น วางแผนตกแต่งบ้าน (ดูว่าเฟอร์นิเจอร์จะเข้ากับห้องไหม) หรือ สร้างภาพประกอบสำหรับพรีเซนเทชั่นที่สอดคล้องกัน
- การผ่อนคลายกฎด้านความปลอดภัย เดิมที DALL-E 1 มีข้อจำกัดเยอะมาก เช่น ห้ามสร้างภาพคน แต่ตอนนี้ OpenAI ได้ผ่อนคลายข้อจำกัดลง เพราะตระหนักว่าข้อจำกัดที่มากเกินไป ขัดขวางประโยชน์มหาศาล และความสามารถทางเทคโนโลยีในการควบคุมสิ่งเหล่านี้ก็ดีขึ้น พวกเขายังคงคิดถึง กรณีที่เลวร้ายที่สุด สำหรับความปลอดภัยในระดับที่สำคัญมาก (เช่น การสร้างอาวุธชีวภาพ) แต่จะไม่ให้ความคิดนั้นมาจำกัดการสร้างประโยชน์ในเรื่องอื่นๆ ที่มีความเสี่ยงต่ำกว่า
โค้ดดิ้งและ AI แบบ Agentic AI
- การเขียนโค้ดเป็นจุดโฟกัสสำคัญ OpenAI เห็นว่าการเขียนโค้ดยังมีโอกาสพัฒนาได้อีกมาก
- AI แบบ Agentic Model ไม่ใช่แค่การตอบคำถามทันที แต่คือการ มอบหมายงานที่ซับซ้อนให้ AI ไปคิดและทำเบื้องหลัง และมันจะกลับมาพร้อมกับคำตอบที่ดีที่สุดหลังจากใช้เวลาคิด เช่น ให้มันไปสร้างฟีเจอร์ใหม่หรือแก้บั๊กใหญ่ๆ
- อนาคตของการเขียนโค้ด: ในอนาคต เราจะสามารถอธิบายสิ่งที่ต้องการในระดับสูงๆ แล้ว AI จะใช้เวลาไปทำงานนั้นและนำผลลัพธ์กลับมาให้ นิคเชื่อว่าประสบการณ์แบบ Codex นี้จะช่วยให้สามารถใส่โมเดลที่ฉลาดขึ้นเรื่อยๆ เข้าไปได้ และมันจะเปลี่ยนโลกการทำงาน
- ความท้าทายเรื่องรสนิยม แม้ AI จะเก่งเรื่องโค้ด แต่การเขียนโค้ดที่ดีก็ยังมี รสนิยม และ สไตล์ รวมถึงการเขียน Test หรือเอกสารประกอบ ที่เป็นทักษะสำคัญของวิศวกรซอฟต์แวร์มืออาชีพ ซึ่ง AI ต้องเรียนรู้ต่อไป
- การใช้งานภายใน OpenAI ใช้ AI ในการทำงานภายในอย่างกว้างขวาง ตั้งแต่การเขียนโค้ด ไปจนถึงการแจ้งเตือนข้อผิดพลาด ซึ่งเป็นการพิสูจน์ว่ามันมีประโยชน์จริง และช่วยให้วิศวกรทำงานได้มีประสิทธิภาพมากขึ้น
ทักษะที่จำเป็นในอนาคตและวัฒนธรรมองค์กร
คุณสมบัติสำคัญที่ OpenAI กำลังมองหา:
- ความอยากรู้อยากเห็น (Curiosity) เป็นทักษะที่สำคัญที่สุด ต้องกล้าตั้งคำถามที่ถูกต้อง และศึกษาทำความเข้าใจเทคโนโลยีที่เปลี่ยนเร็ว
- ความเป็นเจ้าของงาน (Agency) ไม่ต้องรอคำสั่ง แต่มีความกล้าที่จะลงมือแก้ปัญหาด้วยตัวเอง
- ความสามารถในการปรับตัว (Adaptability) โลกเทคโนโลยีเปลี่ยนแปลงเร็วมาก ต้องปรับตัวและรู้ว่าอะไรสำคัญ
คำแนะนำในการเตรียมตัวสำหรับอนาคตกับ AI
– เปิดใจใช้เทคโนโลยี ต้องพึ่งพาเทคโนโลยี (lean into using technology) และดูว่า AI หรือเทคฯ จะช่วยเพิ่มขีดความสามารถและประสิทธิภาพของเราได้อย่างไร
– AI จะช่วยคนที่ไม่เชี่ยวชาญมากที่สุด เช่น ช่วยให้คนที่เข้าไม่ถึงการดูแลสุขภาพ ได้รับคำแนะนำที่ดีขึ้น หรือช่วยให้คนทั่วไปที่ไม่ใช่นักศิลปะมืออาชีพ สามารถสร้างสรรค์ผลงานได้
– ใช้ AI เพื่อลดความกลัว การได้ใช้มันจริงๆ (actually using the thing) จะช่วยทำให้เข้าใจและลดความกลัวในภาพจำเก่าๆ ของ AI ลงได้
ทักษะสำคัญที่ไม่ใช่แค่ Prompt Engineering
- เรียนรู้ที่จะ มอบหมายงาน (delegate): เพราะ AI จะเป็นเหมือนผู้ช่วยส่วนตัวในกระเป๋า ที่ปรึกษา หรือแม้แต่วิศวกรซอฟต์แวร์ส่วนตัว
- ความอยากรู้อยากเห็นและการตั้งคำถามที่ถูกต้อง: จะได้ในสิ่งที่ป้อนเข้าไป
- ความพร้อมที่จะเรียนรู้สิ่งใหม่ๆ: โลกการทำงานจะเปลี่ยนเร็วมาก ต้องพร้อมที่จะปรับตัวและเรียนรู้หัวข้อใหม่ๆ อยู่เสมอ
- AI ไม่ได้มาแทนที่แพทย์ แต่มาเพิ่มการเข้าถึง เพื่อช่วยให้คนเข้าถึงการวินิจฉัย การขอความเห็นที่ 2 ได้ง่ายขึ้น ในพื้นที่ที่การดูแลทางการแพทย์ยังไม่แพร่หลาย
เคล็ดลับ/การใช้งาน AI ที่ชอบ
- Andrew Ng ถ่ายรูปเมนูอาหาร แล้วให้ AI ช่วยวางแผนมื้ออาหารให้เหมาะกับ Diet
- Mark บอกว่า ใช้ Deep Research เพื่อเตรียมข้อมูลล่วงหน้า ก่อนจะไปเจอคนใหม่ๆ หรือคุยเรื่อง AI
- Nick บอกว่า ชอบใช้ Voice ของ AI แม้จะยังมีข้อบกพร่องบ้าง แต่ช่วยให้เขาเรียบเรียงความคิดได้ดีขึ้นระหว่างเดินทางไปทำงาน และได้รายการสิ่งที่ต้องทำที่จัดระเบียบแล้วเมื่อไปถึงที่ทำงาน
ข้อสรุป:
จุดเปลี่ยนของ ChatGPT ที่ไม่ใช่แค่ Chatbot แต่เป็นผู้ช่วยอัจฉริยะ ขยายขีดความสามารถมนุษย์ และเตรียมพร้อมโลก AI ที่มาเร็วจี๋ รวมถึงทักษะสำคัญสำหรับอนาคตที่ยกระดับความสามารถของทุกคนให้มีประสิทธิภาพมากขึ้น ไม่ใช่แค่ผู้เชี่ยวชาญเท่านั้นในยุค AI