จีนเปิดตัว Qwen2.5-Max โมเดล AI ที่มาแรงแซงทางโค้ง ของทีมงาน Alibaba Cloud ท้าชนกับรุ่นพี่อย่าง Deepseek V3, GPT-4o และ Claude 3.5 Sonnet ด้วยสถาปัตยกรรมสุดล้ำ เน้นประสิทธิภาพและความคุ้มค่า ทำให้สหรัฐฯ เริ่มวิตกกังวลเกี่ยวกับ ความเป็นผู้นำ AI งานนี้ผู้บริหารและผู้นำองค์กรต้องจับตา อาจเป็นการเปลี่ยนแปลงครั้งใหญ่ในวงการ AI ที่ผู้นำองค์กรต้องหันมามอง
โครงสร้างโมเดล
Qwen2.5-Max มาพร้อมกับ สถาปัตยกรรม Mixture-of-Experts (MoE) ไม่ต้องใช้ GPU ประมวลผลมหาศาลเหมือนโมเดล AI ทั่วไป หมายความว่า องค์กรอาจ ลดต้นทุนด้านโครงสร้างพื้นฐานไปได้ถึง 40-60% เลยทีเดียว
ความสำเร็จของ Qwen2.5-Max เกิดจากการพัฒนาอย่างหนักหน่วง ได้เทรนโมเดลนี้ด้วยข้อมูลกว่า 20 ล้านล้าน Tokens พร้อมปรับปรุงประสิทธิภาพด้วยเทคนิค Supervised Fine-Tuning (SFT) และ Reinforcement Learning from Human Feedback (RLHF) ใช้พลัง
จุดเด่นของ Qwen 2.5 Max
- ประสิทธิภาพสูงในหลายการทดสอบ
– Arena-Hard (89.4%): ชุดทดสอบการคิดวิเคราะห์ของ Qwen 2.5 Max นั้นมีคะแนนที่ดีกว่าโมเดล AI ตัวอื่น
– LiveCodeBench (38.7%): ชุดทดสอบความสามารถด้านการเขียนโค้ด คะแนนดีกว่า Deepseek V3, GPT4O ทำให้โมเดลนี้มีความสามารถด้านการเขียนโค้ด เหมาะกับการแก้ปัญหาเชิงเทคนิคและพัฒนาซอฟต์แวร์ - สถาปัตยกรรม Mixture-of-Experts (MoE): รวมโมเดลผู้เชี่ยวชาญหลายตัวที่เลือกใช้เฉพาะโมเดลที่เหมาะกับงานแต่ละชิ้น เพื่อให้ผลลัพธ์ที่แม่นยำที่สุด
- เทรนบนข้อมูลขนาดใหญ่มาก: Qwen ถูกฝึกด้วยการเทรนด์ข้อมูลขนาดใหญ่กว่า 20 ล้านล้าน Tokens ทำให้โมเดลนี้มีความสามารถหลากหลายด้าน
- ลดต้นทุนโครงสร้างพื้นฐาน: โมเดลนี้เน้นประสิทธิภาพ ไม่พึ่งพาการเชื่อมโหนด GPU (GPU Clusters) แสดงถึงนวัตกรรมด้านสถาปัตยกรรมและการใช้ทรัพยากรอย่างมีประสิทธิภาพ
- รองรับการใช้งานผ่าน API: API ของ Qwen ใช้งาน ผ่าน Alibaba Cloud มีชื่อว่า Qwen-Max-2025-01-25 รวมถึง API เข้ากันได้กับ OpenAI API เพื่อส่งข้อความและรับคำตอบ จาก Openai Client สู่ Qwen 2.5 Max ได้
การก้าวกระโดดของ AI จีน
สิ่งที่น่าสนใจคือ จีนสามารถพัฒนา AI ได้ล้ำหน้า แม้จะถูกจำกัดการเข้าถึงชิปขั้นสูง สะท้อนให้เห็นถึงการปรับตัวและ เน้นนวัตกรรมด้านสถาปัตยกรรมและใช้ทรัพยากรอย่างมีประสิทธิภาพ มากกว่าการพึ่งพาพลังประมวลผลแบบเดิม ๆ
องค์กรควรหันมาให้ความสำคัญกับการปรับใช้โมเดลและทรัพยากร รวมถึงความปลอดภัยของข้อมูล, API ที่น่าเชื่อถือ, และการสนับสนุนระยะยาว ด้วย
ทำให้ Qwen2.5-Max ไม่ใช่เทคโนโลยีใหม่ แต่เป็นตัวเปลี่ยนเกม ที่จะทำให้องค์กรเข้าถึง AI ได้ง่ายขึ้น ด้วยต้นทุนที่ลดลงและความสามารถที่เทียบเท่าหรือเหนือกว่าโมเดล AI ค่ายอื่น
โมเดล Qwen 2.5 Max สามารถเล่นได้ผ่าน Qwen Chat
ฟีเจอร์เพิ่มเติม
Qwen 2.5 Max ยังสามารถเลือก Artifacts สำหรับดูผลลัพธ์ของการเขียนโค้ด, Generate รูปภาพและวีดิโอ ความยาว 5 วินาที ได้แล้ว ด้วยการคลิกปุ่มคำว่า Image Geenration, Video Generation ตรงใต้แถบการพิมพ์ถาม Chatbot เป็นฟังก์ชันรวม 3 in 1 ใน Qwen Chat ที่ตอบโจทย์ต่อผู้ใช้งาน, Design, Developer เป็นพิเศษ
Image Generation
เป็นการเปลี่ยนข้อความเป็นภาพ (Text2Image) เพียงพิมพ์ข้อความ คำสั่งว่า จะสร้างภาพแบบไหน และทำการเลือก อัตราส่วนของภาพ มี 5 ขนาด ดังนี้
- 1:1 (สี่เเหลี่ยมจัตุรัส)
- 3:4 (แนวตั้ง)
- 4:3 (แนวนอน)
- 9:16 (แนวตั้ง)
- 16:9 (แนวนอน)
Video Generation
เป็นการเปลี่ยนข้อความเป็นวีดิโอ (Text2Video) เพียงพิมพ์ข้อความ คำสั่งว่า จะสร้างวีดิโอเป็นวีดิโออะไร ความยาวมากสุด 5 วินาทีต่อวีดิโอ ข้อจำกัด คือ ไม่สามารถเพิ่มความยาวได้
อัตราส่วนของวีดิโอ มี 5 ขนาด ดังนี้
- 1:1 (สี่เเหลี่ยมจัตุรัส)
- 3:4 (แนวตั้ง)
- 4:3 (แนวนอน)
- 9:16 (แนวตั้ง)
- 16:9 (แนวนอน)
อนาคต
Qwen 2.5 Max แสดงถึงความฉลาด และไม่ต้องอาศัยทรัพยากรเยอะ แต่เน้นประสิทธิภาพ ผลลัพธ์ด้วยต้นทุนที่ราคาถูกกว่า เพื่อแสดงถึงการปรับตัว, การพัฒนาและความก้าวหน้าใหม่ ๆ ของ AI เพื่อความเป็นผู้นำด้าน AI
ข้อสรุป:
Qwen2.5-Max เป็นโมเดล AI ที่พัฒนาโดย Alibaba Cloud ที่มีประสิทธิภาพสูง ใช้ทรัพยากรน้อยลงและประหยัดต้นทุน โมเดลนี้ได้รับการฝึกฝนด้วยข้อมูลจำนวนมากและเข้าถึงได้ง่ายผ่าน API ของ Alibaba Cloud มีประสิทธิภาพที่เทียบเคียงได้กับโมเดลชั้นนำอื่นๆ หากใครลองเล่นแล้ว มาบอกกันด้วยว่า โมเดลนี้เป็นอย่างไรบ้าง