จีนเปิดตัว Qwen2.5-Max โมเดล AI ที่มาแรงแซงทางโค้ง ของทีมงาน Alibaba Cloud ท้าชนกับรุ่นพี่อย่าง Deepseek V3, GPT-4o และ Claude 3.5 Sonnet ด้วยสถาปัตยกรรมสุดล้ำ เน้นประสิทธิภาพและความคุ้มค่า ทำให้สหรัฐฯ เริ่มวิตกกังวลเกี่ยวกับ ความเป็นผู้นำ AI งานนี้ผู้บริหารและผู้นำองค์กรต้องจับตา อาจเป็นการเปลี่ยนแปลงครั้งใหญ่ในวงการ AI ที่ผู้นำองค์กรต้องหันมามอง

โครงสร้างโมเดล

Qwen2.5-Max มาพร้อมกับ สถาปัตยกรรม Mixture-of-Experts (MoE) ไม่ต้องใช้ GPU ประมวลผลมหาศาลเหมือนโมเดล AI ทั่วไป หมายความว่า องค์กรอาจ ลดต้นทุนด้านโครงสร้างพื้นฐานไปได้ถึง 40-60% เลยทีเดียว

ความสำเร็จของ Qwen2.5-Max เกิดจากการพัฒนาอย่างหนักหน่วง ได้เทรนโมเดลนี้ด้วยข้อมูลกว่า 20 ล้านล้าน Tokens พร้อมปรับปรุงประสิทธิภาพด้วยเทคนิค Supervised Fine-Tuning (SFT) และ Reinforcement Learning from Human Feedback (RLHF) ใช้พลัง

จุดเด่นของ Qwen 2.5 Max

  1. ประสิทธิภาพสูงในหลายการทดสอบ
    – Arena-Hard (89.4%): ชุดทดสอบการคิดวิเคราะห์ของ Qwen 2.5 Max นั้นมีคะแนนที่ดีกว่าโมเดล AI ตัวอื่น
    – LiveCodeBench (38.7%): ชุดทดสอบความสามารถด้านการเขียนโค้ด คะแนนดีกว่า Deepseek V3, GPT4O ทำให้โมเดลนี้มีความสามารถด้านการเขียนโค้ด เหมาะกับการแก้ปัญหาเชิงเทคนิคและพัฒนาซอฟต์แวร์
  2. สถาปัตยกรรม Mixture-of-Experts (MoE): รวมโมเดลผู้เชี่ยวชาญหลายตัวที่เลือกใช้เฉพาะโมเดลที่เหมาะกับงานแต่ละชิ้น เพื่อให้ผลลัพธ์ที่แม่นยำที่สุด
  3. เทรนบนข้อมูลขนาดใหญ่มาก: Qwen ถูกฝึกด้วยการเทรนด์ข้อมูลขนาดใหญ่กว่า 20 ล้านล้าน Tokens ทำให้โมเดลนี้มีความสามารถหลากหลายด้าน
  4. ลดต้นทุนโครงสร้างพื้นฐาน: โมเดลนี้เน้นประสิทธิภาพ ไม่พึ่งพาการเชื่อมโหนด GPU (GPU Clusters) แสดงถึงนวัตกรรมด้านสถาปัตยกรรมและการใช้ทรัพยากรอย่างมีประสิทธิภาพ
  5. รองรับการใช้งานผ่าน API: API ของ Qwen ใช้งาน ผ่าน Alibaba Cloud มีชื่อว่า Qwen-Max-2025-01-25 รวมถึง API เข้ากันได้กับ OpenAI API เพื่อส่งข้อความและรับคำตอบ จาก Openai Client สู่ Qwen 2.5 Max ได้

การก้าวกระโดดของ AI จีน

สิ่งที่น่าสนใจคือ จีนสามารถพัฒนา AI ได้ล้ำหน้า แม้จะถูกจำกัดการเข้าถึงชิปขั้นสูง สะท้อนให้เห็นถึงการปรับตัวและ เน้นนวัตกรรมด้านสถาปัตยกรรมและใช้ทรัพยากรอย่างมีประสิทธิภาพ มากกว่าการพึ่งพาพลังประมวลผลแบบเดิม ๆ

องค์กรควรหันมาให้ความสำคัญกับการปรับใช้โมเดลและทรัพยากร รวมถึงความปลอดภัยของข้อมูล, API ที่น่าเชื่อถือ, และการสนับสนุนระยะยาว ด้วย

ทำให้ Qwen2.5-Max ไม่ใช่เทคโนโลยีใหม่ แต่เป็นตัวเปลี่ยนเกม ที่จะทำให้องค์กรเข้าถึง AI ได้ง่ายขึ้น ด้วยต้นทุนที่ลดลงและความสามารถที่เทียบเท่าหรือเหนือกว่าโมเดล AI ค่ายอื่น

โมเดล Qwen 2.5 Max สามารถเล่นได้ผ่าน Qwen Chat

วีดิโอ อธิบายภาพรวมของ Qwen2.5-Max Model

ฟีเจอร์เพิ่มเติม 

Qwen 2.5 Max ยังสามารถเลือก Artifacts สำหรับดูผลลัพธ์ของการเขียนโค้ด, Generate รูปภาพและวีดิโอ ความยาว 5 วินาที ได้แล้ว ด้วยการคลิกปุ่มคำว่า Image Geenration, Video Generation ตรงใต้แถบการพิมพ์ถาม Chatbot เป็นฟังก์ชันรวม 3 in 1 ใน Qwen Chat ที่ตอบโจทย์ต่อผู้ใช้งาน, Design, Developer เป็นพิเศษ

Image Generation

เป็นการเปลี่ยนข้อความเป็นภาพ (Text2Image) เพียงพิมพ์ข้อความ คำสั่งว่า จะสร้างภาพแบบไหน และทำการเลือก อัตราส่วนของภาพ มี 5 ขนาด ดังนี้

  1. 1:1 (สี่เเหลี่ยมจัตุรัส)
  2. 3:4 (แนวตั้ง)
  3. 4:3 (แนวนอน)
  4. 9:16 (แนวตั้ง)
  5. 16:9 (แนวนอน)

Video Generation

เป็นการเปลี่ยนข้อความเป็นวีดิโอ (Text2Video) เพียงพิมพ์ข้อความ คำสั่งว่า จะสร้างวีดิโอเป็นวีดิโออะไร ความยาวมากสุด 5 วินาทีต่อวีดิโอ ข้อจำกัด คือ ไม่สามารถเพิ่มความยาวได้

อัตราส่วนของวีดิโอ มี 5 ขนาด ดังนี้

  1. 1:1 (สี่เเหลี่ยมจัตุรัส)
  2. 3:4 (แนวตั้ง)
  3. 4:3 (แนวนอน)
  4. 9:16 (แนวตั้ง)
  5. 16:9 (แนวนอน)

อนาคต

Qwen 2.5 Max แสดงถึงความฉลาด และไม่ต้องอาศัยทรัพยากรเยอะ แต่เน้นประสิทธิภาพ ผลลัพธ์ด้วยต้นทุนที่ราคาถูกกว่า เพื่อแสดงถึงการปรับตัว, การพัฒนาและความก้าวหน้าใหม่ ๆ ของ AI เพื่อความเป็นผู้นำด้าน AI

ข้อสรุป:

Qwen2.5-Max เป็นโมเดล AI ที่พัฒนาโดย Alibaba Cloud ที่มีประสิทธิภาพสูง ใช้ทรัพยากรน้อยลงและประหยัดต้นทุน โมเดลนี้ได้รับการฝึกฝนด้วยข้อมูลจำนวนมากและเข้าถึงได้ง่ายผ่าน API ของ Alibaba Cloud มีประสิทธิภาพที่เทียบเคียงได้กับโมเดลชั้นนำอื่นๆ หากใครลองเล่นแล้ว มาบอกกันด้วยว่า โมเดลนี้เป็นอย่างไรบ้าง

Source:

Venturebeat, Blog Qwenlm, Demo, API, Qwen Chat