การเปิดตัวโมเดล AI ของจีน ดุเดือดมาก ในช่วงปี 2025 แต่ละบริษัท งัดไม้เด็ด ออกมาเยอะมาก ปลายเดือนมกราคมที่ผ่านมา เปิดตัว Deepseek เกิดปรากฎการณ์สะเทือนมาก เนื่องจากต้นทุนที่ถูกมาก เพียง 5.6 ล้านดอลลาร์ และล่าสุดมีอีกโมเดลนึง ใช้ต้นทุนต่ำ มีชื่อว่า Light-R1-32B มาดูกัน

เหตุการณ์

5 มีนาคม 67 โมเดล AI น้องใหม่จากบริษัท 360 Security Technology, Inc. (Qihoo 360) มาแรงมาก ขึ้นชื่อเรื่องเป็นเทพคณิตศาสตร์ มีชื่อว่า Light-R1-32B เป็นโมเดล Open-Source ถูกฝึกบนพื้นฐานของ Qwen 2.5-32B-Instruct ของอาลีบาบา ขนาด 32 พันล้านพารามิเตอร์

ทีมวิจัยบอกว่า โมเดลนี้ใช้เวลาฝึกโมเดลไม่ถึง 6 ชั่วโมง บนการ์ดจอ Nvidia H800 12 เครื่อง ค่าใช้จ่ายประมาณ 1,000 ดอลลาร์ ทำให้ Light-R1-32B เป็นแนวทางที่เข้าถึงได้และคุ้มค่าสำหรับพัฒนาโมเดล AI

เทคนิคลับการฝึกโมเดล มี 2 อย่าง

  1. โมเดลแบบค่อยเป็นค่อยไป (Curriculum SFT)
  2. ปรับความเข้าใจให้ตรงกับมนุษย์ (DPO)

เริ่มจากโจทย์ง่ายๆ ไปยาก บวกกับการกรองข้อมูลฝึกผ่าน Data Cleaning 100% ไม่ให้ท่องจำคำตอบ

ความสามารถโมเดล Light-R1-32B

  1. แก้โจทย์คณิตศาสตร์ขั้นสูงได้แม่นยำ
  2. การคิดวิเคราะห์ทางวิทยาศาสตร์
  3. ใช้ทรัพยากรต่ำ แต่ประสิทธิภาพสูง

ทีม Qihoo360 ไม่ได้เน้นขนาดโมเดล แต่เน้นวิธีฝึก และเผยความลับว่า การฝึกให้โมเดลคิดเป็นขั้นตอนแบบมนุษย์ (แม้เริ่มจากโมเดลที่ไม่มีพื้นฐานมาก่อน) คือ กุญแจสำคัญ บวกกับใช้ข้อมูลฝึกที่คัดมา มี 2 ส่วน

การฝึกข้อมูล มี 2 ส่วน

  1. การเรียนรู้แบบเป็นขั้นตอน (Curriculum SFT) จำนวน 76,000 รายการ
  2. การปรับให้ตอบตรงความต้องการมนุษย์ (DPO) จำนวน 3,000 รายการ

ของดีฟรี สำหรับองค์กร

Light-R1-32B ใช้ลิขสิทธิ์ Apache 2.0 แบบอนุญาตเสรี อนุญาตให้ใช้ ดัดแปลง ไม่ต้องแบ่งส่วนต่อยอดให้ใคร ปรับโค้ดได้ตามใจ และมีสิทธิบัตรคุ้มครอง ไม่ต้องกลัวฟ้องร้อง

ข้อสรุป:

Light-R1-32B คือ โมเดล AI สำหรับธุรกิจที่ต้องการ คิดเลขเก่งแบบไม่ต้องจ่ายแพง เหมาะสำหรับพัฒนาแอปคำนวณ วิเคราะห์ข้อมูลทางคณิตศาสตร์, วิทยาศาสตร์ หรือติวเตอร์คณิตศาสตร์

Source:

Venturebeat, Huggingface, AIbase, Wikipedia