การเปิดตัวโมเดล AI ของจีน ดุเดือดมาก ในช่วงปี 2025 แต่ละบริษัท งัดไม้เด็ด ออกมาเยอะมาก ปลายเดือนมกราคมที่ผ่านมา เปิดตัว Deepseek เกิดปรากฎการณ์สะเทือนมาก เนื่องจากต้นทุนที่ถูกมาก เพียง 5.6 ล้านดอลลาร์ และล่าสุดมีอีกโมเดลนึง ใช้ต้นทุนต่ำ มีชื่อว่า Light-R1-32B มาดูกัน
เหตุการณ์
5 มีนาคม 67 โมเดล AI น้องใหม่จากบริษัท 360 Security Technology, Inc. (Qihoo 360) มาแรงมาก ขึ้นชื่อเรื่องเป็นเทพคณิตศาสตร์ มีชื่อว่า Light-R1-32B เป็นโมเดล Open-Source ถูกฝึกบนพื้นฐานของ Qwen 2.5-32B-Instruct ของอาลีบาบา ขนาด 32 พันล้านพารามิเตอร์
ทีมวิจัยบอกว่า โมเดลนี้ใช้เวลาฝึกโมเดลไม่ถึง 6 ชั่วโมง บนการ์ดจอ Nvidia H800 12 เครื่อง ค่าใช้จ่ายประมาณ 1,000 ดอลลาร์ ทำให้ Light-R1-32B เป็นแนวทางที่เข้าถึงได้และคุ้มค่าสำหรับพัฒนาโมเดล AI
เทคนิคลับการฝึกโมเดล มี 2 อย่าง
- โมเดลแบบค่อยเป็นค่อยไป (Curriculum SFT)
- ปรับความเข้าใจให้ตรงกับมนุษย์ (DPO)
เริ่มจากโจทย์ง่ายๆ ไปยาก บวกกับการกรองข้อมูลฝึกผ่าน Data Cleaning 100% ไม่ให้ท่องจำคำตอบ
ความสามารถโมเดล Light-R1-32B
- แก้โจทย์คณิตศาสตร์ขั้นสูงได้แม่นยำ
- การคิดวิเคราะห์ทางวิทยาศาสตร์
- ใช้ทรัพยากรต่ำ แต่ประสิทธิภาพสูง
ทีม Qihoo360 ไม่ได้เน้นขนาดโมเดล แต่เน้นวิธีฝึก และเผยความลับว่า การฝึกให้โมเดลคิดเป็นขั้นตอนแบบมนุษย์ (แม้เริ่มจากโมเดลที่ไม่มีพื้นฐานมาก่อน) คือ กุญแจสำคัญ บวกกับใช้ข้อมูลฝึกที่คัดมา มี 2 ส่วน
การฝึกข้อมูล มี 2 ส่วน
- การเรียนรู้แบบเป็นขั้นตอน (Curriculum SFT) จำนวน 76,000 รายการ
- การปรับให้ตอบตรงความต้องการมนุษย์ (DPO) จำนวน 3,000 รายการ
ของดีฟรี สำหรับองค์กร
Light-R1-32B ใช้ลิขสิทธิ์ Apache 2.0 แบบอนุญาตเสรี อนุญาตให้ใช้ ดัดแปลง ไม่ต้องแบ่งส่วนต่อยอดให้ใคร ปรับโค้ดได้ตามใจ และมีสิทธิบัตรคุ้มครอง ไม่ต้องกลัวฟ้องร้อง
ข้อสรุป:
Light-R1-32B คือ โมเดล AI สำหรับธุรกิจที่ต้องการ คิดเลขเก่งแบบไม่ต้องจ่ายแพง เหมาะสำหรับพัฒนาแอปคำนวณ วิเคราะห์ข้อมูลทางคณิตศาสตร์, วิทยาศาสตร์ หรือติวเตอร์คณิตศาสตร์