ตั้งแต่ปี 2022 ChatGPT ได้เปิดตัว ทำให้วงการ AI สั่นสะเทือน พอเข้าสู่ปี 2025 เมื่อบริษัทโมเดล AI จากจีน เปิดตัวโมเดล AI ใหม่ ซึ่งหลายคนมองว่า อาจจะกระทบอุตสาหกรรม AI ของอเมริกาทั้งระบบ และอาจจะแซง ChatGPT ได้ด้วย นั่นคือ Deepseek บริษัท AI สัญชาติจีน ส่งผลให้วงการ AI ทั่วโลกต้องจับตามอง
จุดเริ่มต้นของบริษัท Deepseek
หนึ่งในผู้เล่นที่มาแรง ก็คือ DeepSeek บริษัท AI สัญชาติจีน ที่ถูกก่อตั้ง เมื่อเดือนพฤษภาคม 2023 โดยเหลียง เหวินเฟิง เริ่มแรกเขาก่อตั้งกองทุน High-Flyer ก่อน ด้วยความที่เขาหลงใหล AI เขาวางแผนด้วยการสะสมชิป Nvidia ก่อนสหรัฐฯ คว่ำบาตร สิ่งนี้ ทำให้ Deepseek มีทรัพยากรที่เพียงพอและสร้างสิ่งที่ยิ่งใหญ่ จึงเติบโตเป็นบริษัทที่มุ่งเน้นการพัฒนาโมเดล AI ขั้นสูงด้วยแนวทางที่โปร่งใสและตรวจสอบได้
เส้นทางของ Deepseek
เส้นทางของ Deepseek เริ่มจากปลายปี 2023 การเปิดตัว Deepseek Coder โมเดลที่เน้นการเขียนภาษาโปรแกรม ตามมาด้วย Deepseek LLM จากนั้นเดือนพฤษภาคม 2024 ก็ทยอยเปิดตัวโมเดล Deepseek V2 เน้นประสิทธิภาพสูง ราคาถูก, DeepSeek V2-Coder พัฒนาการเขียนโค้ดให้ดีกว่า เวอร์ชั่นก่อน เพื่อสู้กับค่ายโมเดล AI ในจีน
26 ธันวาคม 2024 Deepseek เปิดตัวโมเดล V3 พัฒนาต่อยอดมาจาก V2 ใช้ทรัพยากรที่น้อยลง แต่ยังรักษาประสิทธิภาพ และใช้เทคนิคใหม่ คือ Mixture of Experts (MoE)
15 มกราคม 2025 Deepseek เปิดให้สามารถดาวน์โหลดผ่าน PC, Androis, IOS เพื่อความสะดวกต่อผู้ใช้งาน
21 มกราคม 2025 Deepseek เปิดตัวโมเดล R1 มารูปแบบใหม่ เน้นเป็นเหตุเป็นผล สร้างความสนใจให้กับวงการ AI จน หลายคนบอกว่า อาจจะเป็นคู่แข่งโมเดลของ OpenAI อย่าง o1 เรื่องที่น่าตกใจ คือ ใช้เงินลงทุนในการฝึกโมเดลเพียง 5.6 ล้านดอลลาร์ ถือว่าน้อยมาก ๆ เมื่อเทียบกับบริษัทชั้นนำในสหรัฐฯ ที่จะใช้เงินเป็น 100 ล้านดอลลาร์
เหตุผลที่ทำให้ Deepseek เป็นที่น่าจับตามอง
เหตุผลที่ใช้งบประมาณน้อยส่วนนึง แต่หลัก ๆ มาจาก:
- เทคนิค Mixture of Experts (MoE) เป็นเทคนิคเลือกโมเดล “ผู้เชี่ยวชาญ” มาตอบคำถามเฉพาะทาง ทำให้ลดต้นทุนในการประมวลผลลงไปได้เยอะมาก รวมถึงยังสามารถรักษาความแม่นยำและการตอบสนองที่รวดเร็วไว้ได้ มีความสามารถด้านการคิดวิเคราะห์เชิงเหตุผล, ตอบคำถามทั่วไป, คณิตศาสตร์และการเขียนโค้ดที่เหนือกว่า o1
- RL (Reinforcement Learning) สอนโมเดลด้วยการทดลองผิดถูกเหมือนมนุษย์,
- Multi-Head Latent Attention ที่ช่วยให้โมเดลเข้าใจข้อมูลซับซ้อนได้ดีขึ้น
- Distillation โอนความรู้จากโมเดลใหญ่ไปเล็ก เพื่อให้ใช้งานได้ง่ายขึ้นในหลายสภาพแวดล้อม
ชิปที่ใช้พัฒนา Deepseek
นอกจากนี้ DeepSeek ใช้ชิปประมวลไม่เหมือนกับค่ายอื่น คือ ชิป Nvidia H800 ทำให้หลายคนสงสัยว่า ชิปที่นำมาพัฒนา AI ได้อย่างมีประสิทธิภาพไม่แพ้กันไหม ผล คือ ชิป Nvidia ที่ใช้สามารถเข้าถึง Hardware, Software ที่ล้ำหน้า ทำให้ระบบมีประสิทธิภาพ

ราคา API
อีกจุดนึงที่ เห็นชัด คือ DeepSeek ยังเปิดให้ทุกคนเข้าถึง API ในราคาถูกกว่าคู่แข่ง ราคาเริ่มต้นของ API
- Input 0.55 ดอลลาร์สหรัฐฯ ต่อ 1 ล้าน Tokens
- Output 2.19 ดอลลาร์สหรัฐฯ ต่อ 1 ล้าน Tokens
ราคานี้ ทำให้แอพ Deepseek ได้รับความนิยม ขึ้นแท่นเป็นแอพที่มียอดติดตั้งอันดับ 1 บน App Store

เนื้อหาที่กล่าวมาทั้งหมด แสดงให้เห็นว่า Deepseek พัฒนาต่อเนื่อง มีประสิทธิภาพสูง ต้นทุนต่ำ ทำให้ค่ายอื่น ๆ หรือผู้ที่จะสร้างโมเดล AI สามารถสร้างได้ด้วยราคาถูกลง และข้อมูลเข้าไปได้ทั่วถึง
ข้อสรุป:
DeepSeek เป็นดาวรุ่งวงการ AI ที่น่าจับตามอง โดดเด่นด้วยโมเดล R1 งบประมาณเพียง 5.6 ล้านดอลลาร์ ทำให้โมเดลของพวกเขาแตกต่างจากคู่แข่ง เปลี่ยนโฉมวงการ AI ทั้งในจีนและทั่วโลก แต่แนวทางที่เน้นนวัตกรรมและโอเพนซอร์สเป็นตัวอย่างที่ดีในการสร้างอนาคต AI ที่ยั่งยืนและโปร่งใส อนาคตเราอาจได้เห็น Deepseek ก้าวขึ้นมาเป็นผู้นำในวงการ AI ระดับโลก
Source:
Deepseek, TNN Tech, ลงทุนแมน, Deepseek ขึ้นอันดับ 1 ยอดดาวน์โหลดบน App Store, forbes