27 พฤศจิกายน 2568 DeepSeek เปิดตัว DeepSeekMath_V2 โมเดล AI ด้านคณิตศาสตร์ที่เขียนพิสูจน์ มากกว่าแค่กดเครื่องคิดเลขหาคำตอบ คิดเป็นขั้นตอนเหมือนเด็กโอลิมปิกคณิตฯ เขียนพิสูจน์เป็น ช่วยตรวจงานว่าตรงไหนพลาด ตรงไหนยังไม่รัดกุม ใช้กับโจทย์โอลิมปิกหรือข้อสอบยาก ๆ ได้แบบจริงจัง
ทดสอบกับงานแข่งจริง
- IMO 2025 กับ CMO 2024 ทำคะแนนถึงระดับ เหรียญทอง
- Putnam 2024 ทำได้ 118/120 คะแนน สูงกว่ามนุษย์ที่ได้ 90 คะแนน
หลักการทำงานของ DeepSeekMath-V2 เป็นยังไง?
- DeepSeekMath-V2 ตัวเดียวมีหน้าที่ 3 บทบาท ในตัวเดียวกัน
- มีด่านตรวจการบ้านคณิต อยู่ข้างใน (Verifier)
- ทีมงานฝึกให้มัน
- อ่าน โจทย์ + วิธีทำ (พิสูจน์)
- ไล่ดูทีละขั้นว่ามีหลุดตรรกะตรงไหนไหม
- ทีมงานฝึกให้มัน
แล้วสรุปเป็น 2 อย่าง คือ อธิบายว่า ข้อไหนมีปัญหา และให้คะแนน:
- 1 = พิสูจน์ครบ ชัด ถูกต้อง
- 0.5 = โดยรวมโอเค แต่มีจุดขาด/ดีเทลหายไปบ้าง
- 0 = พิสูจน์พัง มีรูโหว่ใหญ่ หรือเดินผิดทาง
2. มีด่านตรวจคนตรวจอีกที (Meta-verifier)
- ปัญหา คือ ถ้าแค่ให้คะแนนอย่างเดียว โมเดลอาจมั่วปัญหาขึ้นมาเองแล้วให้คะแนนถูกก็ได้ ทีม DeepSeek จึงเพิ่มอีกชั้นหนึ่ง คือ Meta-Verifier หน้าที่คือ อ่านคำวิจารณ์พิสูจน์ ที่ตัวแรกเขียนไว้ เช็กว่า
- ที่บอกว่า “ตรงนี้ผิด/มีช่องโหว่” มันผิดจริงไหม
- วิเคราะห์เหตุผลที่โมเดลใช้ว่าตรงประเด็นไหม
แล้วให้คะแนนความน่าเชื่อถือของการวิเคราะห์นั้น พอเอาคะแนนชั้นที่ 2 มารวมด้วย ด่านตรวจชุดแรกก็จะ ต้องซื่อสัตย์กับข้อผิดพลาดจริง ๆ มากขึ้น เพราะถ้ามั่วปัญหา Meta-verifier จะกดคะแนนลง
3. แล้วด่านพิสูจน์ (Generator) ก็ใช้ 2 ตัวบนมาเป็นครู
1. ด่านที่ทำพิสูจน์
- เวลาเทรน จะให้มันทำงานประมาณนี้
- อ่านโจทย์ → เขียนพิสูจน์ออกมาก่อน
2. วิจารณ์งานตัวเองต่อ
- หาให้ได้ว่ามีข้อไหนน่าสงสัย
- ตรงไหนไม่รัดกุม
- แล้วให้คะแนนตัวเองตามกติกาเดียวกับ verifier
3. จากนั้นเอาทั้ง 2 อัน
- คุณภาพของพิสูจน์จริง
- ความตรงไปตรงมาในการประเมินตัวเองมาคิดรวมเป็น “รางวัล” ในการฝึก
ด้วยวิธีนี้ โมเดลเลยเรียนรู้ว่า
- ถ้า หลอกตัวเอง ว่า พิสูจน์ถูกหมดละ ทั้งที่ยังมีที่ผิด → จะโดนหักคะแนน
- ถ้า กล้ายอมรับว่าตัวเองยังผิด/ไม่สมบูรณ์ แล้วลองแก้ → มีโอกาสได้คะแนนรวมสูงกว่า
DeepSeekMath_V2 ทำได้ดีกว่า Claude Sonnet 4, GPT-5, Qwen 3, Gemini 2.5 Pro
ความสามารถ DeepSeekMath_V2 มีอะไรบ้าง?
- แก้โจทย์คณิตฯ ระดับแข่งขัน IMO / CMO / Putnam ได้
- เขียนพิสูจน์ เป็น Steps ไม่ใช่แค่ตอบตัวเลข
- ช่วยตรวจพิสูจน์ ว่าตรงไหนมีช่องโหว่ หรือตรรกะหลุด แและแก้งานตัวเองได้หลายรอบ จนพิสูจน์ดีขึ้นเรื่อย ๆ ยิ่งใช้เวลามากเท่าไหร่ ก็ยิ่งคิดลึกออกมาได้มากเท่านั้น
ข้อสรุป:
DeepSeekMath V2 ผู้ช่วยคิดคณิตที่เขียนพิสูจน์ได้เอง ตรวจเหตุผลตัวเองได้ ช่วยแตกโจทย์ยากให้เป็น Steps ให้เข้าใจง่ายขึ้น




