DeepSeekMath_V2

27 พฤศจิกายน 2568 DeepSeek เปิดตัว DeepSeekMath_V2 โมเดล AI ด้านคณิตศาสตร์ที่เขียนพิสูจน์ มากกว่าแค่กดเครื่องคิดเลขหาคำตอบ คิดเป็นขั้นตอนเหมือนเด็กโอลิมปิกคณิตฯ เขียนพิสูจน์เป็น ช่วยตรวจงานว่าตรงไหนพลาด ตรงไหนยังไม่รัดกุม ใช้กับโจทย์โอลิมปิกหรือข้อสอบยาก ๆ ได้แบบจริงจัง

ทดสอบกับงานแข่งจริง

  • IMO 2025 กับ CMO 2024 ทำคะแนนถึงระดับ เหรียญทอง
  • Putnam 2024 ทำได้ 118/120 คะแนน สูงกว่ามนุษย์ที่ได้ 90 คะแนน

หลักการทำงานของ DeepSeekMath-V2 เป็นยังไง?

  • DeepSeekMath-V2 ตัวเดียวมีหน้าที่ 3 บทบาท ในตัวเดียวกัน
  1. มีด่านตรวจการบ้านคณิต อยู่ข้างใน (Verifier)
    • ทีมงานฝึกให้มัน
      • อ่าน โจทย์ + วิธีทำ (พิสูจน์)
      • ไล่ดูทีละขั้นว่ามีหลุดตรรกะตรงไหนไหม

แล้วสรุปเป็น 2 อย่าง คือ อธิบายว่า ข้อไหนมีปัญหา และให้คะแนน:

  • 1 = พิสูจน์ครบ ชัด ถูกต้อง
  • 0.5 = โดยรวมโอเค แต่มีจุดขาด/ดีเทลหายไปบ้าง
  • 0 = พิสูจน์พัง มีรูโหว่ใหญ่ หรือเดินผิดทาง

2. มีด่านตรวจคนตรวจอีกที (Meta-verifier)

  • ปัญหา คือ ถ้าแค่ให้คะแนนอย่างเดียว โมเดลอาจมั่วปัญหาขึ้นมาเองแล้วให้คะแนนถูกก็ได้ ทีม DeepSeek จึงเพิ่มอีกชั้นหนึ่ง คือ Meta-Verifier หน้าที่คือ อ่านคำวิจารณ์พิสูจน์ ที่ตัวแรกเขียนไว้ เช็กว่า
  • ที่บอกว่า “ตรงนี้ผิด/มีช่องโหว่” มันผิดจริงไหม
  • วิเคราะห์เหตุผลที่โมเดลใช้ว่าตรงประเด็นไหม

แล้วให้คะแนนความน่าเชื่อถือของการวิเคราะห์นั้น พอเอาคะแนนชั้นที่ 2 มารวมด้วย ด่านตรวจชุดแรกก็จะ ต้องซื่อสัตย์กับข้อผิดพลาดจริง ๆ มากขึ้น เพราะถ้ามั่วปัญหา Meta-verifier จะกดคะแนนลง

3. แล้วด่านพิสูจน์ (Generator) ก็ใช้ 2 ตัวบนมาเป็นครู

1. ด่านที่ทำพิสูจน์

  • เวลาเทรน จะให้มันทำงานประมาณนี้
  • อ่านโจทย์ → เขียนพิสูจน์ออกมาก่อน

2. วิจารณ์งานตัวเองต่อ

  • หาให้ได้ว่ามีข้อไหนน่าสงสัย
  • ตรงไหนไม่รัดกุม
  • แล้วให้คะแนนตัวเองตามกติกาเดียวกับ verifier

3. จากนั้นเอาทั้ง 2 อัน

  • คุณภาพของพิสูจน์จริง
  • ความตรงไปตรงมาในการประเมินตัวเองมาคิดรวมเป็น “รางวัล” ในการฝึก

ด้วยวิธีนี้ โมเดลเลยเรียนรู้ว่า

  • ถ้า หลอกตัวเอง ว่า พิสูจน์ถูกหมดละ ทั้งที่ยังมีที่ผิด → จะโดนหักคะแนน
  • ถ้า กล้ายอมรับว่าตัวเองยังผิด/ไม่สมบูรณ์ แล้วลองแก้ → มีโอกาสได้คะแนนรวมสูงกว่า

DeepSeekMath_V2 ทำได้ดีกว่า Claude Sonnet 4, GPT-5, Qwen 3, Gemini 2.5 Pro

ความสามารถ DeepSeekMath_V2 มีอะไรบ้าง?

  • แก้โจทย์คณิตฯ ระดับแข่งขัน IMO / CMO / Putnam ได้
  • เขียนพิสูจน์ เป็น Steps ไม่ใช่แค่ตอบตัวเลข
  • ช่วยตรวจพิสูจน์ ว่าตรงไหนมีช่องโหว่ หรือตรรกะหลุด แและแก้งานตัวเองได้หลายรอบ จนพิสูจน์ดีขึ้นเรื่อย ๆ ยิ่งใช้เวลามากเท่าไหร่ ก็ยิ่งคิดลึกออกมาได้มากเท่านั้น

ข้อสรุป:

DeepSeekMath V2 ผู้ช่วยคิดคณิตที่เขียนพิสูจน์ได้เอง ตรวจเหตุผลตัวเองได้ ช่วยแตกโจทย์ยากให้เป็น Steps ให้เข้าใจง่ายขึ้น

Source:

Github, HuggingFace