MIT, HuggingFace และมหาลัยชั้นนำในสหรัฐฯ บางแห่ง ได้ทำงานวิจัยเป็น Paper ชื่อว่า Economies of Open Intelligence: Tracing Power & Participation in the Model Ecosystem Paper นี้ศึกษา เศรษฐกิจของโลก Open-Source โดยใช้ข้อมูลจาก Hugging Face Model Hub ตั้งแต่ปี 2020–กลางปี 2025 โดยใช้ข้อมูล โมเดล 851,000 ตัว กับยอดดาวน์โหลดรวม 2.2 พันล้านครั้ง แล้วสรุปออกมาเป็น insight หลัก ๆ ประมาณนี้

  1. ยักษ์อเมริกันอย่าง Google / Meta / OpenAI เสียส่วนแบ่งไปเยอะ
  2. นักพัฒนาเดี่ยว ๆ, community, และฝั่งจีน (โดยเฉพาะ DeepSeek กับ Qwen) โผล่ขึ้นมาแรง
  3. มีผู้เล่นชั้นกลาง (คนที่อยู่ตรงกลางระหว่าง คนสร้างโมเดลใหญ่ กับ คนใช้จริง) ของนักพัฒนา ที่ไม่ได้เทรนโมเดลใหญ่เอง แต่เก่งเรื่องเอาโมเดลใหญ่ไปแพ็กใหม่/ย่อ/จูนให้คนใช้สะดวก
  4. โมเดลที่ใช้จริงใหญ่ขึ้น มัลติโมดัลมากขึ้น ใช้เทคนิคประหยัดเครื่องมากขึ้น
  5. ความโปร่งใสเรื่อง ข้อมูลที่ใช้เทรน ถดถอยชัดเจน

เนื้อหานั้นเล่าถึงโลก AI ตอนนี้ Power ไปกองอยู่ที่ใคร และมันขยับไปทิศไหน ทางทีม MIT, HuggingFace ชี้ว่าอำนาจใน AI มักกระจุกที่ 3 อย่าง

  1. ฝั่ง Compute (เครื่อง/การ์ด)
  2. ฝั่ง Data
  3. ฝั่ง คน/องค์กรที่พัฒนาโมเดล

ที่ผ่านมา งานวิจัยมักดู Supply Chain, ฝั่ง data หรือฝั่ง Closed-Source แต่ยังไม่มีใครตามรอยดี ๆ ว่า

  • ในโลกโมเดลเปิดเอง อำนาจมันไหลจากใครไปหาใคร
  • คุณสมบัติโมเดล แบบไหนกำลังมา แบบไหนเริ่มหายไป

Hugging Face เลยถูกใช้เป็นหน้าต่าง ดู ecosystem นี้ เพราะ

  • จากเดิมแค่เอา BERT / GPT-2 แบบ PyTorch มาวาง
  • ตอนนี้กลายเป็นแพลตฟอร์มหลักของโมเดลเปิด 2 ล้าน+ โมเดล, 1.7B unique downloads, ครอบคลุมทั้ง text, speech, image, video, tabular หลายภาษา

ย้ายอำนาจ: จากยักษ์ US → dev ตัวเล็ก → จีน

  1. ยุคแรก: ยักษ์ US ครองทั้งสนาม
    • ช่วงก่อนปลาย 2022
    • ดาวน์โหลดบน Hugging Face ส่วนใหญ่เป็น Google, Meta, OpenAI
    • ประเทศที่นำเกมคือ USA กับยุโรปตะวันตก
    • โมเดลยอดฮิตช่วงนั้นคือแนวฝังความหมาย / จัดหมวดข้อความ เช่น BERT, CLIP, YOLO ฯลฯ
  2. ยุคกลาง: พลังไหลไปหาคนตัวเล็ก
    • ช่วง 2022–ต้น 2024
    • กระแส diffusion model ทำรูป + การจูนแบบ LoRA ทำให้ dev ตัวเล็กเข้ามาเล่นได้
    • ส่วนแบ่งของ Google / Meta / OpenAI ร่วงหนัก กลายเป็นว่า คนไม่สังกัดองค์กร + community ออนไลน์ รวมกันได้ส่วนแบ่งดาวน์โหลดเกินครึ่งในบางช่วง
  3. ยุคล่าสุด: จีนขึ้น + การรวมศูนย์รอบใหม่
    • ปีล่าสุดที่เขาดู (ปลาย 2024–กลาง 2025)
    • จีนขึ้นมาที่ 17.1% ของดาวน์โหลด แซง US ที่ 15.7% ครั้งแรก
    • โมเดลตระกูล DeepSeek กับ Qwen รวมกันกินไป 14% ของดาวน์โหลดทั้งโลก ในปีเดียว
    • ค่าความกระจุกตัวที่เคยลดลง กลับเริ่มสูงขึ้นอีก แปลว่าตลาดเริ่มกลับไปกองอยู่กับผู้นำชุดใหม่ (รอบนี้คือจีน)

รวมถึงการเกิดขึ้นของผู้เล่นชั้นกลาง (Intermediary Developers) เน้นมากว่า ชั้นใหม่ที่สำคัญไม่แพ้คนเทรนโมเดลคือกลุ่มนี้

  • องค์กรที่ไม่ได้เน้นเทรนโมเดลฐานเอง แต่เน้นทำสิ่งเหล่านี้:
  1. ย่อโมเดล (quantize)
  2. ปรับแต่งเฉพาะด้าน
  3. แพ็กใหม่ให้ใช้ง่าย
  4. ทำ adapter แนว creative/ชุมชน

ตัวอย่างเช่น lmstudio-community, comfy, mlx-community, รวมกันมากกว่า 22% ของดาวน์โหลดในปีล่าสุด

ความเปลี่ยนด้านเทคนิค + มาตรฐานใหม่

  • MIT, HuggingFace บอกว่า Ecosystem กำลัง:
  • ไปทางโมเดล ใหญ่ + มัลติโมดัล + ประหยัดคอมพิวต์มากขึ้น แต่ ความใหญ่ กระจุกที่ผู้เล่นที่มีทรัพยากรเยอะ (ค่าเฉลี่ยใหญ่มาก แต่มัธยฐานขยับนิดเดียว) ทำให้เกิดช่องว่างใหม่ระหว่าง
  • กลุ่มที่โฮสต์โมเดลระดับหลายหมื่นล้านพารามิเตอร์ได้ กับ dev ส่วนใหญ่ที่ยังติดข้อจำกัดด้านทรัพยากร

ข้อสรุป:

งานวิจัยชิ้นนี้ เล่าให้เห็นว่า โลก Open-Source กำลังขยับจากยุคที่ยักษ์สหรัฐนำเกม สู่จังหวะที่จีนและนักพัฒนาอิสระเข้ามาถือพลังมากขึ้น ข้อมูลพวกนี้ช่วยให้วางแผนได้ว่าจะผูกพันกับค่ายไหน ใช้โมเดลแบบไหน รวมถึงเห็นช่องว่างของคนที่ทำหน้าที่เป็นชั้นกลาง เอาโมเดลคนอื่นมาปรับให้ตอบโจทย์งานจริง เพื่อชี้ทางเลือกให้ผู้บริหารตัดสินใจได้ง่ายขึ้น

Source:

Data Provenance