MIT, HuggingFace และมหาลัยชั้นนำในสหรัฐฯ บางแห่ง ได้ทำงานวิจัยเป็น Paper ชื่อว่า Economies of Open Intelligence: Tracing Power & Participation in the Model Ecosystem Paper นี้ศึกษา เศรษฐกิจของโลก Open-Source โดยใช้ข้อมูลจาก Hugging Face Model Hub ตั้งแต่ปี 2020–กลางปี 2025 โดยใช้ข้อมูล โมเดล 851,000 ตัว กับยอดดาวน์โหลดรวม 2.2 พันล้านครั้ง แล้วสรุปออกมาเป็น insight หลัก ๆ ประมาณนี้
- ยักษ์อเมริกันอย่าง Google / Meta / OpenAI เสียส่วนแบ่งไปเยอะ
- นักพัฒนาเดี่ยว ๆ, community, และฝั่งจีน (โดยเฉพาะ DeepSeek กับ Qwen) โผล่ขึ้นมาแรง
- มีผู้เล่นชั้นกลาง (คนที่อยู่ตรงกลางระหว่าง คนสร้างโมเดลใหญ่ กับ คนใช้จริง) ของนักพัฒนา ที่ไม่ได้เทรนโมเดลใหญ่เอง แต่เก่งเรื่องเอาโมเดลใหญ่ไปแพ็กใหม่/ย่อ/จูนให้คนใช้สะดวก
- โมเดลที่ใช้จริงใหญ่ขึ้น มัลติโมดัลมากขึ้น ใช้เทคนิคประหยัดเครื่องมากขึ้น
- ความโปร่งใสเรื่อง ข้อมูลที่ใช้เทรน ถดถอยชัดเจน
เนื้อหานั้นเล่าถึงโลก AI ตอนนี้ Power ไปกองอยู่ที่ใคร และมันขยับไปทิศไหน ทางทีม MIT, HuggingFace ชี้ว่าอำนาจใน AI มักกระจุกที่ 3 อย่าง
- ฝั่ง Compute (เครื่อง/การ์ด)
- ฝั่ง Data
- ฝั่ง คน/องค์กรที่พัฒนาโมเดล
ที่ผ่านมา งานวิจัยมักดู Supply Chain, ฝั่ง data หรือฝั่ง Closed-Source แต่ยังไม่มีใครตามรอยดี ๆ ว่า
- ในโลกโมเดลเปิดเอง อำนาจมันไหลจากใครไปหาใคร
- คุณสมบัติโมเดล แบบไหนกำลังมา แบบไหนเริ่มหายไป
Hugging Face เลยถูกใช้เป็นหน้าต่าง ดู ecosystem นี้ เพราะ
- จากเดิมแค่เอา BERT / GPT-2 แบบ PyTorch มาวาง
- ตอนนี้กลายเป็นแพลตฟอร์มหลักของโมเดลเปิด 2 ล้าน+ โมเดล, 1.7B unique downloads, ครอบคลุมทั้ง text, speech, image, video, tabular หลายภาษา
ย้ายอำนาจ: จากยักษ์ US → dev ตัวเล็ก → จีน
- ยุคแรก: ยักษ์ US ครองทั้งสนาม
- ช่วงก่อนปลาย 2022
- ดาวน์โหลดบน Hugging Face ส่วนใหญ่เป็น Google, Meta, OpenAI
- ประเทศที่นำเกมคือ USA กับยุโรปตะวันตก
- โมเดลยอดฮิตช่วงนั้นคือแนวฝังความหมาย / จัดหมวดข้อความ เช่น BERT, CLIP, YOLO ฯลฯ
- ยุคกลาง: พลังไหลไปหาคนตัวเล็ก
- ช่วง 2022–ต้น 2024
- กระแส diffusion model ทำรูป + การจูนแบบ LoRA ทำให้ dev ตัวเล็กเข้ามาเล่นได้
- ส่วนแบ่งของ Google / Meta / OpenAI ร่วงหนัก กลายเป็นว่า คนไม่สังกัดองค์กร + community ออนไลน์ รวมกันได้ส่วนแบ่งดาวน์โหลดเกินครึ่งในบางช่วง
- ยุคล่าสุด: จีนขึ้น + การรวมศูนย์รอบใหม่
- ปีล่าสุดที่เขาดู (ปลาย 2024–กลาง 2025)
- จีนขึ้นมาที่ 17.1% ของดาวน์โหลด แซง US ที่ 15.7% ครั้งแรก
- โมเดลตระกูล DeepSeek กับ Qwen รวมกันกินไป 14% ของดาวน์โหลดทั้งโลก ในปีเดียว
- ค่าความกระจุกตัวที่เคยลดลง กลับเริ่มสูงขึ้นอีก แปลว่าตลาดเริ่มกลับไปกองอยู่กับผู้นำชุดใหม่ (รอบนี้คือจีน)
รวมถึงการเกิดขึ้นของผู้เล่นชั้นกลาง (Intermediary Developers) เน้นมากว่า ชั้นใหม่ที่สำคัญไม่แพ้คนเทรนโมเดลคือกลุ่มนี้
- องค์กรที่ไม่ได้เน้นเทรนโมเดลฐานเอง แต่เน้นทำสิ่งเหล่านี้:
- ย่อโมเดล (quantize)
- ปรับแต่งเฉพาะด้าน
- แพ็กใหม่ให้ใช้ง่าย
- ทำ adapter แนว creative/ชุมชน
ตัวอย่างเช่น lmstudio-community, comfy, mlx-community, รวมกันมากกว่า 22% ของดาวน์โหลดในปีล่าสุด
ความเปลี่ยนด้านเทคนิค + มาตรฐานใหม่
- MIT, HuggingFace บอกว่า Ecosystem กำลัง:
- ไปทางโมเดล ใหญ่ + มัลติโมดัล + ประหยัดคอมพิวต์มากขึ้น แต่ ความใหญ่ กระจุกที่ผู้เล่นที่มีทรัพยากรเยอะ (ค่าเฉลี่ยใหญ่มาก แต่มัธยฐานขยับนิดเดียว) ทำให้เกิดช่องว่างใหม่ระหว่าง
- กลุ่มที่โฮสต์โมเดลระดับหลายหมื่นล้านพารามิเตอร์ได้ กับ dev ส่วนใหญ่ที่ยังติดข้อจำกัดด้านทรัพยากร
ข้อสรุป:
งานวิจัยชิ้นนี้ เล่าให้เห็นว่า โลก Open-Source กำลังขยับจากยุคที่ยักษ์สหรัฐนำเกม สู่จังหวะที่จีนและนักพัฒนาอิสระเข้ามาถือพลังมากขึ้น ข้อมูลพวกนี้ช่วยให้วางแผนได้ว่าจะผูกพันกับค่ายไหน ใช้โมเดลแบบไหน รวมถึงเห็นช่องว่างของคนที่ทำหน้าที่เป็นชั้นกลาง เอาโมเดลคนอื่นมาปรับให้ตอบโจทย์งานจริง เพื่อชี้ทางเลือกให้ผู้บริหารตัดสินใจได้ง่ายขึ้น




