ลองนึกภาพตาม คุณต้องทำ PPT เสร็จก่อนพรุ่งนี้เช้า หรือทำ Poster แคมเปญ ให้ทีมขายเอาไปยิงต่อ แต่ปัญหาเดิม ๆ คือ ภาพสวยก็จริง…แต่พอมีตัวหนังสือปุ๊บ ทุกอย่างพัง ตัวหนังสือเบี้ยว อ่านยาก จัดวางไม่เป็นระเบียบ แล้วสุดท้ายทีมก็ต้องกลับมานั่งจัดหน้าเองอยู่ดี

10 กุมภาพันธ์ 2569 Alibaba เปิดตัว Qwen-Image-2.0 เข้ามาแก้โจทย์นี้แบบตรง ๆ โมเดลนี้เบาลง และประมวลผลเร็วขึ้น ทำให้ทำงานไวขึ้น ทำได้ทั้งสร้างภาพ + แก้ภาพ (generation + editing) ในโมเดลเดียว

จุดเด่นของ Qwen Image 2.0 ที่ควรรู้

  1. ทำภาพ + ข้อความได้ดีขึ้นแบบงานโปร
    • เหมาะกับงานที่ต้องจัดเลย์เอาต์ เช่น
      • PPT / Slide
      • Infographic
      • Poster / Comic / Calendar
    • สิ่งที่น่าสนใจคือ โมเดลพยายาม “จัดวางข้อความให้เข้าที่” มากขึ้น ไม่ใช่แค่แปะตัวหนังสือลงบนภาพเฉย ๆ
  2. สั่งละเอียดได้ยาวขึ้น (1K tokens)
    • สั่งงานแบบยาว ๆ ได้ ใครที่เคยทำอินโฟกราฟิกที่มีหลายบล็อก หลายหัวข้อ หลายตัวเลข จะเข้าใจดีว่า ความละเอียดของคำสั่ง คือ หัวใจ
  3. ภาพละเอียดระดับ 2K
    • เหมาะกับงานแนวภาพจริง รายละเอียดผิว แสง เงา วัสดุ ดูแน่นขึ้น โดยเฉพาะภาพคน ธรรมชาติ หรือสถาปัตยกรรม
  4. สร้างภาพและแก้ภาพได้ในตัวเดียว
    • มุมนี้สำคัญกับงานองค์กร เพราะมันแปลว่า
      • ลดการสลับเครื่องมือ
      • ลดรอบแก้
      • ลดเวลาทำงานที่ “จุกจิกแต่กินชั่วโมง”
  5. โมเดลเบาขึ้น และเร็วขึ้น
    • ในโลกงานจริง ความเร็วคือเรื่องใหญ่ เพราะงานส่วนมากไม่ได้ทำครั้งเดียวจบ ต้องลองหลายรอบ ปรับหลายเวอร์ชัน

เครื่องมือทำภาพที่มีตัวหนังสือได้ดีขึ้นจริง ผลลัพธ์ คือ ทีมทำคอนเทนต์ไวขึ้น / ผู้บริหารอ่านแล้วเข้าใจไวขึ้น / และลดงานแก้เลย์เอาต์ที่ไม่จำเป็น

เอาไปใช้ทำอะไรได้ทันที

  • ทำ PPT 1 หน้า: timeline, roadmap, สรุปไตรมาส
  • ทำ Infographic ตัวเลข: KPI/OKR, รายงานผล, สรุปแคมเปญ
  • ทำ Poster: เปิดตัวสินค้า, ประกาศภายใน, Employer Branding
  • ทำ ภาพแก้ไข: รวมภาพ, เปลี่ยนองค์ประกอบ, ใส่ข้อความให้เนียนขึ้น

ข้อสรุป:

Qwen-Image-2.0 คือ AI ของจีนที่น่าจับตา เพราะมันพยายามทำให้ภาพที่มีข้อความ ดูเป็นงานจริงขึ้น และทำงานจบง่ายขึ้นในขั้นตอนน้อยลง

Source:

Blog Qwen