Wan 2.1 เป็นโมเดล Open-Source การเจนภาพและวีดิโอ เหมือนกับ Kling, Hailuo Minimax, Vidu, Dreamina ของ ByteDance
.
Wan 2.1 ถูกออกแบบมาเพื่อแปลงข้อความให้เป็นรูปภาพและวิดีโอคุณภาพสูง

นี่คือ การรีวิว Wan 2.1 โมเดลเจนภาพและวีดิโอจาก บริษัท Alibaba Group ไม่ธรรมดา ด้านของการเจนภาพและวีดิโอ

เริ่มแรกเราเข้าไปที่หน้าแรกของเว็บไซต์กันครับ เป็นหน้าพื้นหลังสีดำ มีปุ่ม เมนูข้างบนและ คำย่อสั้น ๆ คือ Imagine It, Create It จินตนาการมัน สร้างสรรค์ขึ้นมา โมเดล Wan ถูกพัฒนาาจาก ห้อง Lab Tengyi ของ บริษัท Alibaba มันสามารถเจนวีดิโอ จากข้อความ, รูปภาพและสัญญาณอื่น

นอกจากนี้ Wan 2.1 เป็น โมเดล Open-Source เต็มตัว

พอเข้าเว็บไซต์มา check in เพื่อให้มีเครดิตในการเจนภาพและวีดิโอกันครับ

มีแถบด้านซ้ายมือ ประกอบด้วย

  1. Explore
  2. AI Images: โมเดลเจนภาพ (Text2Image)
  3. AI Videos: โมเดลเจนวีดิโอ (Text2Video) ด้วยข้อความหรือภาพ มี 2 โหมด
  4. Favorites: ภาพหรือวีดิโอที่เรากดชื่นชอบผลงานของคนอื่น หากกดไป ก็จะมาบันทึกรวมอยู่ในแถบ Favorites
  5. Credits: เครดิตสำหรับการเจนภาพและเจนวีดิโอ
  6. Me: อีเมลที่เราสมัคร เพื่อเข้ามาใช้งาน Wan 2.1

วิธีการรับเครดิต

  1. Check-in รายวัน : รับ 50 เครดิตทุกวันที่คุณเช็คอิน เครดิตจะหมดอายุหลังจาก 30 วัน
  2. ให้คะแนนผลงาน : รับ 5 เครดิตสำหรับแต่ละครั้งที่คุณกดถูกใจหรือไม่ถูกใจบนผลงาน (สูงสุด 2 ครั้งต่อวัน) เครดิตจะหมดอายุหลังจาก 30 วัน
  3. เผยแพร่ผลงาน : รับ 20 เครดิตสำหรับแต่ละผลงานที่คุณเผยแพร่และได้รับการยอมรับ (สูงสุด 2 ครั้งต่อวัน) เครดิตจะหมดอายุหลังจาก 30 วัน

Wan 2.1 มีโหมดการเจน 2 แบบ

  1. เจนภาพ (AI Images)
  2. เจนวีดิโอ (AI Videos)

AI Images

เป็นโหมดสำหรับพิมพ์ข้อความแล้ว Generate ออกมาเป็นภาพ

แถบ UI ของการเจน AI Images

แถบด้านซ้ายมือของหน้า AI Images นั้นประกอบด้วย

  1. ปุ่มเลือกโมเดลเจนภาพ ดูตรงชื่อ Model Wan 2.1
  2. ปุ่ม User Guide คู่มือในการเขียน Prompt
  3. ช่องสำหรับพิมพ์ข้อความ ความยาวของประโยคที่พิมพ์ ไม่เกิน 800 ตัวอักษร
  4. Enhance Prompt
  5. บรรทัดถัดจาก Enhance Prompt จะเป็น Prompt Guide

Enhance Prompt เป็นการปรับปรุง Prompt ที่นำมาใส่ ให้ AI เข้าใจคำสั่งผู้ใช้มากขึ้น

ตรงนี้ หากต้องกาารใช้งาน โหมดนี้ คลิกเข้าไป และจะเป็นไปตามภาพนี้ จากนั้นกด Use it Prompt ใหม่ที่ AI แปลงให้ จะไปแทนที่ Prompt เก่า

ถัดมา จะเป็น Styles Palettes เพื่อเลือกว่า อยากได้ผลลัพธ์ของภาพเป็นแบบไหน

เลือก Styles ของภาพที่เราต้องการ

Styles ภาพ 4 แบบ

  1. Yonkoma การ์ตูน 4 ช่อง
  2. Paired Avatars ทำรูปภาพออกมาเป็น อวาตาร์ น่ารักและ
  3. Logo Mockup ออกแบบโลโก้ หรือ Mockup ผ่านสิ่งของบรรจุภัณฑ์ต่าง ๆ
  4. Movie Stills: เล่าเนื้อหาแบบ Storytelling
โหมด Inspiration

โหมด Inspiration เป็นโหมดเพิ่มแรงบันดาลใจ ทางความคิดสร้างสรรค์ ผลลัพธ์ที่ได้อาจแตกต่างจากคำแนะนำต้นทาง

และ Aspect Ratio เลือกอัตราส่วนของภาพ เพื่อให้ผลลัพธ์แสดงผลตามที่เราเลือกไว้

อัตราส่วนของภาพมี 5 แบบ

  1. 1:1
  2. 16:9
  3. 9:16
  4. 4:3
  5. 3:4

เริ่มต้นเจนภาพ

จากนี้มาเข้าสู่การเจนภาพจากข้อความกัน หากต้องการอยากให้ช่วยเขียน Prompt มี Enhance Prompt ใน Wan 2.1 หรือ ทุกคนเข้ามาใช้ MyGPTs ใน ChatGPT คีย์คำว่า Wan 2.1 Prompt

ผลลัพธ์ในการเจนภาพ

Prompt: Flower shop, delicate windows, front view, beautiful wooden door name “Flowers Shop”

ผมเจนภาพร้านขายดอกไม้ พร้อมปรากฎชื่อร้านดอกไม้ หน้าร้าน ปรากฎว่า ผลลัพธ์ ทำออกมาดีมาก ทั้งความสมจริงและตัวอักษรชัดมาก ไม่แพ้ Flux

ผลลัพธ์ของภาพที่เกิดจากการเลือก Movie Stills จะได้ภาพที่มีฉาก 3 ฉาก Prompt: Create a cat catch a fish in lakes.

ผลลัพธ์ของการเจนภาพจาก Styles นี้ ส่วนใหญ่จะได้ ฉาก 3 ฉาก เสมอ

ตัวอย่างภาพถัดมาครับ เจนภาพคลื่นแสงสีเหลือง ขาว ในระบบสุริยะ

Prompt: A stunning deep-space background with dynamic, glowing light waves in yellow, white, and black, forming a smooth gradient against a vast cosmic backdrop. The energy waves appear like celestial currents, gently illuminating the surrounding stardust. The composition is sleek and futuristic, emphasizing depth and realism. No orange or red hues. Ultra-detailed textures, perfect lighting, and a cinematic 16:9 aspect ratio.

ดาวน์โหลดมา จะเห็นว่า ไม่มีลายน้ำติดอยู่

เจนภาพสไตล์ Logo/MockUp ก็จะเป็นการนำข้อความที่ Import เข้ามา แปลงเป็นโลโก้ และแสดงผลผ่านอุปกรณ์อิเล็คทรอนิกส์

เจนภาพสไตล์ Yonkoma จะได้ออกมาเป็นภาพ ที่มี 4 ช่องแบบหนังสือการ์ตูน

AI Videos

เป็นการเจนวีดิโอจากข้อความหรือรูปภาพ เครดิตในการใช้งานเจนวีดิโอ 1 ครั้งคือ 10 เครดิต

แถบ UI ของ AI Video

หน้าของ UI Video

  1. ปุ่มเลือกโหมดการเจนวีดิโอ
    1. Text2Video มี 3 เวอร์ชั่น คือ
    1. Text2Video 2.0
    2. Text2Video 2.1 Turbo
    3. Text2Video 2.1 Plus
    2. Image2Video
    Reference Image จะสามารถเลือกได้ว่า จะลงภาพ 1 ภาพ แล้วให้ Wan 2.1 Generate วีดิโอ ตั้งแต่
    ต้นจนจบหรือเลือก Start/End Frame (เจนวีดิโอ โดยกำหนด Frame เริ่มต้นเป็นภาพแรก กับ Frame
    สุดท้ายเป็นภาพที่ 2 เพื่อให้ AI คาดเดาตรงช่วงระหว่าง 2 Frame นี้ในการสร้างวีดิโอให้ต่อเนื่องกัน)
  2. ช่องใส่ Prompt มี Enhance Prompt ช่วยให้แนวคิดการเขียน Prompt
  3. Inspiration Mode โหมดนี้สำหรับเพิ่มแรงบันดาลใจ
  4. Sound Effects โหมดเพิ่มเสียงให้สอดคล้องกับผลลัพธ์ของวีดิโอ

ทดลองเจนวีดิโอ

ภาพคนกระโดดบน Trampoline บวกใส่เสียง Sound Mode

Video 1 Video ระยะเวลาในการ Generate คือ 3 นาทีครึ่ง ผลลัพธ์ คือ วีดิโอ ความยาว 5 วินาที นอกจากนี้ Sound Mode ใส่ตรงกับสถานการณ์ของวีดิโอนี้ ได้ตรงเป๊ะมาก

หมายเหตุ: หากการ Generate ผ่านไป 3 นาทีครึ่งแล้ว วีดิโอ ยังไม่มา ให้กด Refresh

Prompt: Hana Mizuki walked around and enjoyed the beautiful cherry blossoms.

คู่มือการเขียน Prompt สำหรับการเจนภาพและวีดิโอใน Wan 2.1

คู่มือการเขียน Prompt ของ Wan 2.1 เป็นหัวใจสำคัญของการสร้างสรรค์ภาพและวีดิโอ มีหน้าที่ให้คำแนะนำต่าง ๆ ในการสร้างสรรค์ผลงานออกมาให้ดูประทับใจ น่าตื่นเต้น

Prompts

หลักการ Prompts ของ Wan 2.1 คล้าย ๆ กับโมเดลจีนตัวอื่น ตรงที่เรียง ประธานขึ้นก่อนเสมอ

Basic Prompts:

Prompt = Subject + Scene + Style

Prompt = ประธาน + ฉาก + สไตล์ภาพ

โครงสร้าง ของ Basic Prompt

Advanced Prompts

Prompt = Subject + Scene + Style + Camera Language + Atmosphere + Detail Enhancements

Prompt = ประธาน + ฉาก + สไตล์ภาพ + ภาษามุมกล้อง + บรรยากาศ + รายละเอียดที่ต้องปรับปรุง

โครงสร้าง ของ Advanced Prompt

ข้อได้เปรียบ

  1. การใช้จ่ายเครดิตต่อครั้งในการเจนภาพและวีดิโอถูก ไม่แพง
  2. เพิ่มเครดิตประจำวันได้ แต่ต้องรีบใช้ก่อนหมดภายใน 1 เดือน หมายถึง สามารถเจนภาพได้เรื่อย ๆ จนกว่าเครดิตจะหมด และวันใหม่ เพียงมากด check in ก็สามารถเจนภาพต่อได้ ไม่เหมือนกับ Midjourney, Freepik จะไม่สามารถรับเครดิตเพิ่มได้ หากซื้อรายเดือนหรือรายปีแล้ว
  3. เจนวีดิโอ มีเพิ่ม Sound Effects ได้โดยที่ราคาเครดิตไม่เพิ่มขึ้น คงที่ 10 เครดิต

ข้อจำกัด

  1. โหมดเจนภาพ หากเลือก Styles Palette ที่ชื่นชอบแล้ว เราไม่สามารถปรับอัตราส่วนของภาพว่า อยากให้ออกมาเป็นขนาด Aspect Ratio เท่าไหร่
  2. หากเจน Text2Video, Image2Video นานผิดปกติ แสดงว่า มีคนใช้งานเยอะในช่วงเวลานั้น และอาจทำให้ Error

ข้อสรุป:

Wan 2.1 โดดเด่นด้านคุณภาพของรูปภาพและวีดิโอ สามารถออกแบบภาพได้ดั่งใจ เช่น ภาพโฆษณา ภาพไวนิล

Source:

Main website, User Guides, Beartai, PostToday, Reuters, Wan 2.1