Wan 2.1 เป็นโมเดล Open-Source การเจนภาพและวีดิโอ เหมือนกับ Kling, Hailuo Minimax, Vidu, Dreamina ของ ByteDance
.
Wan 2.1 ถูกออกแบบมาเพื่อแปลงข้อความให้เป็นรูปภาพและวิดีโอคุณภาพสูง
นี่คือ การรีวิว Wan 2.1 โมเดลเจนภาพและวีดิโอจาก บริษัท Alibaba Group ไม่ธรรมดา ด้านของการเจนภาพและวีดิโอ
เริ่มแรกเราเข้าไปที่หน้าแรกของเว็บไซต์กันครับ เป็นหน้าพื้นหลังสีดำ มีปุ่ม เมนูข้างบนและ คำย่อสั้น ๆ คือ Imagine It, Create It จินตนาการมัน สร้างสรรค์ขึ้นมา โมเดล Wan ถูกพัฒนาาจาก ห้อง Lab Tengyi ของ บริษัท Alibaba มันสามารถเจนวีดิโอ จากข้อความ, รูปภาพและสัญญาณอื่น
นอกจากนี้ Wan 2.1 เป็น โมเดล Open-Source เต็มตัว

มีแถบด้านซ้ายมือ ประกอบด้วย
- Explore
- AI Images: โมเดลเจนภาพ (Text2Image)
- AI Videos: โมเดลเจนวีดิโอ (Text2Video) ด้วยข้อความหรือภาพ มี 2 โหมด
- Favorites: ภาพหรือวีดิโอที่เรากดชื่นชอบผลงานของคนอื่น หากกดไป ก็จะมาบันทึกรวมอยู่ในแถบ Favorites
- Credits: เครดิตสำหรับการเจนภาพและเจนวีดิโอ
- Me: อีเมลที่เราสมัคร เพื่อเข้ามาใช้งาน Wan 2.1
วิธีการรับเครดิต
- Check-in รายวัน : รับ 50 เครดิตทุกวันที่คุณเช็คอิน เครดิตจะหมดอายุหลังจาก 30 วัน
- ให้คะแนนผลงาน : รับ 5 เครดิตสำหรับแต่ละครั้งที่คุณกดถูกใจหรือไม่ถูกใจบนผลงาน (สูงสุด 2 ครั้งต่อวัน) เครดิตจะหมดอายุหลังจาก 30 วัน
- เผยแพร่ผลงาน : รับ 20 เครดิตสำหรับแต่ละผลงานที่คุณเผยแพร่และได้รับการยอมรับ (สูงสุด 2 ครั้งต่อวัน) เครดิตจะหมดอายุหลังจาก 30 วัน
Wan 2.1 มีโหมดการเจน 2 แบบ
- เจนภาพ (AI Images)
- เจนวีดิโอ (AI Videos)
AI Images
เป็นโหมดสำหรับพิมพ์ข้อความแล้ว Generate ออกมาเป็นภาพ

แถบด้านซ้ายมือของหน้า AI Images นั้นประกอบด้วย
- ปุ่มเลือกโมเดลเจนภาพ ดูตรงชื่อ Model Wan 2.1
- ปุ่ม User Guide คู่มือในการเขียน Prompt
- ช่องสำหรับพิมพ์ข้อความ ความยาวของประโยคที่พิมพ์ ไม่เกิน 800 ตัวอักษร
- Enhance Prompt
- บรรทัดถัดจาก Enhance Prompt จะเป็น Prompt Guide

ตรงนี้ หากต้องกาารใช้งาน โหมดนี้ คลิกเข้าไป และจะเป็นไปตามภาพนี้ จากนั้นกด Use it Prompt ใหม่ที่ AI แปลงให้ จะไปแทนที่ Prompt เก่า
ถัดมา จะเป็น Styles Palettes เพื่อเลือกว่า อยากได้ผลลัพธ์ของภาพเป็นแบบไหน

Styles ภาพ 4 แบบ
- Yonkoma การ์ตูน 4 ช่อง
- Paired Avatars ทำรูปภาพออกมาเป็น อวาตาร์ น่ารักและ
- Logo Mockup ออกแบบโลโก้ หรือ Mockup ผ่านสิ่งของบรรจุภัณฑ์ต่าง ๆ
- Movie Stills: เล่าเนื้อหาแบบ Storytelling

โหมด Inspiration เป็นโหมดเพิ่มแรงบันดาลใจ ทางความคิดสร้างสรรค์ ผลลัพธ์ที่ได้อาจแตกต่างจากคำแนะนำต้นทาง
และ Aspect Ratio เลือกอัตราส่วนของภาพ เพื่อให้ผลลัพธ์แสดงผลตามที่เราเลือกไว้
อัตราส่วนของภาพมี 5 แบบ
- 1:1
- 16:9
- 9:16
- 4:3
- 3:4
เริ่มต้นเจนภาพ
จากนี้มาเข้าสู่การเจนภาพจากข้อความกัน หากต้องการอยากให้ช่วยเขียน Prompt มี Enhance Prompt ใน Wan 2.1 หรือ ทุกคนเข้ามาใช้ MyGPTs ใน ChatGPT คีย์คำว่า Wan 2.1 Prompt
ผลลัพธ์ในการเจนภาพ




Prompt: Flower shop, delicate windows, front view, beautiful wooden door name “Flowers Shop”
ผมเจนภาพร้านขายดอกไม้ พร้อมปรากฎชื่อร้านดอกไม้ หน้าร้าน ปรากฎว่า ผลลัพธ์ ทำออกมาดีมาก ทั้งความสมจริงและตัวอักษรชัดมาก ไม่แพ้ Flux

ผลลัพธ์ของการเจนภาพจาก Styles นี้ ส่วนใหญ่จะได้ ฉาก 3 ฉาก เสมอ
ตัวอย่างภาพถัดมาครับ เจนภาพคลื่นแสงสีเหลือง ขาว ในระบบสุริยะ



เจนภาพสไตล์ Logo/MockUp ก็จะเป็นการนำข้อความที่ Import เข้ามา แปลงเป็นโลโก้ และแสดงผลผ่านอุปกรณ์อิเล็คทรอนิกส์

เจนภาพสไตล์ Yonkoma จะได้ออกมาเป็นภาพ ที่มี 4 ช่องแบบหนังสือการ์ตูน
AI Videos
เป็นการเจนวีดิโอจากข้อความหรือรูปภาพ เครดิตในการใช้งานเจนวีดิโอ 1 ครั้งคือ 10 เครดิต

หน้าของ UI Video
- ปุ่มเลือกโหมดการเจนวีดิโอ
1. Text2Video มี 3 เวอร์ชั่น คือ
1. Text2Video 2.0
2. Text2Video 2.1 Turbo
3. Text2Video 2.1 Plus
2. Image2Video
Reference Image จะสามารถเลือกได้ว่า จะลงภาพ 1 ภาพ แล้วให้ Wan 2.1 Generate วีดิโอ ตั้งแต่
ต้นจนจบหรือเลือก Start/End Frame (เจนวีดิโอ โดยกำหนด Frame เริ่มต้นเป็นภาพแรก กับ Frame
สุดท้ายเป็นภาพที่ 2 เพื่อให้ AI คาดเดาตรงช่วงระหว่าง 2 Frame นี้ในการสร้างวีดิโอให้ต่อเนื่องกัน) - ช่องใส่ Prompt มี Enhance Prompt ช่วยให้แนวคิดการเขียน Prompt
- Inspiration Mode โหมดนี้สำหรับเพิ่มแรงบันดาลใจ
- Sound Effects โหมดเพิ่มเสียงให้สอดคล้องกับผลลัพธ์ของวีดิโอ
ทดลองเจนวีดิโอ
Video 1 Video ระยะเวลาในการ Generate คือ 3 นาทีครึ่ง ผลลัพธ์ คือ วีดิโอ ความยาว 5 วินาที นอกจากนี้ Sound Mode ใส่ตรงกับสถานการณ์ของวีดิโอนี้ ได้ตรงเป๊ะมาก
หมายเหตุ: หากการ Generate ผ่านไป 3 นาทีครึ่งแล้ว วีดิโอ ยังไม่มา ให้กด Refresh

คู่มือการเขียน Prompt ของ Wan 2.1 เป็นหัวใจสำคัญของการสร้างสรรค์ภาพและวีดิโอ มีหน้าที่ให้คำแนะนำต่าง ๆ ในการสร้างสรรค์ผลงานออกมาให้ดูประทับใจ น่าตื่นเต้น
Prompts
หลักการ Prompts ของ Wan 2.1 คล้าย ๆ กับโมเดลจีนตัวอื่น ตรงที่เรียง ประธานขึ้นก่อนเสมอ
Basic Prompts:
Prompt = Subject + Scene + Style
Prompt = ประธาน + ฉาก + สไตล์ภาพ

Advanced Prompts
Prompt = Subject + Scene + Style + Camera Language + Atmosphere + Detail Enhancements
Prompt = ประธาน + ฉาก + สไตล์ภาพ + ภาษามุมกล้อง + บรรยากาศ + รายละเอียดที่ต้องปรับปรุง

ข้อได้เปรียบ
- การใช้จ่ายเครดิตต่อครั้งในการเจนภาพและวีดิโอถูก ไม่แพง
- เพิ่มเครดิตประจำวันได้ แต่ต้องรีบใช้ก่อนหมดภายใน 1 เดือน หมายถึง สามารถเจนภาพได้เรื่อย ๆ จนกว่าเครดิตจะหมด และวันใหม่ เพียงมากด check in ก็สามารถเจนภาพต่อได้ ไม่เหมือนกับ Midjourney, Freepik จะไม่สามารถรับเครดิตเพิ่มได้ หากซื้อรายเดือนหรือรายปีแล้ว
- เจนวีดิโอ มีเพิ่ม Sound Effects ได้โดยที่ราคาเครดิตไม่เพิ่มขึ้น คงที่ 10 เครดิต
ข้อจำกัด
- โหมดเจนภาพ หากเลือก Styles Palette ที่ชื่นชอบแล้ว เราไม่สามารถปรับอัตราส่วนของภาพว่า อยากให้ออกมาเป็นขนาด Aspect Ratio เท่าไหร่
- หากเจน Text2Video, Image2Video นานผิดปกติ แสดงว่า มีคนใช้งานเยอะในช่วงเวลานั้น และอาจทำให้ Error
ข้อสรุป:
Wan 2.1 โดดเด่นด้านคุณภาพของรูปภาพและวีดิโอ สามารถออกแบบภาพได้ดั่งใจ เช่น ภาพโฆษณา ภาพไวนิล
Source:
Main website, User Guides, Beartai, PostToday, Reuters, Wan 2.1