เผยแพร่ 8 เมษายน 2569
สรุปสาระสำคัญ
- Seedance 2.0 อ่าน Prompt แบบ “บทภาพยนตร์” ไม่ใช่แค่คำบรรยายภาพ ทำให้ต้องเปลี่ยนวิธีสื่อสารจาก “การบอกเล่า” เป็น “การกำกับช็อต”
- โครงสร้างที่ได้ผลสูงสุดประกอบด้วย 5 องค์ประกอบเรียงลำดับชัดเจน: Subject + Action + Camera + Style + Constraints
- การกำหนดมุมกล้อง แสง และเงื่อนไขจำกัดอย่างชัดเจน ลดโอกาสเกิดภาพบิดเบี้ยว และสร้างวิดีโอระดับโปรดักชันได้ตั้งแต่ครั้งเดียว
Seedance 2.0 ทำงานต่างจาก AI Video รุ่นเก่าอย่างไร?
Seedance 2.0 ไม่ได้ประมวลผล Prompt เป็นคำบรรยายภาพทั่วไปอีกต่อไป แต่โมเดลนี้ตีความคำสั่งเสมือน “ผู้กำกับภาพยนตร์” ที่อ่านบทอย่างละเอียด ตั้งแต่การจัดมุมกล้อง ทิศทางแสง จังหวะการเล่าเรื่อง การเคลื่อนไหวของตัวละคร ไปจนถึงการซิงค์เสียง การเปลี่ยนแปลงนี้ทำให้การเขียนคำสั่งต้องเปลี่ยนแนวคิดพื้นฐาน เพื่อให้โมเดลสามารถควบคุมองค์ประกอบภาพและจังหวะการตัดต่อได้แม่นยำที่สุด
ควรเขียนโครงสร้าง Prompt สำหรับ Seedance 2.0 อย่างไรให้ได้ผลลัพธ์น่าเชื่อถือที่สุด?
โครงสร้าง Prompt ที่ผ่านการทดสอบอย่างละเอียดและให้ผลลัพธ์ที่เสถียรที่สุด ประกอบด้วย 5 องค์ประกอบหลักที่ต้องเรียงลำดับและระบุรายละเอียดให้ชัดเจน ดังนี้:
- Subject (ตัวละคร/วัตถุหลัก): กำหนดให้ชัดเจนว่าใครหรืออะไรอยู่ในฉาก ระบุรายละเอียดเช่น อายุ เสื้อผ้า สีหน้า และท่าทาง
- Action (การกระทำ): อธิบายสิ่งที่เกิดขึ้นโดยใช้รูปประโยคปัจจุบันกาล (Present Tense) และเน้นการเคลื่อนไหวหลักเพียงหนึ่งอย่างต่อช็อต เพื่อให้โมเดลโฟกัสได้ตรงจุด
- Camera (มุมกล้องและการเคลื่อนกล้อง): ระบุการจัดเฟรมและเทคนิคการเคลื่อนไหวกล้อง เช่น Wide (มุมกว้าง), Medium (มุมกลาง), Close-up (ระยะใกล้), Dolly-in (เคลื่อนเข้าหา), Pan (แพนซ้าย-ขวา), Orbit (โคจรรอบ), หรือ Handheld (ถือกล้องมือ)
- Style (สไตล์และโทนภาพ): กำหนดบรรยากาศ แสง การเกรดสี หรืออ้างอิงสไตล์ภาพยนตร์ที่ต้องการ
- Constraints (เงื่อนไขและข้อจำกัด): ลดข้อผิดพลาดทางเทคนิคและรักษาความสม่ำเสมอของฉาก เช่น ใช้คำสั่ง
no distortion(ไม่บิดเบี้ยว),maintain face consistency(รักษาใบหน้าให้คงที่), หรือsteady motion(การเคลื่อนไหวมั่นคง)
ตัวอย่างที่ 1: วิดีโอเกม (Videogame) นำไปใช้งานจริงได้อย่างไร?
Prompt: Cinematic video game trailer, 15 seconds, photorealistic CGI, Unreal Engine 5 quality. The protagonist is a small stone golem with a round cracked stone head, two large glossy black eyes, a tiny straight mouth, chunky segmented rock body, a glowing warm orange energy core in his chest, and a worn red knitted scarf around his neck. The world is a Middle Earth-inspired fantasy realm, ancient and abandoned, no living humans, only crumbling stone statues overgrown with ivy, moss, and wildflowers, ruined castles, collapsed bridges, fallen kingdoms reclaimed by nature. The trailer opens with a wide establishing shot of a vast ruined stone city built into a mountainside covered in vegetation, fog drifting through valleys. The golem walks alone through a corridor of giant overgrown human statues towering above him, his orange core casting warm light on the surrounding stone, red scarf swaying. A dramatic tilt-up reveals a colossal fallen statue of a king lying face-down across a river with wildflowers blooming from its cracks. The golem’s chest core flares bright orange as he slams his stone fists into the ground creating a shockwave of golden energy. Fast combat cuts — the golem fighting shadow creatures made of dark smoke and thorns, dodging, rolling, punching with glowing fists. Slow-motion mid-air shot of the golem, scarf flowing, fist raised, orange energy exploding from his core. A massive wide shot of the golem standing on a cliff edge overlooking an endless abandoned kingdom stretching to the horizon, scarf blowing in the wind, golden hour light. Extreme close-up of his stone face, two glossy black eyes, cracks in his skin, a single tear-shaped drop of golden light rolling down his cheek. Cut to black, title carved in stone with moss and cracks, the orange glow pulsing once behind the text. Epic orchestral soundtrack building from soft strings to full brass and percussion. Melancholic, epic, solitary mood.
การแยกองค์ประกอบใน Prompt นี้:
- Duration: 15 วินาที
- Subject: โกเลมหินตัวเล็ก (หัวหินแตก, ตาดำมันวาว, แกนพลังงานสีส้มเรืองแสงที่อก, ผ้าพันคอแดงซีดๆ) ฉาก: อาณาจักรแฟนตาซีร้างที่ธรรมชาติยึดครอง (รูปปั้นหินพัง, เถาวัลย์, มอส, ปราสาทล่ม)
- Action: เดินผ่านรูปปั้นยักษ์ → แกนพลังงานสว่างวาบ → ต่อยพื้นสร้างคลื่นกระแทก → สู้กับเงามืด → ช็อตสโลว์โมชันกลางอากาศ → ยืนหน้าผามองอาณาจักร → น้ำตาแสงทองไหล → จอดำ/ชื่อเกมปรากฏ
- Camera: Wide establishing shot → Dramatic tilt-up → Fast combat cuts → Slow-motion mid-air → Massive wide shot → Extreme close-up → Cut to black
- Style: Cinematic game trailer, Photorealistic CGI, Unreal Engine 5 quality, Golden hour lighting, โทนเศร้า/ยิ่งใหญ่/โดดเดี่ยว
- Constraints: “no living humans” (บังคับฉากให้ร้างคน), รักษาลักษณะโกเลมให้คงที่ทุกช็อต, พฤติกรรมแสงแกนพลังงานต้องสัมพันธ์กับการกระทำ
- Audio: ดนตรีออร์เคสตราอย่างยิ่งใหญ่ (สายดนตรีเบาๆ ไต่ระดับสู่เครื่องทองเหลือง/เพอร์คัสชัน)
ตัวอย่างที่ 2: แฟชั่น (Fashion) นำไปใช้งานจริงได้อย่างไร?
Prompt: 15 seconds mixed media fashion film combining real filmed footage with animated graphic elements, hand-drawn illustrations, and bold paper cutout shapes layered on top. Dynamic fast-paced rhythmic editing. Group of female models in eclectic vintage fashion (oversized leather jackets, patterned silk scarves, wide-leg trousers, chunky platform boots, layered necklaces, round sunglasses) filmed in real locations: laundromat (lavender color grade), parking lot (orange), diner booth (mint green), stairwell (hot pink). Animated graphic overlays react to models: bold geometric shapes in coral, violet, lemon yellow slide in like paper slapping the screen, partially covering/revealing models. Crude hand-drawn illustrations animate in real time: wiggly, blinking eyes; spinning planets; arrows pointing to outfit details; zigzag lines radiating from the spinning model; a bouncing, drawn crown. Fast shot sequence: model blows bubblegum in diner → cut to model leaning on washing machine with drawn soap bubbles → cut to hand pulling sunglasses down revealing cartoon eyes → cut to two models walking in sync down stairwell from above with paper cutout butterflies → cut to model kicking platform boots toward camera with drawn impact star. Split screen: four models in four locations simultaneously, each in a different background color, moving to the same beat. Halftone texture flashes over shots, turning into high-contrast risograph-style two-tone prints (violet & cream, coral & black). Handwritten words/symbols/arrows scribble across the frame between cuts in thick marker. Final wide shot: all models together in laundromat, frozen mid-laugh, while animated confetti, shapes, doodles, and text explode across the frame and hold. Aesthetic: raw, joyful, loud zine culture meets runway meets cartoon chaos. Color palette: lavender, orange, mint green, hot pink, coral, violet, lemon yellow, black, cream. High energy, photorealistic footage mixed with flat graphic animation.
การแยกองค์ประกอบใน Prompt นี้:
- Duration: 15 วินาที
- Subject: กลุ่มนางแบบแฟชั่นวินเทจ, 4 โลเคชัน (ร้านซักรีด, ลานจอดรถ, บูธไดเนอร์, บันไดหนีไฟ)
- Action: กราฟิกแอนิเมชันตอบสนองการเคลื่อนไหว → ลำดับช็อตเร็ว (เป่าหมากฝรั่ง, พิงเครื่องซักผ้า, ดึงแว่นเผยตาการ์ตูน, เดินลงบันได, เตะบูท) → Split-screen 4 ช่อง → แช่แข็งกลางเสียงหัวเราะ/กราฟิกระเบิด
- Camera: Dynamic rhythmic editing, Split-screen layout, มุม varied (high angle stairs, low angle kick, close-up bubblegum, wide final)
- Style: Mixed media (ฟุตเทจจริง + กราฟิก 2D + ภาพวาดมือ + ตัดกระดาษ), ซีนคัลเจอร์/รันเวย์/การ์ตูน, พาเลตต์สีแยกตามโลเคชัน, Halftone & Risograph texture
- Constraints: “Animated overlays react to models”, Split-screen ต้องขยับตามบีทเดียวกัน, กราฟิกต้องซ้อนทับ/เผยแบบกระดาษ, “frozen mid-laugh”
- Audio: (โดยนัย) บีทดนตรีเร็ว/จังหวะชัดเจนเพื่อ sync การตัดต่อและ split-screen
Expert Insight:
“เคล็ดลับสำคัญในการใช้งาน Seedance 2.0 คือการเปลี่ยน mindset จาก ‘การพิมพ์คำบรรยายภาพ’ ไปสู่ ‘การกำกับการถ่ายทำเสมือนจริง’ เมื่อคุณกำหนดบทบาทของตัวละคร ทิศทางการเคลื่อนกล้อง แสง และขีดเส้นข้อจำกัดที่ชัดเจน โมเดลจะประมวลผลคำสั่งได้ตรงจุด ลดเวลาแก้ไขซ้ำซ้อน และสร้างวิดีโอระดับโปรดักชันได้ตั้งแต่ครั้งเดียว” — ทีมงานผู้เชี่ยวชาญด้าน AI Content Generation
คำถามที่พบบ่อย (FAQ) เกี่ยวกับ Seedance 2.0
Q: Seedance 2.0 รองรับการสร้างวิดีโอความยาวกี่วินาทีต่อ Prompt?
A: โดยทั่วไปโมเดลนี้รองรับการสร้างวิดีโอความยาวมาตรฐานที่ 10-15 วินาทีต่อคำสั่ง ซึ่งเพียงพอสำหรับการสร้างช็อตหรือฉากสั้นๆ ที่มีความต่อเนื่องและควบคุมรายละเอียดได้สูงสุด
Q: ถ้าโมเดลสร้างภาพบิดเบี้ยวหรือหน้าตัวละครเปลี่ยนบ่อย ควรแก้ไขอย่างไร?
A: ให้เพิ่มองค์ประกอบ Constraints ใน Prompt อย่างชัดเจน เช่น ใช้คำสั่ง maintain face consistency, no distortion, หรือ steady motion พร้อมระบุลักษณะทางกายภาพของตัวละครในตอนต้นของ Prompt อย่างละเอียด
Q: Seedance 2.0 สามารถกำหนดเสียงและดนตรีประกอบใน Prompt ได้โดยตรงหรือไม่?
A: ได้ โดยคุณสามารถระบุรายละเอียดของ Soundtrack หรือ Sound Effect ในส่วนท้ายของ Prompt เพื่อให้โมเดลเข้าใจจังหวะการตัดต่อและอารมณ์ของคลิป อย่างไรก็ตาม การแยกสร้าง Audio ในขั้นตอน Post-Production จะให้คุณภาพเสียงที่คมชัดกว่า



