สรุป Session: กล้อง + AI แต่งภาพไว สร้างสรรค์ได้ทะลุขีดจำกัด จาก IMI Show 2025 โดย ภัทรภูมิ เติงจันต๊ะ แอดมิน เพจ Prompt Alchemist และแอดมินกลุ่ม Stable Diffusion Thailand
.
คุณภูมิ จะพูดถึงการใช้งาน AI ที่ไม่ค่อยมีใครพูดถึงนะครับ แต่เป็นที่แพร่หลายในอุตสาหกรรม Graphic Design เป็น Open Source มันต่างกับ AI ทั่ว ๆ ไปยังไง แล้วเรานำมาใช้ประโยชน์ยังไงได้บ้างนะครับ
.
โดยแสดงตัวอย่างสถานที่ที่คุณภูมิไปบรรยายและเทรนนิ่งตามหน่วยงานและองค์กร
.
คุณภูมิเฉลยว่า โปรแกรมที่เปิดให้ทุกคนดู คือ Comfy UI ซึ่งเป็นโมเดล Open Source พี่ภูมิเรียกแอพนี้ อีกชื่อนึงว่า No Code โปรแกรม

ตัวอย่างของผลลัพธ์ภาพที่ถูกเจนเรียบร้อยแล้ว


คุณภูมิแสดงตัวอย่างของการเจนภาพ
1. ตัวอย่าง เราต้องการที่จะแก้ไขภาพ ผมใส่แว่นตาเปลี่ยนเป็นแว่นกันแดดที่มีรูปทรงและสีแบบนี้ ผมแค่ระบายตรงส่วนของแว่นของผม แล้วก็เอาภาพแว่นตาที่ผมต้องการเนี่ยเป็น Reference แล้วก็ Generate ขึ้นมาเป็นภาพคนใส่แว่น

Workflow ของ ComfyUI สำหรับการเจนภาพ


คุณภูมิบอกว่า ยิ่งกว่านั้น สมมุติ ผมมีโจทย์มา ว่า “อยากให้หมูเด้งมาเกาะตรงแขนผม” ก็สามารถที่จะแค่เพิ่มหมูเด้งเข้าไปได้นะครับ

หน้าจอโปรแกรม Comfy UI เป็นโปรแกรมที่ใช้แพร่หลายมากในงาน Graphic Design และงานวีดีโอ ต่าง ๆ ไม่ว่าจะเป็นโมเดลด้านภาพ,วีดีโอ,ภาษา หรือโมเดล Vision มาผสมกันให้เกิดเป็น Workflow ที่เข้ากับงานของเราได้

ทุกอย่างให้มัน “Automation” แล้วก็ออกมาเป็นแว่นตาเนี่ยใส่บนหน้าผมได้เลย ก็สามารถปรับแต่งได้อย่างละเอียดแล้วก็ นำไปออกแบบอะไรได้มากมายครับ

คุณภูมิเปิดสไลด์ถัดไปเป็นวีดิโอ พูดว่า ตัวอย่างถัดมา เราสามารถที่จะแก้ไขภาพได้ เอาภาพ “น้องหมีเนย” เข้าไปเป็น “Speaker” ในงาน Nvidia อันนี้ก็เป็นตัวอย่างที่ตอนที่ AI สามารถมา “ช่วยงาน” ของเราก่อน

คุณภูมิกล่าวต่อว่า การที่เราจะทำงานพวกนี้ เราต้องทำไงบ้างครับ?

คุณภูมิ ตอบว่า ทุกอย่างจบแค่การระบายในส่วนที่เราต้องการ เราก็พิมพ์ Prompt เข้าไปแล้วก็รอแค่ประมาณ 10 กว่า วินาที เราก็ได้ภาพที่เราต้องการแก้ไขแล้ว

คุณภูมิกล่าวถึง Generative AI ว่า เพราะฉะนั้น Generative AI คือ Possibility เมื่อ 2 ปีก่อน AI เป็นของแค่พวก Software Engineer หรือพวกนักวิจัยใช้กัน

แต่ทำไม AI มันถึงเข้าไปมีส่วนในชีวิตประจำวันของเรา?

เพราะว่า AI ตอนนี้เป็น “Generative” นั่นคือ เราสามารถสร้าง New Content ขึ้นมา จากสิ่งที่ไม่มีอยู่ได้ หรือจากความต้องการของเราได้เช่นกันนะครับ

ผลลัพธ์จากการ Inpaint แก้ไขภาพ โดยใช้พารามิเตอร์ที่ต่างกัน เพื่อสร้างความแตกต่างของผลลัพธ์

ขั้นตอนการ Generate ภาพ

AI เรียนรู้สิ่งต่าง ๆ มากมาย เข้าไปเป็น Dataset นะ อาจจะมีภาพอยู่จำนวนพันล้านถึงหมื่นล้านภาพ ภาพที่เราเทรนเข้าไปมีเป็นพันล้านภาพ

AI เรียนรู้ทุกอย่างนะครับ เช่น คน, สัตว์, สิ่งของแทบจะทุกอย่างที่มีอยู่ในอินเทอร์เน็ต พอเรียนรู้สิ่งต่าง ๆ เข้าไปนั้น มันสามารถที่จะแค่สร้างภาพขึ้นมาใหม่ตามคำสั่งของเราได้นะ เช่น ผมสั่งว่า “แมวสีขาวใส่ชุดคริสต์มาสแล้วก็ถือกองของขวัญ” นะครับ

AI ถูกสอนให้เห็นภาพแมว, กล่องของขวัญ หรือภาพ Santa Cross นะครับ

AI มันสามารถเอา concept ต่าง ๆ เหล่านี้มา รวมผสมกันเพื่อสร้างเป็น Content ใหม่ได้ นะครับ อันนี้คือสิ่งที่ผมเรียกว่า “Enrate possibility” ของการใช้ Generative AI นะครับ

คุณภูมิกล่าวต่อ ก่อนไปยัง Close Source ว่า ทำไมผมถึงใช้โมเดล Open Source เพราะบางงานหรือบางโจทย์ เราได้โจทย์ที่ไม่สามารถจบในโปรแกรมต่าง ๆ บนอินเทอร์เน็ตหรือในตลาดได้

Close Source

แต่สิ่งที่โมเดล Close Source ทำไม่ได้ คือ สิ่งที่ยังไม่รู้จัก เช่น “หมูเด้ง” นะครับ โมเดล Close Source มันจะมี Dataset ของพวกการ์ตูนดัง ๆ เช่น หมี, โปเกมอน ฯลฯ ที่มัน Generate ได้

พอเป็นหมูเด้ง ดังนะ อาจจะยังไม่ดังระดับที่มีอยู่ใน Dataset ทำให้เมื่อใช้โปรแกรมต่าง ๆ ทำใน Photoshop ง่ายมาก เลยแค่ select แล้วก็พิมพ์ว่า “หมูเด้ง Baby Hippo” แต่สิ่งที่ออกมา เหมือนหมูเด้ง เพราะโมเดลของบริษัทต่าง ๆ ไม่ว่าจะเก่งแค่ไหน ถ้ามันไม่รู้จัก ไม่สามารถทำได้

ผมใช้โมเดล Open Source ถึงโมเดลมันจะไม่รู้จักหมูเด้ง ทางออกคือ เราสามารถเอา DataSet ของ “หมูเด้ง” จากภาพที่อยู่ตามข่าวต่าง ๆ จำนวนแค่ 10-20 ภาพ เข้าไปเทรนให้ AI มันรู้จักเสร็จ แล้วเนี่ยเราก็สามารถ Generate ขึ้นมาเป็นภาพ “หมูเด้ง” ที่เหมือนหมูเด้งจริง ๆ ได้

คุณภูมิเล่าถึงการใช้ ComfyUI ประยุกต์กับงานถ่ายภาพนางแบบว่า

งานพวกนี้เราสามารถปรับไปใช้ได้อีกหลากหลายมากในวงการนางแบบ เพียงสร้างภาพนางแบบขึ้นมาให้ถือสินค้าของเราอีกทีหนึ่ง ถ้าเป็นเมื่อก่อนการทำงานแบบนี้ เราต้องทำไงบ้าง?

ขั้นตอนการสร้างภาพนางแบบถือสินค้า

  1. นัดนางแบบ
  2. นัดช่างภาพ
  3. มีทีมจัดไฟ
  4. ทีม Retouch หรืออะไรก็ตาม

ซึ่งอาจจะใช้เวลา 2-3 วันแล้วก็งบประมาณที่ใช้ ทั้งค่าสถานที่ ค่านางแบบ ค่าช่างกล้องเยอะมาก แต่เราสามารถสร้างภาพนางแบบให้ถือสินค้าของเราในสถานที่ต่าง ๆ ได้ในเวลาแค่ไม่กี่วินาที

ถ้ามีงานด่วนเข้ามา ใช้ AI เราสามารถทำได้ในเวลาแค่ไม่กี่นาที หรือชั่วโมงเดียวก็จบแล้วนะครับ ถ้าใช้จริง ๆ เนี่ย มันสามารถต่อยอดได้ในงานแทบทุกสาย ผมย้ำว่างานทุกสายนะครับ

คุณภูมิกล่าว เรื่องเจนวีดิโอต่อว่า ส่วนในงานวีดีโอ เราเห็นตามโซเชียลมากมายใช่ไหมครับ ว่ามีแมวทำอาหารหรืออะไรก็ได้ แล้ว

คำถามที่คุณภูมิเตรียมตัวพูดในส่วนของการเจนวีดิโอ

  1. Comfy UI ทำวีดีโอได้ไหมครับ?
  2. มีข้อดีข้อเด่นยังไงบ้าง?

ตอนนี้วีดีโอในเว็บส่วนใหญ่ มีต้นทุนที่ค่อนข้างสูง เพราะการ Generate ครั้งละใช้พลังงานการประมวลผลที่เยอะมาก ทำให้ต้นทุนในการ Generate วีดีโออยู่ที่ประมาณ 8-15 บาทต่อครั้ง

แต่ตอนนี้มีโมเดลวีดีโอที่ถูกปล่อยเป็น Open Source ให้เราใช้ฟรีได้ 100% บนเครื่องของเราเอง ใช้ผ่าน ComfyUI ได้

ต่อมาการ Generate วีดีโอแบบนี้ ถ้าเรามีคอมพิวเตอร์ที่บ้านและการ์ดจอสำหรับเล่นเกมที่แรงพอ ก็สามารถ Generate วีดีโอขึ้นมาได้เองโดยไม่ต้องพึ่งเซอร์เวอร์ราคาแพง ไม่ต้องจ่ายค่า Token หรือค่าใช้จ่ายเพิ่มเติม แค่เสียดอกเบี้ยเรื่องไฟกับการใช้งานอินเทอร์เน็ต (หรือแบบออฟไลน์ก็ได้)

คุณภูมิเล่าบอกต่อไปว่า การแก้ไขภาพกัน ว่าจะทำได้อย่างไร

การแก้ไขภาพกัน ว่าจะทำได้อย่างไร

เราสามารถแก้ไขจาก prompt อย่างเดียวได้ง่าย ๆ เช่น ภาพคน ๆ นึง ระบายไปที่ตา (ภาพที่ผมใส่แว่นแบบนี้) แล้วผมพิมพ์ prompt ว่า “a man wearing sun gazet”

สิ่งที่มันสร้างขึ้นมานั้นเนียนมาก ๆ มีเงาให้ด้วย รวมทั้งแว่นและเงา เราสามารถพิมพ์เพิ่มไปได้ว่า “อยากได้แว่นสีอะไร แว่นทรงไหน” พิมพ์ได้หมดครับ ตรงที่เราระบายเข้าไปเนี่ยมันปรับได้ดีมาก พื้นหลังมันปรับให้เองโดยอัตโนมัติ ปกติถ้าตัดต่อภาพเราต้องมานั่งลบจุดเล็กจุดน้อย แต่ในที่นี้มันแก้ไขให้หมดโดยอัตโนมัติ

ผมสามารถทำให้เสร็จภายในเวลาไม่กี่นาที แล้วส่งงานได้เลย ส่วนที่เหลือไปใช้ทำอย่างอื่น

ข้อสรุป:

คุณภูมิกล่าวประโยคสุดท้ายว่า การผสมผสานเทคนิคทั้งการแก้ไขภาพและการเทรนโมเดลเข้าไป โดยที่ไม่ต้องมานั่งแก้ไขภาพหรือปรับแสงเอง เพียงแค่พิมพ์ prompt อย่างเดียว ก็ออกมาเป็นภาพที่ต้องการ

Source:

IMI Show 2025