เมื่อไม่นานมานี้ Hunyuan 3D 2.0 ได้เปิดตัวไป เมื่อสัปดาห์ที่แล้ว เครื่องมือสร้างโมเดล 3D ด้วย AI จาก Tencent ที่พาฉันจากโลก “มือใหม่หัดเล่น” ไปสู่การเป็น “นักสร้างโลกเสมือน” ภายในคลิกเดียว เอาจริงๆ ก่อนใช้ก็สงสัยว่า AI จะล้ำได้ขนาดนี้เหรอ แต่พอได้ทดลองจริง…มันเปลี่ยนความเชื่อไปเลย
Hunyuan 3D 2.0 วิธีเข้าใช้งานนั้น มีหลายวิธี ดังนี้
- โหลดมาติตตั้งลงคอมพิวเตอร์หรือ Notebook เอง (Portable) ผ่านทาง Github
- ติดตั้งโมเดลนี้ผ่าน ComfyUI โดยเอาไปเป็น Plugin
- ติดตั้งโมเดลนี้ผ่าน Blender และเชื่อมต่อ API ทีหลังครับ
- เล่นผ่าน Huggingspace 1 บัญชี Generate ได้นานสุด 150 วินาที (อยากได้นานกว่านั้น เสียรายเดือน)
หลังจากเลือกใช้งานให้ตรงกับสเปคของคอมฯ หรือโน้ตบุ๊กและความถนัดของผู้ใช้งานแล้ว จะเข้าสู่การอัพโหลดภาพ 2D ธรรมดาๆ อย่างรูป Sketch ภาพวาดและภาพถ่ายจริง


หลังจากที่เราทำการอัพโหลดรูปภาพเข้าไป ก็มาปรับแต่งตรง Advanced Options (ตัวเลือกขั้นสูง) ว่า ต้องการให้ภาพออกมาแนวไหน มีดังนี้
- Inference Steps: จำนวนรอบที่ AI ปั้นโมเดล 3 มิติ ยิ่งมีค่ามาก โมเดลจะมีรายละเอียดเยอะ, ตรงกันข้าม ยิ่งค่าน้อย โมเดลจะมีรายละเอีนดน้อย
- Octree Resolution: ความละเอียดของโมเดล ยิ่งมีค่ามาก โมเดลจะมีความละเอียดสูง ขนาดของไฟล์จะสูงตาม ยิ่งมีค่ามาก โมเดลจะมีความละเอียดน้อย ขนาดของไฟล์จะต่ำ
- Guidance Scale: ระดับของ ตัวช่วยให้โมเดลเหมือนภาพตัวอย่าง ยิ่งมีค่ามาก โมเดลจะเหมือนจริง แต่ไม่เป็นเอกลักษณ์
- Seed: ค่าของการสุ่มตัวเลขเพื่อปรับภาพ หากเปลี่ยนตัวเลข ผลลัพธ์ของภาพจะเปลี่ยนไป

ผมจะทำการทดลอง เอาภาพถ่ายคนจริง ใส่ไว้เป็นแบบ และปรับตั้งค่า Inference Step 50 Steps, Octree Solution ที่ 256, Guidance Scale: 0, Seed: 5,000,000 มาดูกันว่า ผลลัพธ์จะเป็นอย่างไร
ผลลัพธ์จากการสร้างโมเดล 3 มิติ เน้น Shape จะเห็นได้ว่า โครงสร้างโมเดล เหมือนกับภาพถ่ายต้นฉบับมาก ตั้งแต่หัวจนถึง ไหล่และรูปทรงเสื้อผ้า
ผลลัพธ์การใส่ Texture ลงไป ก็ทำให้ทราบว่า ส่วนไหน คือ ใบหน้า แม้ว่าจะเละเทะ ไม่สวยครับ
สรุปเลยว่า Guidance Step เท่ากับ 0 ให้ภาพผลลัพธ์ที่ดูไม่ดี เหมือนไม่มีโครงสร้างมากกว่าครับ และภาพไม่สวย มาดูโมเดล 3 มิติอันถัดไป จะมีการปรับค่า Guidance Scale เพิมขึ้นอีกครับ ปรับเป็น 5.5
ภาพถัดมา จะสร้างรูปทรงและใส่สีลงในโมเดล 3 มิติ จะสังเกตได้ว่า เมื่อเติมสีลงไป ทำให้โมเดล 3 มิติ มีชีวิตชีวา สีเหมือนกับภาพต้นฉบับ แตกต่างกันตรงที่ ขอบคอ ด้านข้างของแว่นตา มีรอยดำ ๆ ภาพขาดบ้าง แต่โดยรวมแล้ว ถือว่า ทำออกมาได้ดีเป็นอย่างมาก
มีจุดนึงที่ต้องแก้ไข คือ ตรงหัวไหล่ของภาพต้นฉบับ มีรอยยับของเสื้อเยอะ แต่ผลลัพธ์โมเดลนี้ กลับมีรอยยับของเสื้อเพียงนิดเดียว ความสูงของไหล่ไม่เท่ากัน มีแท่งสี่เหลี่ยมยื่นออกมาด้วย นั่นหมายถึง แสดงให้เห็นว่า ภาพถ่ายคนจริง ไม่เหมาะที่จะนำมาทดลองกับโมเดลนี้
ต่อกันที่การปรับ Guidance Step 10 ซึ่งเป็นค่า Maximum ของ Guidance Scale ผลลัพธ์ คือ ทรงผมเหมือนมาก แต่คางเชิดขึ้นสูง ต่อด้วยตรงหู บางลง และที่สำคัญคือ รอยยับของเสื้อเหมือนกับภาพต้นฉบับมาก
มาดู Texture พอใส่สีให้กับโมเดล 3 มิติแล้วครับ ผลปรากฎว่า ภาพรวมคล้ายกับต้นฉบับมาก และที่สำคัญ คือ ไม่มีรอยดำ รอยขาด ๆ ด้วยครับ เมื่อเทียบกับ Guidance Step 5.5 ยกเว้นจมูกกับปาก เชิดขึ้นมามาก
ผลลัพธ์ของการใส่ Texture ลงบนภาพถ่ายนี้ แสดงให้เห็นว่า โมเดล 3 มิตินี้มีความเหมือนจริงมาก แต่ความเป็นเอกลักษณ์ของภาพคนลดลงมาก ตรงจมูกและคางช่วงบน เชิดสูงมากไป ทำให้โมเดล 3 มิตินี้ดูไม่เป็นธรรมชาติ
สรุปภาพรวม ภาพถ่ายจากคน โดยรวมแล้วถือว่า ตอบโจทย์มากครับ และทำให้ทราบว่า การปรับค่า Guidance Scale จากภาพถ่ายนั้น มีความเหมือนจริงและธรรมชาติมากที่สุด ที่ Scale 5.5 และ Scale 10 เหมือนจริงมากเกินไป จนดูไม่เป็นเอกลักษณ์
หลังจากอธิบายกับภาพถ่ายคนจริง มาต่อกันที่ ภาพ Animation การ์ตูน เป็น ภาพบ้านมีหลังคาทรงสูงกับปล่องภูเขาไฟเป็นภาพตัวอย่างใน Hunyuan 3D 2.0 ผมปรับตั้งค่า Inference Step 50 Steps Octree Resolution 256 ปรับเพียง Guidance Scale 5.5 และ 10, Seed 5,000,000
ผลลัพธ์ที่ได้ คือ ภาพบ้านมีโครงสร้างรายละเอียดที่แม่นยำมากที่สุด มีรายละเอียดที่ไม่ชัดเจนตรงฐานวงกลมกับประตูทางเข้าบ้านนิดหน่อย และต่อไปเราจะมาดู Texture กันครับ
ผลลัพธ์ของการใส่ Texture บนโมเดล 3 มิติ พบว่า มีความสวยงามมาก รายละเอียดปลีกย่อยตรงมาก
ผลลัพธ์ของรูปทรงบ้าน เมื่อใช้ Guidance Step 10.0 ตัวบ้าน มีความละเอียดเยอะ รอบ ๆ บ้าน มีรายละเอียดปลีกย่อยที่สมบูรณ์
ผลลัพธ์ของการใส่ Texture บนโมเดล 3 มิติ คือ สวยงาม เหมือนจริง มีรูพรุนตรงฐานวงกลมของบ้านน้อยมาก แต่รูปทรงของประตูบ้านด้านหลังไม่มี มีแต่กำแพง, บันได ดูไม่เป็นธรรมชาติ, รูปทรงประตูบิดเบี้ยว โดยรวมรายละเอียดดี แต่ไม่เป็นเอกลักษณ์
สรุปรวมระหว่างภาพถ่ายและภาพ Animation
ภาพถ่าย
- เน้นภาพที่มีรายละเอียดไม่ซับซ้อนเยอะ จะช่วยได้ผลลัพธ์โมเดล 3 มิติที่เหมือนกับต้นฉบับ 100 %
- Guidance Scale 0 จะได้ผลลัพธ์ คือ ภาพแตก เละเทะ เมื่อเทียบกับ 5.5 ดูธรรมชาติ แต่มีรายละเอียดบางส่วนที่ยังไม่เหมือนต้นฉบับ ส่วน Guidance Scale 10 ภาพดูสมจริง แต่บางจุด ไม่เป็นเอกลักษณ์ อย่างตรงปากและจมูกเชิดขึ้น สัดส่วนผิดธรรมชาติ
- ภาพบางภาพ หากมีกระจก, แว่นตา หรือวัสดุที่สามารถมองทะลุได้แบบเดียวกับกระจก เนื้อจะเนียนไปกับผิวหนัง ทำให้ผลลัพธ์โมเดล 3 มิติ จะถูกซ้อนทับกัน
ภาพ Animation
- ภาพ Animation มีข้อดีเกือบหมด ตั้งแต่รายละเอียด ถ้าไม่มีรายละเอียดมาก การทำพื้นผิวของภาพจะเนียนตามภาพต้นฉบับ แต่หากภาพต้นฉบับมีรายละเอียดปลีกย่อยเยอะ จะทำให้การพื้นผิวนั้น ไม่เนียนและไม่สมมาตร ตัวย่างภาพบ้าน จะมีขอบดำ ๆ พื้นผิวไม่เรียบ เหมือนภาพต้นฉบับ, ประตูและหน้าต่าง ไม่สมมาตร
- ภาพที่มีรายละเอียดเล็กมาก พอมาสร้างเป็นโมเดล 3 มิติ ทำให้การสร้างโมเดล 3 มิติเพี้ยน เช่น ม้านั่งตรงบ้าน ตัวอย่าง จะเห็นได้ชัดว่า ผลลัพธ์ เหมือนขอนไม้มาก ไม่สามารถสร้างผลลัพธ์ให้เหมือนจริงได้
ข้อสรุป:
Hunyuan 3D 2.0 คือเครื่องมือที่ทั้ง “ล้ำ”, “ใช้ได้จริง” และ “คุณภาพ” เหมาะกับคนที่อยากสร้างคอนเทนต์ Model 3D แบบเร่งด่วน หรือแม้แต่มือใหม่ที่อยากลองเริ่มต้นในโลกโมเดลลิ่ง แม้จะไม่เป๊ะทุกจุด ในเรื่อง รายะลเอียดที่ปลีกย่อยและ วัตถุที่เล็กมาก แต่ความเร็วและฟีเจอร์ปรับแต่งพื้นฐานก็ทำให้มันเหนือกว่าหลายเครื่องมือในตลาดยุคนี้ ถ้าคุณเป็นคนชอบคิดใหญ่ แต่มักเจอทางตันเพราะขั้นตอนทางเทคนิค ลองไปส่องเว็บ Tencent ดู แล้วเตรียมตะลึงกับสิ่งที่ AI ตัวนี้ช่วยคุณได้ แค่คลิกเดียวก็เห็นผลแล้ว