ถ้าคุณเคยคิดว่า Generative AI ทำได้แค่รูป/วิดีโอ อันนี้ไปไกลกว่านั้น
29 มกราคม 2569 Google Labs เพิ่งปล่อย Project Genie (prototype)
ที่ให้คนสร้างโลกของตัวเอง แล้วเข้าไปเดินสำรวจ-เล่น-หมุนกล้องได้จริง แบบ Real-time ตามการเคลื่อนไหวของเรา พยายามจำลองทั้ง physics และ interaction ให้โลกดูเป็น Dynamic Worlds และจุดเด่นด้านความ Consistent ทำให้ตั้งเป้าจะจำลอง Scenario ได้กว้างมาก ตั้งแต่
- robotics
- modelling
- animation
- fiction
- สำรวจสถานที่และฉากประวัติศาสตร์
Genie ทำอะไรได้บ้าง
- สร้างโลกจาก text + image
- เข้าไปสำรวจได้ทันที โลกจะ generate ทางข้างหน้าแบบสด ๆ
- เอาโลกเดิมมา Remix ต่อเป็นเวอร์ชันใหม่ได้
3 ฟีเจอร์หลักที่ทำให้มันน่าใช้จริง
1) World sketching
- พิมพ์ Prompt + ใส่รูป (อัปโหลด/สร้างใหม่) เพื่อปั้นโลกให้มีชีวิต ปรับก่อนเข้าได้ แถมเลือกมุมมอง first-person / third-person ได้ด้วย
2) World exploration
- ไม่ใช่ภาพนิ่ง ไม่ใช่ฉาก 3D ที่เดินแล้วตัน คุณเดินไปไหน ระบบสร้างเส้นทางข้างหน้าให้ทันทีแบบ Real-time
3) World remixing
- หยิบโลกเดิมมาแก้ Prompt ต่อ เติมไอเดียให้เป็นโลกใหม่ มี Gallery และตัวสุ่มไอเดียช่วยจุดประกาย แล้วส่งออกเป็นวิดีโอได้
Genie 3 ยังเป็น Early Research Model อยู่ บางจุดยังต้องปรับปรุง เช่น
- โลกที่สร้างอาจยังไม่สมจริง 100% หรือไม่ยึดตาม Prompt/รูปภาพ เป๊ะทุกครั้ง รวมถึงอาจไม่ตรงกับโลกฟิสิกส์จริงเสมอ
- ตัวละครบางครั้งคุมได้ยากกว่าเดิม หรือการควบคุมอาจหน่วงสูงขึ้น
- จำกัดการสร้างไว้ที่ 60 วินาที
ตอนนี้เริ่มทยอยเปิดให้ Google AI Ultra ในสหรัฐฯ (18+) ตั้งแต่วันนี้ และจะขยายไปประเทศอื่น ๆ ต่อไปเมื่อพร้อม
เป้าหมายระยะยาวของ Google คือ ทำให้ประสบการณ์และ เทคโนโลยีนี้เข้าถึงคนได้มากขึ้นเรื่อย ๆ ในอนาคต
ข้อสรุป:
Project Genie คือ AI เสกโลกที่เราเข้าไปเดินสำรวจได้จริง เหมือนเราได้เข้าไปอยู่ในฉากที่ตัวเองสั่ง เหมาะมากกับสายคอนเทนต์ แบรนด์ การเรียนรู้ หรือนำเสนอไอเดียให้คนเข้าใจตรงกัน



