ถ้าคุณเคยคิดว่า Generative AI ทำได้แค่รูป/วิดีโอ อันนี้ไปไกลกว่านั้น

29 มกราคม 2569 Google Labs เพิ่งปล่อย Project Genie (prototype)

ที่ให้คนสร้างโลกของตัวเอง แล้วเข้าไปเดินสำรวจ-เล่น-หมุนกล้องได้จริง แบบ Real-time ตามการเคลื่อนไหวของเรา พยายามจำลองทั้ง physics และ interaction ให้โลกดูเป็น Dynamic Worlds และจุดเด่นด้านความ Consistent ทำให้ตั้งเป้าจะจำลอง Scenario ได้กว้างมาก ตั้งแต่

  • robotics
  • modelling
  • animation
  • fiction
  • สำรวจสถานที่และฉากประวัติศาสตร์

Genie ทำอะไรได้บ้าง

  • สร้างโลกจาก text + image
  • เข้าไปสำรวจได้ทันที โลกจะ generate ทางข้างหน้าแบบสด ๆ
  • เอาโลกเดิมมา Remix ต่อเป็นเวอร์ชันใหม่ได้

3 ฟีเจอร์หลักที่ทำให้มันน่าใช้จริง

1) World sketching

  • พิมพ์ Prompt + ใส่รูป (อัปโหลด/สร้างใหม่) เพื่อปั้นโลกให้มีชีวิต ปรับก่อนเข้าได้ แถมเลือกมุมมอง first-person / third-person ได้ด้วย

2) World exploration

  • ไม่ใช่ภาพนิ่ง ไม่ใช่ฉาก 3D ที่เดินแล้วตัน คุณเดินไปไหน ระบบสร้างเส้นทางข้างหน้าให้ทันทีแบบ Real-time

3) World remixing

  • หยิบโลกเดิมมาแก้ Prompt ต่อ เติมไอเดียให้เป็นโลกใหม่ มี Gallery และตัวสุ่มไอเดียช่วยจุดประกาย แล้วส่งออกเป็นวิดีโอได้

Genie 3 ยังเป็น Early Research Model อยู่ บางจุดยังต้องปรับปรุง เช่น

  • โลกที่สร้างอาจยังไม่สมจริง 100% หรือไม่ยึดตาม Prompt/รูปภาพ เป๊ะทุกครั้ง รวมถึงอาจไม่ตรงกับโลกฟิสิกส์จริงเสมอ
  • ตัวละครบางครั้งคุมได้ยากกว่าเดิม หรือการควบคุมอาจหน่วงสูงขึ้น
  • จำกัดการสร้างไว้ที่ 60 วินาที

ตอนนี้เริ่มทยอยเปิดให้ Google AI Ultra ในสหรัฐฯ (18+) ตั้งแต่วันนี้ และจะขยายไปประเทศอื่น ๆ ต่อไปเมื่อพร้อม

เป้าหมายระยะยาวของ Google คือ ทำให้ประสบการณ์และ เทคโนโลยีนี้เข้าถึงคนได้มากขึ้นเรื่อย ๆ ในอนาคต

ข้อสรุป:

Project Genie คือ AI เสกโลกที่เราเข้าไปเดินสำรวจได้จริง เหมือนเราได้เข้าไปอยู่ในฉากที่ตัวเองสั่ง เหมาะมากกับสายคอนเทนต์ แบรนด์ การเรียนรู้ หรือนำเสนอไอเดียให้คนเข้าใจตรงกัน

Source:

Blog Google, Genie, Youtube