12 มีนาคม 2025 Google ประกาศข่าวใหญ่ เรื่องการเปิดให้ทดลองใช้ความสามารถใหม่ของ Gemini 2.0 Flash ที่สร้างภาพจากข้อความได้ ก่อนหน้านี้เปิดให้เฉพาะผู้ทดสอบที่ได้รับเชิญเท่านั้น นักพัฒนาทุกคนสามารถเข้าถึงรุ่นทดลอง Gemini-2.0-Flash-Exp ได้แล้วทั้งใน Google AI Studio และผ่าน Gemini API 

ขั้นตอนการเข้าใช้งาน

  1. เปิด Google AI Studio 
  2. เลือกโมเดล gemini-2.0-flash-exp หรือคลิกลิงก์นี้ https://aistudio.google.com/prompts/new_chat?model=gemini-2.0-flash-exp
  • สังเกตขวามือ ดูตรง Output format ว่า เป็น Image and Text ไหม หากยังไม่ใช่ก็เปลี่ยน

Sidebar ขวามือ ดูตรงหัวข้อ Output format เลือก Images and Text

ความสามารถของ Gemini Flash 2.0 Exp ในการปรับปรุงแก้ไขภาพ

    ข้อความและรูปภาพรวมกัน

    ข้อความและรูปภาพ เพื่อเล่าเรื่องและประกอบภาพด้วยรูปภาพ โดยรักษาตัวละครและฉากให้สอดคล้องกันตลอดทั้งเรื่อง ยังสามารถเปลี่ยนเรื่อง หรือเปลี่ยนสไตล์ของภาพวาด

    การแก้ไขภาพแบบสนทนา

    การแก้ไขภาพแบบสนทนา
    ช่วยแก้ไขรูปภาพผ่านการสนทนาด้วยภาษาธรรมชาติ เหมาะสำหรับการปรับแต่งจนได้ภาพที่สมบูรณ์แบบคล้าย ๆ กับการ Generative Fill หรือ Edit แก้ไขภาพด้วย AI

    การประกอบภาพสูตรอาหาร

    ความเข้าใจโลก
    Gemini 2.0 Flash ใช้ประโยชน์จากความรู้รอบโลกและการให้เหตุผลที่เพิ่มขึ้น เพื่อสร้างภาพที่มีรายละเอียดที่สมจริง เช่น การประกอบภาพสูตรอาหาร

    การแสดงผลข้อความ

    การแสดงผลข้อความ
    โมเดลสร้างภาพส่วนใหญ่มีปัญหาในการแสดงลำดับข้อความที่ยาวอย่างถูกต้อง ส่งผลให้ตัวอักษรมีรูปแบบไม่ดีหรืออ่านไม่ออก หรือสะกดผิด แต่ Gemini 2.0 Flash มีการแสดงผลที่ดีกว่าเมื่อเทียบกับโมเดลการแข่งขันชั้นนำ และยอดเยี่ยมสำหรับการสร้างโฆษณา โพสต์โซเชียล หรือแม้แต่บัตรเชิญ

    จะเห็นได้ว่า ความสามารถเหล่านี้ ทำให้ Gemini นี้ ถูกพูดถึงเป็นอย่างมาก สร้างสรรค์ภาพได้ไร้ขีดจำกัด นอกเหนือจากความสามารถเหล่านี้ สามารถสร้างสรรค์ภาพให้ดูดี ไม่แพ้การใช้เครื่องมือบน Photoshop, Lightroom, Illustrator และ Canva เช่น

    ความสามารถเพิ่มเติม

    1. เพิ่มตัวอักษรให้ปรากฎในภาพ การเพิ่มตัวอักษรยังไม่ถือว่าดีเลิศ เพราะการเพิ่มตัวอักษร ยังมีฟอนต์ที่เพี้ยนอยู่

    ภาพนี้ เป็นภาพสวนสาธารณะในตลาด ไม่มีข้อความ ผมอยากเพิ่มคำว่า Summer Day จึงได้ภาพออกมาทางด้านขวามือนี้

    2. ลบตัวอักษรออกจากภาพ

    ภาพนี้ เป็นภาพสวนสาธารณะขนาดเล็ก มีข้อความว่า Summer Day ผมขอลบออก จึงได้ภาพออกมาทางด้านขวามือนี้

    3. เปลี่ยนโทนสีของภาพ

    เปลี่ยนช่วงเวลาของสวนสาธารณะ จากช่วงกลางวันเป็นกลางคืน

    4. ลบ Object เช่น คน, สัตว์, สิ่งของ

    ภาพสวนบนตึก ผมใช้วิธีลบคนออกไป ผลลัพธ์ที่ได้ คือ ไม่มีคนครับ ตามภาพขวามือ

    แต่ระวังนิดนึง การลบ Object ไม่สามารถทำเพียงครั้งเดียวแล้วเสร็จนะครับ

    ตัวอย่าง ลองลบ 2 รอบถึงจะได้ผล

    นำภาพคนเดินห้าง Siam Paragon มาลบวัตถุ ดีเลิศ แต่ต้องลบ 2 รอบครับ

    ราคา API

    ไม่ได้มีระบุเอาไว้

    ข้อจำกัด

    1. ความยาวบริบท (Context Windows) รองรับเพียง 32,768 Tokens ไม่ได้รองรับข้อความยาว ๆ
    2. มีโลโก้ Gemini ติดไว้ที่มุมล่างซ้ายมือ
    3. การลบ Object วัตถุออกไป ลบเพียงครั้งเดียว อาจไม่ได้ผลกับทุกภาพ ภาพวัตถุบางอัน จะเปลี่ยนแปลงและความละเอียดของการ Edit จะลดลง

    Gemini 2.0 Flash Exp สร้างภาพ เหมาะกับใคร

    1. สาย Creative, Graphic Design
    2. วิศวะ 
    3. สถาปัตย์
    4. นักออกแบบผลิตภัณฑ์ต่าง ๆ 
    5. พ่อครัว แม่ครัว, บาริสต้า, ครู, อาจารย์หรืออาชีพที่ต้องการอยากทำคู่มือประกอบเนื้อหาต่าง ๆ

    Gemini 2.0 Flash ถูกออกแบบมาเพื่อตอบโจทย์กับเหล่าคนชอบความคิดสร้างสรรค์สูง ด้วยการเพิ่มการสร้างข้อความและภาพด้วยโมเดลเดียวเท่านั้น นอกจากนี้ Google เปิดรับความเห็นจากเหล่านักพัฒนา, นักเขียนโปรแกรม ซอฟต์แวร์ไว้สำหรับ

    Source:

    Blog Google Developers, Siam Paragon Image