به گزارش آفتاب شرق
گوگل از یک ارتقا بزرگ و زیاد قوی برای قابلیت ویرایش عکس جمینای رونمایی کرد. این بهروزرسانی که مدل پشت پرده آن Nano banana نام دارد، به کاربران کنترل زیاد دقیقتری در عرصه ویرایش تصاویر میدهد و بهطور خاص مشکل بزرگ نگه داری ارامش چهره و جزئیات سوژه را در ویرایشهای متوالی حل میکند.
بر پایه گزارش تککرانچ، مدل تازه گوگل که نام رسمی آن Gemini 2.5 Flash Image است، پیش از معارفه رسمی، به طور ناشناس با نام Nano-Banana در پلتفرم برسی هوش مصنوعی LMArena ظاهر شده می بود و با کارکرد خیرهکنندهاش، کاربران و کارشناسان را شگفتزده کرد. اکنون گوگل قبول کرده است که این مدل تحسینشده، همان فناوری جدیدی است که درحال اضافهشدن به جمینای است.
هوش مصنوعی ویرایش عکس Nano Banana در جمینای گوگل



تمرکز مهم این ارتقا روی حل یکی از بزرگترین مشکلات هوش مصنوعی مولد عکس است: نگه داری ارامش شخصیت. از این بعد، میتوانید یک عکس از دوستان، خانواده یا حتی حیوانات خانگی خود را ویرایش کنید و یقین باشید که چهره و ظاهر آنها در ویرایشهای گوناگون (همانند تحول مدل مو، لباس یا حتی کل صحنه) ثابت و واقعی باقی میماند.


علاوهبراین، قابلیتهای پیشرفته فرد دیگر نیز اضافه شده است؛ کاربران میتوانند چندین عکس را بارگذاری کنند و از هوش مصنوعی بخواهند تا آنها را در یک صحنه تازه و منسجم ترکیب کند. این چنین میتوانید سبک بصری یک عکس (همانند الگوی یک گل) را بر روی یک شیء در عکس دیگر اعمال کنید (برای مثالً آن را به مطرح یک لباس تبدیل کنید). این چنین کاربران میتوانند به طور متوالی و مرحله به مرحله، اجزای گوناگون یک عکس را تحول دهند، بدون این که ویرایشهای قبلی از بین برود.


این بهروزرسانی در بحبوحه رقابتی شدید در بازار هوش مصنوعی صورت میگیرد. بعد از آنکه OpenAI با ابزارهای تصویرسازی خود در ChatGPT توانست کاربران بسیاری را جذب کند، گوگل نیز در تلاش است با اراعه ابزارهای پرقدرت، این فاصله را جبران کند. اکنون، ChatGPT بیشتر از ۷۰۰ میلیون کاربر هفتگی دارد، درحالیکه جمینای ۴۵۰ میلیون کاربر ماهانه را ثبت کرده است.




گوگل این چنین با درسگرفتن از مشکلات قبل (همانند تشکیل تصاویر تاریخی نادرست) تدبیرها ایمنی جدیدی را نیز در نظر گرفته است. همه تصاویر تشکیل یا ویرایش شده با این ابزار تازه، دارای یک واترمارک قابل مشاهده و یک واترمارک نامرئی (SynthID) خواهند می بود تا به راحتی از تصاویر واقعی قابل تشخیص باشند. علاوهبراین، قوانین سختگیرانهای برای جلوگیری از تشکیل محتوای زیان اور، همانند تصاویر خصوصی، اعمال شده است.
این قابلیتهای تازه کم کم برای همه کاربران در اپلیکیشن جمینای و این چنین برای گسترشدهندگان از طریق پلتفرمهای API گوگل در دسترس قرار میگیرد.
دسته بندی مطالب
اخبار سلامتی
