OpenAI از یک تولیدکننده تصویر جدید با نام «ChatGPT Images 2.0» رونمایی کرده است؛ ابزاری که این شرکت ادعا میکند میتواند تصاویر دقیقتر و پیشرفتهتری نسبت به نسلهای قبلی تولید کند.
در یک ویدئوی تبلیغاتی که پیش از پخش زنده روز سهشنبه منتشر شد، این فناوری بهعنوان یک «رنسانس» در حوزه تولید تصویر با هوش مصنوعی توصیف شده است. در این تبلیغ آمده است که اگر مدل DALL·E را شبیه نقاشیهای غارنشینی و نسل اول Images را هنر باستانی در نظر بگیریم، Images 2.0 مرحله رنسانس محسوب میشود.
در همین رویداد، مدیرعامل OpenAI، سم آلتمن، گفته است این نسخه جدید یک جهش بزرگ محسوب میشود و آن را به تغییراتی مشابه حرکت از GPT-3 به GPT-5 در یک مرحله تشبیه کرده است.
این شرکت اعلام کرده است که مدل جدید قابلیتهای چندزبانه بهتری دارد، هوش بصری پیشرفتهتری ارائه میدهد و در توجه به جزئیات دقیقتر عمل میکند.
OpenAI برای نمایش این تواناییها، نمونهای از یک دستور تولید تصویر را نشان داده که در آن تصویری از یک کاسه برنج ساخته شده است؛ بهطوری که تنها یک دانه بسیار کوچک برنج در تصویر وجود دارد که نام مدل روی آن نوشته شده است.
این مدل دارای دو حالت «فوری» و «تفکر» است. پژوهشگران اعلام کردهاند که هر دو حالت نسبت به قابلیتهای قبلی تولید تصویر در OpenAI بهطور قابل توجهی بهتر عمل میکنند. همچنین گفته شده است که در این نسخه جدید، خطاهای تایپی در تصاویر «بسیار نادر» هستند.
