حالا در مرحله رنسانس تولید تصویر هستیم - به گفته OpenAI

بهروز فیض
0

 OpenAI از یک تولیدکننده تصویر جدید با نام «ChatGPT Images 2.0» رونمایی کرده است؛ ابزاری که این شرکت ادعا می‌کند می‌تواند تصاویر دقیق‌تر و پیشرفته‌تری نسبت به نسل‌های قبلی تولید کند.



در یک ویدئوی تبلیغاتی که پیش از پخش زنده روز سه‌شنبه منتشر شد، این فناوری به‌عنوان یک «رنسانس» در حوزه تولید تصویر با هوش مصنوعی توصیف شده است. در این تبلیغ آمده است که اگر مدل DALL·E را شبیه نقاشی‌های غارنشینی و نسل اول Images را هنر باستانی در نظر بگیریم، Images 2.0 مرحله رنسانس محسوب می‌شود.

در همین رویداد، مدیرعامل OpenAI، سم آلتمن، گفته است این نسخه جدید یک جهش بزرگ محسوب می‌شود و آن را به تغییراتی مشابه حرکت از GPT-3 به GPT-5 در یک مرحله تشبیه کرده است.



این شرکت اعلام کرده است که مدل جدید قابلیت‌های چندزبانه بهتری دارد، هوش بصری پیشرفته‌تری ارائه می‌دهد و در توجه به جزئیات دقیق‌تر عمل می‌کند.

OpenAI برای نمایش این توانایی‌ها، نمونه‌ای از یک دستور تولید تصویر را نشان داده که در آن تصویری از یک کاسه برنج ساخته شده است؛ به‌طوری که تنها یک دانه بسیار کوچک برنج در تصویر وجود دارد که نام مدل روی آن نوشته شده است.


این مدل دارای دو حالت «فوری» و «تفکر» است. پژوهشگران اعلام کرده‌اند که هر دو حالت نسبت به قابلیت‌های قبلی تولید تصویر در OpenAI به‌طور قابل توجهی بهتر عمل می‌کنند. همچنین گفته شده است که در این نسخه جدید، خطاهای تایپی در تصاویر «بسیار نادر» هستند.

برچسب ها

ارسال یک نظر

0 نظرات

ارسال یک نظر (0)
3/related/default