گوگل روز سهشنبه در رویداد سالانه Google I/O اعلام کرد اپلیکیشن Gemini مجموعهای از بهروزرسانیهای جدید دریافت میکند که شامل قابلیت «Daily Brief»، رابط کاربری بازطراحیشده، دسترسی به مدل جدید ویدیویی هوش مصنوعی با نام Gemini Omni و عامل هوش مصنوعی شخصی جدیدی به نام Gemini Spark است.
این بهروزرسانیها نشاندهنده تلاش گوگل برای تبدیل Gemini به یک مرکز جامع هوش مصنوعی، فراتر از یک چتبات مستقل، و افزایش رقابت آن با برنامههایی مانند ChatGPT و Claude هستند.
گوگل قابلیت جدید Daily Brief را بهعنوان خلاصهای شخصیسازیشده معرفی کرده که قرار است نخستین مرجع کاربران در ابتدای روز باشد. این قابلیت اطلاعات موجود در صندوق ورودی ایمیل، تقویم و مهمترین وظایف کاربر را جمعآوری کرده و آنها را در قالب یک نمای کلی منظم ارائه میدهد. به گفته این شرکت، Daily Brief فقط اطلاعات را خلاصه نمیکند، بلکه وظایف را اولویتبندی کرده و پیشنهادهایی برای اقدامات بعدی ارائه میدهد؛ بهطوری که مهمترین موارد ابتدا نمایش داده میشوند.
قابلیت Daily Brief از امروز برای مشترکان Google AI در ایالات متحده عرضه میشود.
اپلیکیشن Gemini در حال حاضر نیز دامنه گستردهای از کاربران دارد. گوگل اعلام کرده این برنامه بیش از ۹۰۰ میلیون کاربر ماهانه دارد و در بیش از ۲۳۰ کشور و به بیش از ۷۰ زبان در دسترس است. با این حال، به نظر میرسد گوگل قصد دارد کاربران بیشتری جذب کند، بدون آنکه کاربران فعلی خود را از دست بدهد.
گوگل اعلام کرد این اپلیکیشن را بهطور کامل از ابتدا بازطراحی کرده است. اکنون کاربران هنگام باز کردن برنامه با زبان طراحی جدیدی به نام «Neural Expressive» روبهرو میشوند که شامل انیمیشنهای روان، رنگهای زنده، تایپوگرافی جدید و بازخورد لمسی است.
پاسخهای Gemini دیگر مانند اغلب چتباتهای هوش مصنوعی به شکل یک متن طولانی و یکپارچه نمایش داده نمیشوند. در عوض، اطلاعات کلیدی ابتدا بهصورت برجسته در بالای پاسخ قرار میگیرند و با پایین رفتن صفحه، متنهای تکمیلی و احتمالاً عناصر دیگری مانند تصاویر و جدولهای زمانی نمایش داده میشوند.
گوگل، Gemini Spark را بهعنوان یک عامل هوش مصنوعی شخصی ۲۴ ساعته معرفی کرده که به کاربران در مدیریت زندگی دیجیتال کمک میکند. Spark، Gemini را از یک دستیار به یک شریک فعال تبدیل میکند که میتواند بهجای کاربر وظایف واقعی انجام دهد. از آنجا که Spark یک عامل مبتنی بر فضای ابری است، حتی پس از قفل شدن گوشی نیز به فعالیت در پسزمینه ادامه میدهد. کاربران با استفاده از Gemini Spark در اپلیکیشن Gemini میتوانند فرایندهای کاری سفارشی خود را ایجاد کنند.
Spark در حال حاضر در مرحله آزمایش قرار دارد و گوگل انتظار دارد این قابلیت از هفته آینده برای مشترکان Google AI Ultra در دسترس قرار گیرد.
مدل ویدیویی جدید گوگل با نام Gemini Omni با ترکیب Gemini و مدلهای تولید رسانهای گوگل، خروجیهایی مبتنی بر دانش تولید میکند. برای مثال، کاربر میتواند یک دستور ساده در حد توضیح یک موضوع ساده علمی به آن بدهد و در قالب ویدئو نحوه انجام یا آموزش آن محتوا را دریافت کند. طبق اعلام گوگل، این مدل امکان بارگذاری صدا، تصویر و ویدیو را فراهم میکند تا یک ویدیوی یکپارچه و باکیفیت تولید شود.
با افزودن دسترسی به چنین مدل ویدیویی جدیدی، گوگل رقابت میان پلتفرمهای بزرگ هوش مصنوعی را در مسیر تولید محتوای چندوجهی (مولتیمدال) تشدید میکند. این مدل در حال عرضه برای Google Flow و YouTube Shorts در اختیار مشترکان Google AI قرار میگیرد؛ موضوعی که نشاندهنده تمرکز گستردهتر این شرکت بر تولید محتوای چندرسانهای و ابزارهای ویدیویی مبتنی بر هوش مصنوعی است.
