گوگل یک دنیای کاملاً جدید برای بازی کردن ساخته است—اما فقط برای یک دقیقه. این شرکت این هفته «پروژه جینی» را معرفی کرد؛ مدلی که آن را «مدل جهانِ همهمنظوره» مینامد و قادر است محیطهای تعاملی تولید کند. این مدل که با نام Genie 3 شناخته میشود، ابتدا مرداد سال گذشته به گروه کوچکی از تستکنندگان دعوتی نشان داده شد و اکنون برای مشترکان Google AI Ultra در آمریکا عرضه شده است؛ با هزینه ماهانه ۲۵۰ دلار.
نمایش یک مدل جهان از سوی گوگل بهخودیخود قابلتوجه است. برخلاف مدلهای زبانی بزرگ که ابزارهای مصرفی هوش مصنوعی—از جمله Gemini—بر پایه آنها کار میکنند و با پیشبینی بخش بعدی یک توالی آموزش میبینند، مدلهای جهان بر اساس دینامیک دنیای واقعی آموزش داده میشوند؛ از جمله فیزیک و ویژگیهای فضایی، تا شبیهسازیای از نحوه کارکرد محیطهای فیزیکی بسازند.
مدلهای جهان رویکرد مورد علاقه یان لکون، دانشمند ارشد سابق Meta AI، هستند. او معتقد است (و احتمالاً درست هم میگوید) که مدلهای زبانی هرگز به هوش عمومی مصنوعی—توانایی برابر یا فراتر از انسان در همه حوزهها—نخواهند رسید. او باور دارد مدلهای جهان میتوانند مسیر رسیدن به آن هدف را هموار کنند و به همین دلیل اخیراً به استارتاپی پیوسته که تمام تمرکز خود را روی این ایده گذاشته است. بهطور ساده، مدلهای زبانی فقط الگوها را تشخیص میدهند، اما مدلهای جهان به هوش مصنوعی اجازه میدهند شبیهسازیهای گسترده انجام دهد، نحوه کار جهان را بفهمد و به نتایج تازه برسد.
ورود گوگل به این حوزه تا حدی به این ایده اعتبار میدهد که مدلهای جهان تواناییهایی دارند که مدلهای زبانی بزرگ ندارند. ویدئوهای پیشنمایشی که از روزهای ابتدایی پروژه جینی منتشر شدهاند نیز از نظر بصری چشمگیر هستند، هرچند کوتاهاند. گوگل تولید دنیای مجازی را برای کاربران به ۶۰ ثانیه محدود کرده و همچنین اعلام کرده این خروجیها «ممکن است کاملاً واقعی بهنظر نرسند یا همیشه دقیقاً مطابق با درخواستها، تصاویر یا قوانین فیزیک دنیای واقعی نباشند»؛ یعنی ممکن است درست کار نکنند.
طبق گزارش Ars Technica، خروجیها فعلاً ویدئوهایی با کیفیت ۷۲۰p و نرخ ۲۴ فریم بر ثانیه هستند و برخی کاربران گفتهاند عملکرد مدل در عمل گاهی با لگ و کندی همراه است.

