متا اعلام کرده که چهار مدل جدید از مجموعه مدلهای Llama 4 را معرفی کرده است: Llama 4 Scout، Llama 4 Maverick، و Llama 4 Behemoth. بنا بر گفته این شرکت، همه این مدلها بر روی «حجم عظیمی از دادههای بدون برچسب شامل متن، تصویر و ویدیو» آموزش دیدهاند تا «درک بصری گستردهای» به دست آورند.
گفته میشود که موفقیت مدلهای متنباز شرکت چینی DeepSeek، که عملکردی همتراز یا حتی بهتر از نسخههای قبلی Llama دارند، باعث شده توسعهی Llama در متا بهصورت اضطراری و فشرده پیگیری شود. طبق گزارشها، متا برای بررسی اینکه DeepSeek چگونه هزینهی اجرای مدلهایی مانند R1 و V3 را کاهش داده، تیمهایی موسوم به «اتاق جنگ» تشکیل داده است.
دو مدل Scout و Maverick اکنون بهصورت متنباز در وبسایت Llama.com و از طریق پلتفرمهایی مانند Hugging Face در دسترس هستند. اما مدل Behemoth هنوز در حال آموزش است. همچنین دستیار هوش مصنوعی متا یعنی Meta AI که در اپلیکیشنهایی مانند واتساپ، مسنجر و اینستاگرام استفاده میشود، اکنون در ۴۰ کشور با استفاده از Llama 4 بهروزرسانی شده است. ویژگیهای چندحالته (مولتیمودال) فعلاً فقط در آمریکا و به زبان انگلیسی فعال هستند.
با این حال، مجوز استفاده از Llama 4 ممکن است برای برخی توسعهدهندگان مشکلساز باشد. طبق مقررات:
-
افراد یا شرکتهایی که در اتحادیه اروپا سکونت دارند یا دفتر مرکزی آنها در آنجاست، اجازه استفاده یا توزیع این مدلها را ندارند. این محدودیت احتمالاً به دلیل الزامات سختگیرانه قوانین جدید هوش مصنوعی و حفظ حریم خصوصی اتحادیه اروپا اعمال شده است.
-
همانند نسخههای قبلی، شرکتهایی با بیش از ۷۰۰ میلیون کاربر فعال ماهانه باید برای دریافت مجوز ویژه از متا درخواست دهند، و متا نیز اختیار کامل دارد که این درخواست را بپذیرد یا رد کند.
متا در پست وبلاگی خود نوشته:
«این مدلهای Llama 4 آغازی بر عصر جدیدی برای اکوسیستم لاما هستند... این تنها شروع مجموعه Llama 4 است.»
متا اعلام کرده که Llama 4 اولین مجموعه مدلهای این شرکت است که از معماری ترکیب کارشناسان (MoE) استفاده میکند، که برای آموزش و پاسخدهی به سوالات از نظر محاسباتی کارآمدتر است. معماری MoE بهطور کلی وظایف پردازش دادهها را به زیروظایف تقسیم کرده و سپس آنها را به مدلهای کوچکتر و تخصصیتر یا همان "کارشناسان" واگذار میکند.
برای مثال، مدل Maverick دارای ۴۰۰ میلیارد پارامتر کل است، اما تنها ۱۷ میلیارد پارامتر فعال در میان ۱۲۸ کارشناس دارد. (پارامترها بهطور تقریبی مهارتهای مدل در حل مشکلات را نشان میدهند.) مدل Scout نیز دارای ۱۷ میلیارد پارامتر فعال و ۱۶ کارشناس است و ۱۰۹ میلیارد پارامتر کل دارد.