متا چهار مدل جدید از مجموعه مدل‌های Llama 4 را معرفی کرد

بهروز فیض
توسط:
0

 متا اعلام کرده که چهار مدل جدید از مجموعه مدل‌های Llama 4 را معرفی کرده است: Llama 4 Scout، Llama 4 Maverick، و Llama 4 Behemoth. بنا بر گفته این شرکت، همه این مدل‌ها بر روی «حجم عظیمی از داده‌های بدون برچسب شامل متن، تصویر و ویدیو» آموزش دیده‌اند تا «درک بصری گسترده‌ای» به دست آورند.



گفته می‌شود که موفقیت مدل‌های متن‌باز شرکت چینی DeepSeek، که عملکردی هم‌تراز یا حتی بهتر از نسخه‌های قبلی Llama دارند، باعث شده توسعه‌ی Llama در متا به‌صورت اضطراری و فشرده پیگیری شود. طبق گزارش‌ها، متا برای بررسی اینکه DeepSeek چگونه هزینه‌ی اجرای مدل‌هایی مانند R1 و V3 را کاهش داده، تیم‌هایی موسوم به «اتاق جنگ» تشکیل داده است.

دو مدل Scout و Maverick اکنون به‌صورت متن‌باز در وب‌سایت Llama.com و از طریق پلتفرم‌هایی مانند Hugging Face در دسترس هستند. اما مدل Behemoth هنوز در حال آموزش است. همچنین دستیار هوش مصنوعی متا یعنی Meta AI که در اپلیکیشن‌هایی مانند واتساپ، مسنجر و اینستاگرام استفاده می‌شود، اکنون در ۴۰ کشور با استفاده از Llama 4 به‌روزرسانی شده است. ویژگی‌های چندحالته (مولتی‌مودال) فعلاً فقط در آمریکا و به زبان انگلیسی فعال هستند.

با این حال، مجوز استفاده از Llama 4 ممکن است برای برخی توسعه‌دهندگان مشکل‌ساز باشد. طبق مقررات:

  • افراد یا شرکت‌هایی که در اتحادیه اروپا سکونت دارند یا دفتر مرکزی آن‌ها در آنجاست، اجازه استفاده یا توزیع این مدل‌ها را ندارند. این محدودیت احتمالاً به دلیل الزامات سخت‌گیرانه قوانین جدید هوش مصنوعی و حفظ حریم خصوصی اتحادیه اروپا اعمال شده است.

  • همانند نسخه‌های قبلی، شرکت‌هایی با بیش از ۷۰۰ میلیون کاربر فعال ماهانه باید برای دریافت مجوز ویژه از متا درخواست دهند، و متا نیز اختیار کامل دارد که این درخواست را بپذیرد یا رد کند.

متا در پست وبلاگی خود نوشته:

«این مدل‌های Llama 4 آغازی بر عصر جدیدی برای اکوسیستم لاما هستند... این تنها شروع مجموعه Llama 4 است.»


متا اعلام کرده که Llama 4 اولین مجموعه مدل‌های این شرکت است که از معماری ترکیب کارشناسان (MoE) استفاده می‌کند، که برای آموزش و پاسخ‌دهی به سوالات از نظر محاسباتی کارآمدتر است. معماری MoE به‌طور کلی وظایف پردازش داده‌ها را به زیروظایف تقسیم کرده و سپس آن‌ها را به مدل‌های کوچکتر و تخصصی‌تر یا همان "کارشناسان" واگذار می‌کند.

برای مثال، مدل Maverick دارای ۴۰۰ میلیارد پارامتر کل است، اما تنها ۱۷ میلیارد پارامتر فعال در میان ۱۲۸ کارشناس دارد. (پارامترها به‌طور تقریبی مهارت‌های مدل در حل مشکلات را نشان می‌دهند.) مدل Scout نیز دارای ۱۷ میلیارد پارامتر فعال و ۱۶ کارشناس است و ۱۰۹ میلیارد پارامتر کل دارد. 

برچسب :

ارسال یک نظر

0نظرات

ارسال یک نظر (0)