مایکروسافت روز چهارشنبه چندین مدل هوش مصنوعی جدید "باز" را معرفی کرد که قویترین آنها در برخی معیارها با مدل o3-mini از OpenAI رقابت میکند.
تمامی مدلهای جدید که مجوزهای باز و آزاد دارند — شامل Phi 4 mini reasoning، Phi 4 reasoning و Phi 4 reasoning plus — مدلهای استدلالی هستند، به این معنی که آنها قادرند زمان بیشتری را صرف بررسی صحت پاسخها در مسائل پیچیده کنند. این مدلها خانواده مدلهای Phi "کوچک" مایکروسافت را گسترش میدهند که یک سال پیش برای ارائه پایهای برای توسعهدهندگان هوش مصنوعی جهت ساخت اپلیکیشنهای مبتنی بر لبه شبکه (edge computing) راهاندازی شد.
مدل Phi 4 mini reasoning روی حدود 1 میلیون مسئله ریاضی مصنوعی تولیدشده توسط مدل R1 reasoning از استارتاپ چینی DeepSeek آموزش دیده است. این مدل با 3.8 میلیارد پارامتر طراحی شده و مایکروسافت میگوید هدف از آن کاربردهای آموزشی است، مانند آموزشهای درونساختی در دستگاههای سبک.
پارامترها معمولاً معادل مهارتهای حل مسئله یک مدل هستند و مدلهایی که پارامترهای بیشتری دارند به طور معمول عملکرد بهتری نسبت به مدلهای با پارامترهای کمتر دارند.
Phi 4 reasoning، مدل 14 میلیارد پارامتری، با استفاده از دادههای وب با کیفیت بالا و همچنین نمایشهای کیفی از مدل o3-mini آموزش دیده است. این مدل بهترین گزینه برای کاربردهای ریاضی، علوم و کدنویسی است، طبق گفته مایکروسافت.
مدل Phi 4 reasoning plus نسخهای بهبود یافته از مدل Phi-4 مایکروسافت است که بهطور خاص برای بهبود دقت در برخی وظایف به یک مدل استدلالی تبدیل شده است. مایکروسافت ادعا میکند که این مدل به سطوح عملکرد مدل R1 نزدیک میشود که پارامترهای بیشتری دارد (671 میلیارد پارامتر). همچنین، بررسیهای داخلی مایکروسافت نشان میدهد که Phi 4 reasoning plus در آزمون OmniMath که یک تست مهارتهای ریاضی است، با مدل o3-mini برابر است.
این مدلها نشاندهنده پیشرفتهای جدید در زمینه مدلهای استدلالی هستند و به توسعهدهندگان این امکان را میدهند که از آنها برای حل مسائل پیچیدهتر استفاده کنند.