شرکت OpenAI از مدل استدلالی O3-mini رونمایی کرد

بهروز فیض
توسط:
0

 اوپن‌ای‌آی روز جمعه مدل جدیدی از هوش مصنوعی با قابلیت «استدلال» به نام o3-mini را معرفی کرد که جدیدترین عضو از خانواده مدل‌های استدلالی o این شرکت است.



اوپن‌ای‌آی در کنار سیستمی توانمندتر به نام o3 اولین بار در دسامبر پیش‌نمایشی از این مدل ارائه داد. اما این عرضه در لحظه‌ای حساس برای شرکت انجام می‌شود؛ جایی که جاه‌طلبی‌ها و چالش‌های اوپن‌ای‌آی روز به روز در حال افزایش است.


اوپن‌ای‌آی در حال مقابله با این تصور است که در رقابت هوش مصنوعی از شرکت‌های چینی مانند دیپ‌سیک (DeepSeek) عقب افتاده است—شرکتی که اوپن‌ای‌آی ادعا می‌کند ممکن است مالکیت معنوی (IP) آن را سرقت کرده باشد. این شرکت همچنین تلاش می‌کند روابط خود را با واشنگتن تقویت کند، در حالی که به طور همزمان پروژه‌ای جاه‌طلبانه برای ساخت مراکز داده را دنبال می‌کند و طبق گزارش‌ها، مقدمات یکی از بزرگ‌ترین دورهای جذب سرمایه در تاریخ را فراهم می‌کند.


و این ما را به o3-mini می‌رساند. اوپن‌ای‌آی این مدل جدید را به عنوان مدلی هم «قدرتمند» و هم «مقرون به صرفه» معرفی می‌کند.

سخنگوی اوپن‌ای‌آی به تک‌کرانچ (TechCrunch) گفت:
«عرضه امروز […] گامی مهم در جهت گسترش دسترسی به هوش مصنوعی پیشرفته در راستای ماموریت ما است.»


بر خلاف اکثر مدل‌های زبانی بزرگ، مدل‌های استدلالی مانند o3-mini پیش از ارائه نتایج، به‌طور دقیق صحت‌سنجی (Fact-check) می‌کنند. این فرآیند به آن‌ها کمک می‌کند تا از برخی اشتباهات رایج که معمولاً مدل‌های دیگر را گرفتار می‌کند، اجتناب کنند. البته این مدل‌های استدلالی کمی زمان بیشتری برای رسیدن به راه‌حل‌ها نیاز دارند، اما در عوض، در حوزه‌هایی مانند فیزیک قابل اعتمادتر هستند—اگرچه هنوز بی‌نقص نیستند.

o3-mini به‌طور ویژه برای مسائل STEM (علوم، فناوری، مهندسی و ریاضیات) تنظیم دقیق (Fine-tuned) شده است، به‌ویژه در زمینه‌های برنامه‌نویسی، ریاضیات و علوم. اوپن‌ای‌آی ادعا می‌کند که این مدل از نظر توانایی‌ها تقریباً هم‌تراز با خانواده o1 (مدل‌های o1 و o1-mini) است، اما سریع‌تر اجرا می‌شود و هزینه کمتری دارد.

این شرکت اعلام کرد که تست‌کنندگان خارجی در بیش از نیمی از موارد، پاسخ‌های o3-mini را نسبت به o1-mini ترجیح داده‌اند. همچنین o3-mini در تست‌های A/B  به میزان ۳۹٪ اشتباهات عمده کمتری در پاسخ به «سؤالات دشوار دنیای واقعی» مرتکب شده و پاسخ‌هایی شفاف‌تر ارائه داده است، در حالی که ۲۴٪ سریع‌تر از o1-mini نتایج را تحویل داده است.

برچسب :

ارسال یک نظر

0نظرات

ارسال یک نظر (0)