نسخه جدید مدل هوش مصنوعی Claude Sonnet 4.5 معرفی شد

بهروز فیض
0

 شرکت Anthropic روز دوشنبه مدل جدیدی با نام Claude Sonnet 4.5 را معرفی کرد که به گفته این شرکت، عملکردی پیشرفته در آزمون‌های برنامه‌نویسی دارد. این مدل قادر به ساخت برنامه‌هایی با کیفیت تولیدی است، نه صرفاً نمونه‌های اولیه، و از نظر قابلیت اطمینان نسبت به مدل‌های قبلی پیشرفت قابل توجهی داشته است.



Claude Sonnet 4.5 از طریق API و چت‌بات Claude در دسترس قرار گرفته و قیمت آن برای توسعه‌دهندگان مشابه نسخه قبلی است: ۳ دلار برای هر یک میلیون توکن ورودی (تقریباً معادل ۷۵۰ هزار واژه) و ۱۵ دلار برای هر یک میلیون توکن خروجی.

در یک سال گذشته، مدل‌های هوش مصنوعی Anthropic به گزینه محبوبی میان توسعه‌دهندگان و شرکت‌ها تبدیل شده‌اند، به‌ویژه به دلیل عملکرد قوی در وظایف مهندسی نرم‌افزار. گزارش‌ها حاکی از آن است که شرکت‌های اپل و متا به‌صورت داخلی از مدل‌های Claude استفاده می‌کنند و Anthropic از طریق فروش دسترسی API به ابزارهای کدنویسی مانند Cursor، Windsurf و Replit کسب‌وکار قابل توجهی ایجاد کرده است. با این حال، مدل GPT-5 شرکت OpenAI اخیراً با عملکرد بهتر در آزمون‌های برنامه‌نویسی، جایگاه Claude را به چالش کشیده است.

به گفته Anthropic، Claude Sonnet 4.5 در چندین معیار برنامه‌نویسی از جمله SWE-Bench Verified عملکردی در سطح صنعت دارد. با این حال، دیوید هرشی، پژوهشگر هوش مصنوعی در این شرکت، به TechCrunch گفته که عملکرد این مدل را نمی‌توان صرفاً با معیارهای عددی به‌طور کامل ارزیابی کرد.



دیوید هرشی، پژوهشگر شرکت Anthropic، گفته در آزمایش‌های اولیه با برخی مشتریان سازمانی، مدل Claude Sonnet 4.5 توانسته به‌طور مستقل تا ۳۰ ساعت کدنویسی کند. در این مدت، مدل نه‌تنها یک اپلیکیشن ساخته، بلکه خدمات پایگاه داده راه‌اندازی کرده، دامنه اینترنتی خریده و ممیزی امنیتی SOC 2 انجام داده تا از ایمن بودن محصول اطمینان حاصل کند.

مدیرعامل Cursor، مایکل تروئل، در بیانیه‌ای به TechCrunch گفته Claude Sonnet 4.5 عملکردی در سطح پیشرفته در کدنویسی دارد، به‌ویژه در وظایف بلندمدت. جف وانگ، مدیرعامل Windsurf نیز این مدل را «نسل جدیدی از مدل‌های کدنویسی» توصیف کرده است.

شرکت Anthropic همچنین اعلام کرده که Claude Sonnet 4.5 هماهنگ‌ترین مدل هوش مصنوعی این شرکت تاکنون است و نرخ چاپلوسی و فریب در آن نسبت به نسخه‌های قبلی کمتر شده است. همچنین آسیب‌پذیری این مدل در برابر حملات تزریق دستورات بهبود یافته است.


برچسب ها

ارسال یک نظر

0 نظرات

ارسال یک نظر (0)
3/related/default