شرکت OpenAI از نسخه جدید API خود رونمایی کرد

بهروز فیض
0

 شرکت OpenAI در رویداد Dev Day روز دوشنبه از به‌روزرسانی‌های جدید API خود رونمایی کرد که شامل مدل زبانی جدید GPT-5 Pro، نسخه دوم مدل تولید ویدئو Sora و یک مدل صوتی کوچک‌تر و ارزان‌تر بود.



این به‌روزرسانی‌ها بخشی از مجموعه‌ای از اعلام‌ها بودند که با هدف جذب توسعه‌دهندگان به اکوسیستم OpenAI انجام شد؛ از جمله معرفی ابزار ساخت عامل‌های هوش مصنوعی و امکان ساخت اپلیکیشن درون ChatGPT.

مدل GPT-5 Pro می‌تواند برای توسعه‌دهندگانی که در حوزه‌های مالی، حقوقی و سلامت فعالیت می‌کنند جذاب باشد؛ حوزه‌هایی که به دقت بالا و توانایی استدلال عمیق نیاز دارند.

سم آلتمن، مدیرعامل OpenAI گفت قابلیت‌های صوتی در آینده اهمیت زیادی خواهند داشت، زیرا به‌سرعت به یکی از روش‌های اصلی تعامل کاربران با هوش مصنوعی تبدیل می‌شوند. به همین منظور، OpenAI مدل صوتی جدیدی به نام “gpt-realtime mini” را معرفی کرده که کوچک‌تر، ارزان‌تر و مناسب برای تعاملات صوتی با تأخیر کم است. این مدل ۷۰ درصد ارزان‌تر از مدل صوتی پیشرفته قبلی OpenAI است و کیفیت و بیان صوتی مشابهی را ارائه می‌دهد.

همچنین توسعه‌دهندگان اکنون می‌توانند از نسخه پیش‌نمایش Sora 2 در API استفاده کنند. این مدل جدید تولید صوت و تصویر هفته گذشته همراه با اپلیکیشن Sora عرضه شد؛ اپلیکیشنی مشابه TikTok که شامل ویدئوهای کوتاه تولیدشده با هوش مصنوعی است. کاربران می‌توانند با استفاده از یک دستور، ویدئوهایی از خود، دوستان یا هر موضوع دلخواه بسازند و آن را در یک فید الگوریتمی مشابه TikTok به اشتراک بگذارند.

آلتمن گفت توسعه‌دهندگان اکنون به همان مدلی دسترسی دارند که خروجی‌های تصویری چشمگیر Sora 2 را تولید می‌کند و می‌توانند آن را در اپلیکیشن‌های خود به‌کار بگیرند.

Sora 2 نسبت به نسخه قبلی خود پیشرفت‌هایی داشته و صحنه‌هایی واقع‌گرایانه‌تر، هماهنگ با قوانین فیزیکی و صداهای هم‌زمان تولید می‌کند. همچنین کنترل خلاقانه بیشتری در اختیار کاربران قرار می‌دهد؛ از جمله امکان تعیین دقیق زاویه دوربین و جلوه‌های بصری سبک‌دار.

برچسب ها

ارسال یک نظر

0 نظرات

ارسال یک نظر (0)
3/related/default