شرکت OpenAI در رویداد Dev Day روز دوشنبه از بهروزرسانیهای جدید API خود رونمایی کرد که شامل مدل زبانی جدید GPT-5 Pro، نسخه دوم مدل تولید ویدئو Sora و یک مدل صوتی کوچکتر و ارزانتر بود.
این بهروزرسانیها بخشی از مجموعهای از اعلامها بودند که با هدف جذب توسعهدهندگان به اکوسیستم OpenAI انجام شد؛ از جمله معرفی ابزار ساخت عاملهای هوش مصنوعی و امکان ساخت اپلیکیشن درون ChatGPT.
مدل GPT-5 Pro میتواند برای توسعهدهندگانی که در حوزههای مالی، حقوقی و سلامت فعالیت میکنند جذاب باشد؛ حوزههایی که به دقت بالا و توانایی استدلال عمیق نیاز دارند.
سم آلتمن، مدیرعامل OpenAI گفت قابلیتهای صوتی در آینده اهمیت زیادی خواهند داشت، زیرا بهسرعت به یکی از روشهای اصلی تعامل کاربران با هوش مصنوعی تبدیل میشوند. به همین منظور، OpenAI مدل صوتی جدیدی به نام “gpt-realtime mini” را معرفی کرده که کوچکتر، ارزانتر و مناسب برای تعاملات صوتی با تأخیر کم است. این مدل ۷۰ درصد ارزانتر از مدل صوتی پیشرفته قبلی OpenAI است و کیفیت و بیان صوتی مشابهی را ارائه میدهد.
همچنین توسعهدهندگان اکنون میتوانند از نسخه پیشنمایش Sora 2 در API استفاده کنند. این مدل جدید تولید صوت و تصویر هفته گذشته همراه با اپلیکیشن Sora عرضه شد؛ اپلیکیشنی مشابه TikTok که شامل ویدئوهای کوتاه تولیدشده با هوش مصنوعی است. کاربران میتوانند با استفاده از یک دستور، ویدئوهایی از خود، دوستان یا هر موضوع دلخواه بسازند و آن را در یک فید الگوریتمی مشابه TikTok به اشتراک بگذارند.
آلتمن گفت توسعهدهندگان اکنون به همان مدلی دسترسی دارند که خروجیهای تصویری چشمگیر Sora 2 را تولید میکند و میتوانند آن را در اپلیکیشنهای خود بهکار بگیرند.
Sora 2 نسبت به نسخه قبلی خود پیشرفتهایی داشته و صحنههایی واقعگرایانهتر، هماهنگ با قوانین فیزیکی و صداهای همزمان تولید میکند. همچنین کنترل خلاقانه بیشتری در اختیار کاربران قرار میدهد؛ از جمله امکان تعیین دقیق زاویه دوربین و جلوههای بصری سبکدار.

