صوت و خلاصه سازی صوتی هدف بعدی Ai است

بهروز فیض
0

 اوپن‌اِی‌آی سرمایه‌گذاری بزرگی روی هوش مصنوعی صوتی انجام می‌دهد و هدف فقط بهتر کردن صدای چت‌جی‌پی‌تی نیست. بر اساس گزارش جدید نشریه The Information، این شرکت طی دو ماه گذشته چندین تیم مهندسی، محصول و پژوهش را یکپارچه کرده تا مدل‌های صوتی خود را بازطراحی کند؛ اقدامی که در نهایت به ساخت یک دستگاه شخصی «صوت‌محور» منجر می‌شود که حدود یک سال دیگر عرضه خواهد شد.



این جهت‌گیری نشان می‌دهد صنعت فناوری به‌طور کلی به سمتی می‌رود که در آن صفحه‌نمایش‌ها به پس‌زمینه می‌روند و صدا به محور اصلی تبدیل می‌شود. بلندگوهای هوشمند اکنون دستیارهای صوتی را به بیش از یک‌سوم خانه‌های آمریکایی وارد کرده‌اند. متا به‌تازگی قابلیتی را برای عینک‌های هوشمند ری‌بن معرفی کرده که با آرایه‌ای از پنج میکروفون، شنیدن مکالمات در محیط‌های شلوغ را آسان‌تر می‌کند و عملاً صورت کاربر را به یک ابزار شنود جهت‌دار تبدیل می‌کند. گوگل نیز از ژوئن آزمایش «Audio Overviews» را آغاز کرده که نتایج جست‌وجو را به خلاصه‌های مکالمه‌ای تبدیل می‌کند. تسلا هم در حال افزودن چت‌بات Grok متعلق به xAI به خودروهای خود است تا یک دستیار صوتی مکالمه‌محور ایجاد کند که از مسیریابی تا کنترل دما را با گفت‌وگوی طبیعی انجام می‌دهد.

این روند فقط محدود به غول‌های فناوری نیست. گروهی از استارتاپ‌ها نیز با همین باور وارد میدان شده‌اند، هرچند با موفقیت‌های متفاوت. سازندگان Humane AI Pin صدها میلیون دلار هزینه کردند اما پوشیدنی بدون صفحه‌نمایش آن‌ها به یک نمونه هشداردهنده تبدیل شد. گردنبند Friend AI که ادعا می‌کند زندگی شما را ضبط می‌کند و همراهی ارائه می‌دهد، نگرانی‌های جدی درباره حریم خصوصی و حتی ترس‌های وجودی ایجاد کرده است. اکنون هم دست‌کم دو شرکت، از جمله Sandbar و یک تیم به رهبری بنیان‌گذار Pebble، در حال ساخت حلقه‌های هوش مصنوعی هستند که قرار است در سال ۲۰۲۶ عرضه شوند و به کاربران اجازه می‌دهند عملاً «با دست خود صحبت کنند».

با وجود تفاوت در شکل و ظاهر این دستگاه‌ها، ایده اصلی یکسان است: صدا رابط کاربری آینده است. هر فضا — خانه، خودرو و حتی صورت — در حال تبدیل شدن به یک سطح کنترل است.

برچسب ها

ارسال یک نظر

0 نظرات

ارسال یک نظر (0)
3/related/default