گوگل یک برنامه تبدیل گفتار به نوشتار حرفه ای معرفی کرد

بهروز فیض
0

 گوگل روز دوشنبه به‌طور بی‌سروصدا یک اپلیکیشن دیکته مبتنی بر هوش مصنوعی با نام «Google AI Edge Eloquent» را برای سیستم‌عامل iOS منتشر کرد تا با برنامه‌هایی مانند Wispr Flow، SuperWhisper و Willow رقابت کند.



این اپلیکیشن به‌صورت رایگان قابل دانلود است و پس از دانلود مدل‌های تشخیص گفتار مبتنی بر Gemma، کاربران می‌توانند بدون نیاز به اینترنت روی گوشی خود دیکته کنند. در داخل برنامه، متن به‌صورت زنده نمایش داده می‌شود و زمانی که کاربر مکث می‌کند، اپلیکیشن به‌طور خودکار کلمات پرکننده مانند «اِم» و «اَه» را حذف کرده و متن را ویرایش می‌کند.

در بخش پایین متن نیز گزینه‌هایی مانند «نکات کلیدی»، «رسمی»، «کوتاه» و «بلند» وجود دارد که به کاربر امکان می‌دهد متن را به شکل‌های مختلف تغییر دهد.



کاربران می‌توانند حالت ابری را غیرفعال کنند تا پردازش فقط به‌صورت محلی روی دستگاه انجام شود. در حالت فعال بودن فضای ابری، این برنامه از مدل‌های ابری Gemini برای ویرایش و بهبود متن استفاده می‌کند. همچنین این اپلیکیشن در صورت تمایل می‌تواند برخی کلمات کلیدی، نام‌ها و اصطلاحات تخصصی را از حساب جیمیل کاربر وارد کند و امکان افزودن واژه‌های دلخواه به‌صورت دستی نیز وجود دارد.



این برنامه تاریخچه جلسات دیکته را نمایش می‌دهد و امکان جست‌وجو در آن‌ها را فراهم می‌کند. همچنین اطلاعاتی مانند کلمات گفته‌شده در آخرین جلسه، سرعت گفتار بر حسب تعداد کلمات در دقیقه و مجموع کلمات بیان‌شده را نشان می‌دهد.

در توضیحات اپ‌استور آمده است که «Google AI Edge Eloquent یک اپلیکیشن پیشرفته دیکته است که برای پر کردن فاصله بین گفتار طبیعی و متن حرفه‌ای و آماده استفاده طراحی شده است. برخلاف نرم‌افزارهای معمولی که مکث‌ها و کلمات پرکننده را عیناً ثبت می‌کنند، این برنامه با استفاده از هوش مصنوعی تلاش می‌کند منظور واقعی کاربر را منتقل کند و به‌طور خودکار کلماتی مانند “اِم” و “اَه” و اصلاحات وسط جمله را حذف کرده و متنی روان و دقیق ارائه دهد.»

برچسب ها

ارسال یک نظر

0 نظرات

ارسال یک نظر (0)
3/related/default