اتوماسیون خانگی، صنعتی و کنترل دستگاهها با صوت
هدف این سامانه ایجاد ارتباط بین انسان و ماشین از طریق گفتار است. بدین معنی که انسان برای انجام کارها به جای استفاده از کلید و دکمه، با صحبت کردن و صوت درخواست خود را به رایانه یا دستگاه منتقل نماید. به عنوان کاربردهایی از این سامانه میتوان به موارد زیر اشاره کرد:
-
اجرا و کنترل برنامههای رایانه به کمک گفتار
این قابلیت کاربران را قادر میسازد تا بتوانند با استفاده از گفتار، کارهای کامپیوتری را انجام داده و یا نرمافزارها را کنترل نمایند. به عنوان مثال، کاربر میتواند با گفتن “به اینترنت وصل شو” مرورگر اینترنت را باز نماید. یا با گفتن “اندازه نوشته را بزرگتر کن” اندازه متن نوشته شده در ویرایشگر را بزرگتر نماید. به صورت مشابهی، کاربر میتواند فرمانهای صوتی مختلفی را در نرمافزارهای نصب شده در رایانه تعریف نموده و با بیان آنها، نرمافزارها را کنترل کند. از صدا و فرمانهای صوتی میتوان برای افزایش قابلیتهای جدید به نرم افزارهای مختلف مانند بازیها و نرمافزارهای آموزشی استفاده نمود.
-
اتوماسیون خانگی و صنعتی با به كارگیری تشخیص گفتار
هدف این سیستم، ارائه راهحلی برای تشخیص صدا از راه دور جهت کنترل وسایل و ابزارهای مورد استفاده میباشد. از کاربردهای این سیستم، استفاده از گفتار در خودرو، منزل و یا كارخانه برای اجرای فرمانهای متنوعی مانند روشن یا خاموش كردن یك دستگاه، كنترل كردن رباتها و موارد مشابه میباشد. این سیستم میتواند از پشت خط تلفن نیز به منظور کنترل از راه دور در ساختمانهای هوشمند مورد استفاده قرار گیرد.
پردازش صدا در تلفنهای همراه و DSPها
هرچند استفاده از پردازشگرهای قوی در تلفنهای همراه رو به افزایش است ولی توسعه نرمافزارها در این بسترها با توجه به میزان پردازش مورد نیاز کار دشواری است. شرکت عصر گویش پرداز آمادگی دارد سامانه تشخیص صدا، متن به صدا و تشخیص هویت گوینده را با كارایی بالا و سرعت پردازش بهینه برای گوشیها و DSPها توسعه دهد. برخی از كاربردهای این سیستمها به صورت زیر است:
- اجرای فرمانهای صوتی بر روی تلفن همراه یا سختافزارها
- شمارهگیری یا تایپ صوتی پیامک در تلفن همراه
- مترجم صوتی گفتار به گفتار (به صورت همراه)
- مجوز دسترسی با دستگاههای تایید هویت با صدا
- سخنگو کردن دستگاهها (مانند ربات)
پردازش زبان طبیعی (NLP)
یکی از پیشنیازهای سیستمهای هوش مصنوعی مانند تشخیص صدا، تبدیل متن به صدا و تبدیل صدا به متن ، ترجمه ماشینی و بازشناسی نویسههای نوری و تصحیح خطاهای تایپی، برخورداری از اطلاعات زبانی است.
شرکت عصر گویش پرداز جهت گردآوری، استخراج و به کارگیری اطلاعات زبانی در سیستمها و خدمات خود (مثل تبدیل متن به گفتار، گفتار به متن و…) از آخرین روشهای موجود در زمینه پردازش زبان طبیعی استفاده کرده است که نتیجه آن استخراج حجم وسیعی از اطلاعات زبان فارسی برای نخستین بار بوده است.
از جمله اطلاعاتی که در سیستمهای تشخیص گفتار عصرگویش پرداز مورد استفاده قرار گرفته است میتوان به پیکرههای بزرگ متنی، مدلهای زبانی آماری فارسی، مدل گرامری فارسی و مجموعه واژگان مختلف برای زبان فارسی اشاره کرد. این اطلاعات میتواند به صورتهای مختلفی در نرمافزارهای کاربردی و فعالیتهای پژوهشی مورد استفاده قرار گیرد.
نرمافزارهای آموزشی و چندرسانهای
در بسیاری از نرم افزارهای آموزشی مانند آموزش زبان خارجی و آموزش قرآن نیاز به بخش هوشمندی است که کاربران بتوانند میزان یادگیری خود در بیان جملات را ارزیابی کنند. بررسی میزان صحت تلفظ کلمات و عبارات در نرمافزارهای مختلف ممکن است و بر اساس تکنیکهای بازشناسی الگو و مدلسازی آماری، شباهت میان کلمه/عبارت تلفظ شده توسط کاربر و کلمه/عبارت مرجع را محاسبه میکند.
قابلیت تبدیل متن به صدا نیز در نرمافزارهایی مانند کتاب صوتی و هر نرمافزاری که نیاز دارد اطلاعات مختلفی را به کاربر اعلام کند توسط ماژول آریانا قابل انجام است.
بهبود کیفیت گفتار
در بسیاری از کاربردها بهبود کیفیت شنیداری صوت یا گفتار و یا قابل فهم کردن آن موردنیاز است. مثلاً حذف صداها و خشهای اضافی از نوارهای قدیمی یا بهبود فایلهای ضبط شده در یک سخنرانی باعث بهتر شدن کیفیت آرشیوهای صوتی میشود. بر اساس تحقیقات انجام شده، شرکت عصرگویش پرداز با بهرهگیری از آخرین روشهای موجود در این زمینه قادر به توسعه محصولی برای انجام این کار میباشد که میتواند هم به صورت یك نرمافزار مستقل مورد استفاده قرار گیرد و هم به صورت یک واحد مجزا در نرمافزارهای دیگر به کار گرفته شود. به عنوان مثال استفاده از این واحد در سیستمهای بازشناسی گفتار در محیطهای نویزی مانند محیط نمایشگاه یا داخل ماشین کارایی و دقت این سیستمها را بهبود میدهد.