
اتوماسیون خانگی، صنعتی و کنترل دستگاهها با صوت
هدف این سامانه ایجاد ارتباط بین انسان و ماشین از طریق گفتار است. بدین معنی که انسان برای انجام کارها به جای استفاده از کلید و دکمه، با صحبت کردن درخواست خود را به رایانه یا دستگاه منتقل نماید. به عنوان کاربردهایی از این سامانه می توان به موارد زیر اشاره کرد:
- اجرا و کنترل برنامههای رایانه به کمک گفتار
این قابلیت کاربران را قادر میسازد تا بتوانند با استفاده از گفتار، کارهای کامپیوتری را انجام داده و یا نرمافزارها را کنترل نمایند. به عنوان مثال، کاربر می تواند با گفتن “به اینترنت وصل شو” مرورگر اینترنت را باز نماید. یا با گفتن “اندازه نوشته را بزرگتر کن” اندازه متن نوشته شده در ویرایشگر را بزرگتر نماید. به صورت مشابهی، کاربر میتواند فرمانهای صوتی مختلفی را در نرمافزارهای نصب شده در رایانه تعریف نموده و با بیان آنها، نرمافزارها را کنترل کند. از فرمانهای صوتی میتوان برای افزایش قابلیتهای جدید به نرم افزارهای مختلف مانند بازیها و نرمافزارهای آموزشی استفاده نمود.
- اتوماسیون خانگی و صنعتی با به كارگیری تشخیص گفتار
هدف این سیستم، ارایه راه حلی برای تشخیص گفتار از راه دور جهت کنترل وسایل و ابزارهای مورد استفاده میباشد. از کاربردهای این سیستم، استفاده از گفتار در خودرو، منزل و یا كارخانه برای اجرای فرمانهای متنوعی مانند روشن یا خاموش كردن یك دستگاه، كنترل كردن رباتها و موارد مشابه میباشد. این سیستم میتواند از پشت خط تلفن نیز به منظور کنترل از راه دور در ساختمانهای هوشمند مورد استفاده قرار گیرد.
پردازش گفتار در تلفنهای همراه و DSPها
هرچند استفاده از پردازشگرهای قوی در تلفنهای همراه رو به افزایش است ولی توسعه نرمافزارها در این بسترها با توجه به میزان پردازش موردنیاز کار دشواری است. شرکت عصر گویش پرداز آمادگی دارد سامانه تشخیص گفتار، متن به گفتار و تشخیص هویت گوینده را با كارایی بالا و سرعت پردازش بهینه برای گوشیها و DSPها توسعه دهد. برخی از كاربردهای این سیستمها به صورت زیر است:
- اجرای فرمانهای صوتی برروی تلفن همراه یا سختافزارها
- شمارهگیری یا تایپ گفتاری پیامک در تلفن همراه
- مترجم صوتی گفتار به گفتار (به صورت همراه)
- مجوز دسترسی با دستگاههای تایید هویت با صدا
- سخنگو کردن دستگاهها (مانند ربات)


پردازش زبان طبیعی (NLP)
یکی از پیشنیازهای سیستمهای هوش مصنوعی مانند تشخیص گفتار، تبدیل متن به گفتار، ترجمه ماشینی، بازشناسی نویسه های نوری و تصحیح خطاهایی تایپی، برخورداری از اطلاعات زبانی است. شرکت عصر گویش پرداز جهت گردآوری، استخراج و بهکارگیری اطلاعات زبانی در سیستمهای خود از آخرین روشهای موجود در زمینه پردازش زبانهای طبیعی استفاده کرده است که نتیجه آن استخراج حجم وسیعی از اطلاعات زبان فارسی برای نخستین بار بوده است. از جمله این اطلاعات که در سیستمهای تشخیص گفتار این شرکت مورد استفاده قرار گرفته است، پیکرههای بزرگ متنی، مدلهای زبانی آماری فارسی، مدل گرامری فارسی و مجموعه واژگانهای مختلف برای زبان فارسی میباشد. این اطلاعات میتواند به صورتهای مختلفی در نرمافزارهای کاربردی و فعالیتهای پژوهشی مورد استفاده قرار گیرد.
نرمافزارهای آموزشی و چندرسانهای
ندر بسیاری از نرمافزارهای آموزشی مانند آموزش زبان خارجی، آموزش قرآن نیاز به بخش هوشمندی است که کاربران بتوانند میزان یادگیری خود در بیان جملات را ارزیابی کنند. بررسی میزان صحت تلفط کلمات و عبارات در نرمافزارهای مختلف قابل استفاده بوده و بر اساس تکنیکهای بازشناسی الگو و مدلسازی آماری، شباهت میان کلمه/عبارت تلفظ شده توسط کاربر و کلمه/عبارت مرجع را محاسبه میکند.
قابلیت متن به گفتار نیز در نرمافزارهایی مانند کتاب صوتی و هر نرمافزاری که نیاز دارد اطلاعات مختلفی را به کاربر اعلام کند توسط ماژول آریانا قابل انجام است.


بهبود کیفیت گفتار
در بسیاری از کاربردها بهبود کیفیت شنیداری صوت یا گفتار و یا قابل فهم کردن آن موردنیاز است. مثلاً حذف صداها و خشهای اضافی از نوارهای قدیمی یا بهبود فایلهای ضبط شده در یک سخنرانی باعث بهتر شدن کیفیت آرشیوهای صوتی میشود. بر اساس تحقیقات انجام شده شرکت عصرگویش پرداز با بهرهگیری از آخرین روشهای موجود در این زمینه قادر به توسعه محصولی برای انجام این کار میباشد که میتواند هم به صورت یك نرمافزار مستقل مورد استفاده قرار گیرد و هم به صورت یک واحد مجزا در نرمافزارهای دیگر به کار گرفته شود. به عنوان مثال استفاده از این واحد در سیستمهای بازشناسی گفتار در محیط های نویزی مانند محیط نمایشگاه یا داخل ماشین کارایی و دقت این سیستمها را بهبود میدهد.
« برخی از پروژههای شرکت »
پروژه بازشناسی گفتار پیوسته
بازشناسی گفتار پیوسته به معنی تشخیص گفتار انسان توسط كامپیوتر و تبدیل آن به متن است كه در آن گفتار ورودی به صورت دنبالهای پیوسته از كلمات و جملات ادا میشود. در حال حاضر شركت عصرگویش پرداز با استفاده از جدیدترین تكنیكهای موجود، یك موتور بازشناسی گفتار پیوسته، مستقل از گوینده و با واژگان بزرگ را توسعه داده است كه با استفاده از آن نرمافزار تشخیص گفتار فارسی (نویسا) در نسخه های گوناگون تولید و عرضه شده است. با استفاده از این موتور امكان طراحی و توسعة نرم افزار گفتار به نوشتار برای زبان های دیگر (مانند انگلیسی، عربی، كردی و …) نیز فراهم است.
پروژه بازشناسی گفتار تلفنی
همزمان با فعالیت در بازشناسی گفتار میکروفونی، پروژه بازشناسی گفتار تلفنی نیز در شركت عصر گویش پرداز انجام شده است. تشخیص گفتار تلفنی در مقایسه با بازشناسی گفتار میكروفونی دارای پیچیدگی بیشتری است؛ زیرا گفتار تلفنی كیفیت پایینتری داشته و پهنای باند آن محدود به ۸ كیلوهرتز است. همچنین گفتار تلفنی معمولاً به صورت محاورهای بوده و تنوع گویندگان و همچنین تنوع كانالهای ارتباطی در آن بسیار بالا میباشد. این مسائل باعث میشود كه برای بازشناسی گفتار تلفنی از تكنیكهای متفاوتی نسبت به بازشناسی میكروفونی استفاده گردد. بازشناسی گفتار تلفنی برای بازشناسی اعداد و فرمانهای گفتاری در سیستمهای تلفن گویا (IVR) در خطوط آنالوگ، دیجیتال و ویپ (VoIP) استفاده میشود.
پروژه تبدیل متن به گفتار (TTS)
هدف از این پروژه خواندن متون الكترونیكی توسط رایانه است. این پروژه شامل دو بخش یا دو زیرپروژه است. بخش اول تبدیل متن به دنبالهای از واحدهای آوایی است و بخش دوم تبدیل دنباله واحدهای آوایی به گفتار (سنتز گفتار) میباشد. شركت عصرگویش پرداز برای بخش اول یك موتور تبدیل متن به واحدهای آوایی (TTP) را برای زبان فارسی توسعه داده است. برای بخش دوم نیز یك موتور سنتز گفتار با كیفیت بالا با استفاده از روشهای نوین نوشتار به گفتار، طراحی و توسعه داده شده است كه میتواند برای زبانهای دیگر نیز مورد استفاده قرار گیرد. مهمترین مسئله در تبدیل متن به گفتار، كیفیت گفتار خروجی است كه سعی میشود هرچه بیشتر به لحن گفتار انسان نزدیكتر بوده و كمتر حالت ماشینی داشته باشد. تلاشها برای افزایش كیفیت گفتار خروجی سیستم تبدیل متن به گفتار در شركت عصرگویش پرداز ادامه دارد.
پروژه شناسایی گوینده از روی صدا
صدای انسان از ویژگیهای بیومتریك و منحصر به فرد هر شخص است. هدف از شناسایی گوینده، استخراج اطلاعاتی از سیگنال گفتار است که در بردارنده هویت منحصر به فرد گوینده باشد. شناسایی گوینده شامل دو حوزه تشخیص هویت گوینده و تصدیق هویت گوینده (احراز هویت) است. در تعیین هویت گوینده، فرد از روی صحبت کردن شناسایی می شود و در تصدیق هویت، ادعای فرد مبنی بر اینکه چه کسی است، تایید یا رد میگردد. سامانههای شناسایی گوینده در کاربردهای مختلف امنیتی و کنترل دسترسی، به تنهایی یا در کنار دیگر روشهای امنیتی مورد استفاده قرار میگیرند. شركت عصر گویش پرداز یك سیستم شناسایی گوینده با دامنه باز را توسعه داده است كه قابل اجرا به صورت برخط و برون خط بوده و قادر است پردازشها را بر روی خطوط تلفن و ماهواره نیز انجام دهد.