اتوماسیون خانگی، صنعتی و کنترل دستگاه‌ها با صوت

هدف این سامانه ایجاد ارتباط بین انسان و ماشین از طریق گفتار است. بدین معنی که انسان برای انجام کارها به جای استفاده از کلید و دکمه، با صحبت کردن و صوت درخواست خود را به رایانه یا دستگاه منتقل نماید. به عنوان کاربردهایی از این سامانه می‌توان به موارد زیر اشاره کرد:

 

  • اجرا و کنترل برنامه‌های رایانه به کمک گفتار

این قابلیت کاربران را قادر می‌سازد تا بتوانند با استفاده از گفتار، کارهای کامپیوتری را انجام داده و یا نرم‌افزارها را کنترل نمایند. به عنوان مثال، کاربر می‌تواند با گفتن “به اینترنت وصل شو” مرورگر اینترنت را باز نماید. یا با گفتن “اندازه نوشته را بزرگ‌تر کن” اندازه متن نوشته شده در ویرایشگر را بزرگ‌تر نماید. به صورت مشابهی، کاربر می‌تواند فرمان‌های صوتی مختلفی را در نرم‌افزارهای نصب شده در رایانه تعریف نموده و با بیان آن‌ها، نرم‌افزارها را کنترل کند. از صدا و فرمان‌های صوتی می‌توان برای افزایش قابلیت‌های جدید به نرم افزارهای مختلف مانند بازی‌ها و نرم‌افزارهای آموزشی استفاده نمود.

 

  • اتوماسیون خانگی و صنعتی با به كارگیری تشخیص گفتار

هدف این سیستم، ارائه راه‌حلی برای تشخیص صدا از راه دور جهت کنترل وسایل و ابزارهای مورد استفاده می‌باشد. از کاربردهای این سیستم، استفاده از گفتار در خودرو، منزل و یا كارخانه برای اجرای فرمان‌های متنوعی مانند روشن یا خاموش كردن یك دستگاه، كنترل كردن ربات‌ها و موارد مشابه می‌باشد. این سیستم می‌تواند از پشت خط تلفن نیز به منظور کنترل از راه دور در ساختمان‌های هوشمند مورد استفاده قرار گیرد.

پردازش صدا در تلفن‌های همراه و DSPها

هرچند استفاده از پردازشگرهای قوی در تلفن‌های همراه رو به افزایش است ولی توسعه نرم‌افزارها در این بسترها با توجه به میزان پردازش مورد نیاز کار دشواری است. شرکت عصر گویش پرداز آمادگی دارد سامانه تشخیص صدا، متن به صدا و تشخیص هویت گوینده را با كارایی بالا و سرعت پردازش بهینه برای گوشی‌ها و DSPها توسعه دهد. برخی از كاربردهای این سیستم‌ها به صورت زیر است:

  • اجرای فرمان‌های صوتی بر روی تلفن همراه یا سخت‌افزارها
  • شماره‌گیری یا تایپ صوتی پیامک در تلفن همراه
  • مترجم صوتی گفتار به گفتار (به صورت همراه)
  • مجوز دسترسی با دستگاه‌های تایید هویت با صدا
  • سخن‌گو کردن دستگاه‌ها (مانند ربات)

پردازش زبان طبیعی (NLP)

یکی از پیش‌نیازهای سیستم‌های هوش مصنوعی مانند تشخیص صدا، تبدیل متن به صدا و تبدیل صدا به متن ، ترجمه ماشینی و بازشناسی نویسه‌های نوری و تصحیح خطاهای تایپی، برخورداری از اطلاعات زبانی است.

شرکت عصر گویش پرداز جهت گردآوری، استخراج و به ‌کارگیری اطلاعات زبانی در سیستم‌ها و خدمات خود (مثل تبدیل متن به گفتار، گفتار به متن و…) از آخرین روش‌های موجود در زمینه پردازش زبان‌ طبیعی استفاده کرده است که نتیجه آن استخراج حجم وسیعی از اطلاعات زبان فارسی برای نخستین بار بوده است.

از جمله اطلاعاتی که در سیستم‌های تشخیص گفتار عصرگویش‌ پرداز مورد استفاده قرار گرفته است می‌توان به  پیکره‌های بزرگ متنی، مدل‌های زبانی آماری فارسی، مدل گرامری فارسی و مجموعه واژگان‌ مختلف برای زبان فارسی اشاره کرد. این اطلاعات می‌تواند به صورت‌های مختلفی در نرم‌افزارهای کاربردی و فعالیت‌های پژوهشی مورد استفاده قرار گیرد.

نرم‌افزارهای آموزشی و چندرسانه‌ای

در بسیاری از نرم ‌افزارهای آموزشی مانند آموزش زبان خارجی و آموزش قرآن نیاز به بخش هوشمندی است که کاربران بتوانند میزان یادگیری خود در بیان جملات را ارزیابی کنند. بررسی میزان صحت تلفظ کلمات و عبارات در نرم‌افزارهای مختلف ممکن است و بر اساس تکنیک‌های بازشناسی الگو و مدل‌سازی آماری، شباهت میان کلمه/عبارت تلفظ شده توسط کاربر و کلمه/عبارت مرجع را محاسبه می‌کند.
قابلیت تبدیل متن به صدا نیز در نرم‌افزارهایی مانند کتاب صوتی و هر نرم‌افزاری که نیاز دارد اطلاعات مختلفی را به کاربر اعلام کند توسط ماژول آریانا قابل انجام است.

بهبود کیفیت گفتار

در بسیاری از کاربردها بهبود کیفیت شنیداری صوت یا گفتار و یا قابل فهم کردن آن موردنیاز است. مثلاً حذف صداها و خش‌های اضافی از نوارهای قدیمی یا بهبود فایل‌های ضبط شده در یک سخنرانی باعث بهتر شدن کیفیت آرشیوهای صوتی می‌شود. بر اساس تحقیقات انجام شده، شرکت عصرگویش پرداز با بهره‌گیری از آخرین روش‌های موجود در این زمینه قادر به توسعه محصولی برای انجام این کار می‌باشد که می‌تواند هم به صورت یك نرم‌افزار مستقل مورد استفاده قرار گیرد و هم به صورت یک واحد مجزا در نرم‌افزارهای دیگر به کار گرفته شود. به عنوان مثال استفاده از این واحد در سیستم‌های بازشناسی گفتار در محیط‌های نویزی مانند محیط نمایشگاه یا داخل ماشین کارایی و دقت این سیستم‌ها را بهبود می‌دهد.