0

Cart

5036

اتوماسیون خانگی، صنعتی و کنترل دستگاه‌ها با صوت

هدف این سامانه ایجاد ارتباط بین انسان و ماشین از طریق گفتار است. بدین معنی که انسان برای انجام کارها به جای استفاده از کلید و دکمه، با صحبت کردن درخواست خود را به رایانه یا دستگاه منتقل نماید. به عنوان کاربردهایی از این سامانه می توان به موارد زیر اشاره کرد:

  • اجرا و کنترل برنامه‌های رایانه به کمک گفتار

این قابلیت کاربران را قادر می‌سازد تا بتوانند با استفاده از گفتار، کارهای کامپیوتری را انجام داده و یا نرم‌افزارها را کنترل نمایند. به عنوان مثال، کاربر می تواند با گفتن “به اینترنت وصل شو” مرورگر اینترنت را باز نماید. یا با گفتن “اندازه نوشته را بزرگ‌تر کن” اندازه متن نوشته شده در ویرایشگر را بزرگ‌تر نماید. به صورت مشابهی، کاربر می‌تواند فرمان‌های صوتی مختلفی را در نرم‌افزارهای نصب شده در رایانه تعریف نموده و با بیان آنها، نرم‌افزارها را کنترل کند. از فرمان‌های صوتی می‌توان برای افزایش قابلیت‌های جدید به نرم افزارهای مختلف مانند بازی‌ها و نرم‌افزارهای آموزشی استفاده نمود.

  • اتوماسیون خانگی و صنعتی با به كارگیری تشخیص گفتار

هدف این سیستم، ارایه راه حلی برای تشخیص گفتار از راه دور جهت کنترل وسایل و ابزارهای مورد استفاده می‌باشد. از کاربردهای این سیستم، استفاده از گفتار در خودرو، منزل و یا كارخانه برای اجرای فرمان‌های متنوعی مانند روشن یا خاموش كردن یك دستگاه، كنترل كردن ربات‌ها و موارد مشابه می‌باشد. این سیستم می‌تواند از پشت خط تلفن نیز به منظور کنترل از راه دور در ساختمان‌های هوشمند مورد استفاده قرار گیرد.

پردازش گفتار در تلفن‌های همراه و DSPها

هرجند استفاده از پردازشگرهای قوی در تلفن‌های همراه رو به افزایش است ولی توسعه نرم‌افزارها در این بسترها با توجه به میزان پردازش موردنیاز کار دشواری است. شرکت عصر گویش پرداز آمادگی دارد سامانه تشخیص گفتار، متن به گفتار و تشخیص هویت گوینده را با كارایی بالا و سرعت پردازش بهینه برای گوشی‌ها و DSPها توسعه دهد. برخی از كاربردهای این سیستم‌ها به صورت زیر است:

  • اجرای فرمان‌های صوتی برروی تلفن همراه یا سخت‌افزارها
  • شماره‌گیری یا تایپ گفتاری پیامک در تلفن همراه
  • مترجم صوتی گفتار به گفتار (به صورت همراه)
  • مجوز دسترسی با دستگاه‌های تایید هویت با صدا
  • سخن‌گو کردن دستگاه‌ها (مانند ربات)

2681
5295

پردازش زبان طبیعی (NLP)

یکی از پیش‌نیازهای سیستم‌های هوش مصنوعی مانند تشخیص گفتار، تبدیل متن به گفتار، ترجمه ماشینی، بازشناسی نویسه های نوری و تصحیح خطاهایی تایپی، برخورداری از  اطلاعات زبانی است. شرکت عصر گویش پرداز جهت گردآوری، استخراج و به‌کارگیری اطلاعات زبانی در سیستم‌های خود از آخرین روش‌های موجود در زمینه پردازش زبان‌های طبیعی استفاده کرده است که نتیجه آن استخراج حجم وسیعی از اطلاعات زبان فارسی برای نخستین بار بوده است. از جمله این اطلاعات که در سیستم‌های تشخیص گفتار این شرکت مورد استفاده قرار گرفته است، پیکره‌های بزرگ متنی، مدل‌های زبانی آماری فارسی، مدل گرامری فارسی و مجموعه واژگان‌های مختلف برای زبان فارسی می‌باشد. این اطلاعات می‌تواند به صورت‌های مختلفی در نرم‌افزارهای کاربردی و فعالیت‌های پژوهشی مورد استفاده قرار گیرد.

نرم‌افزارهای آموزشی و چندرسانه‌ای

ندر بسیاری از نرم‌افزارهای آموزشی مانند آموزش زبان خارجی، آموزش قرآن نیاز به بخش هوشمندی است که کاربران بتوانند میزان یادگیری خود در بیان جملات را ارزیابی کنند. بررسی میزان صحت تلفط کلمات و عبارات در نرم‌افزارهای مختلف قابل استفاده بوده و بر اساس تکنیک‌های بازشناسی الگو و مدل‌سازی آماری، شباهت میان کلمه/عبارت تلفظ شده توسط کاربر و کلمه/عبارت مرجع را محاسبه می‌کند.
قابلیت متن به گفتار نیز در نرم‌افزارهایی مانند کتاب صوتی و هر نرم‌افزاری که نیاز دارد اطلاعات مختلفی را به کاربر اعلام کند توسط ماژول آریانا قابل انجام است.

1880
5266

بهبود کیفیت گفتار

در بسیاری از کاربردها بهبود کیفیت شنیداری صوت یا گفتار و یا قابل فهم کردن آن موردنیاز است. مثلاً حذف صداها و خش‌های اضافی از نوارهای قدیمی یا بهبود فایل‌های ضبط شده در یک سخنرانی باعث بهتر شدن کیفیت آرشیوهای صوتی می‌شود. بر اساس تحقیقات انجام شده شرکت عصرگویش پرداز با بهره‌گیری از آخرین روش‌های موجود در این زمینه قادر به توسعه محصولی برای انجام این کار می‌باشد که می‌تواند هم به صورت یك نرم‌افزار مستقل مورد استفاده قرار گیرد و هم به صورت یک واحد مجزا در نرم‌افزارهای دیگر به کار گرفته شود. به عنوان مثال استفاده از این واحد در سیستم‌های بازشناسی گفتار در محیط های نویزی مانند محیط نمایشگاه یا داخل ماشین کارایی و دقت این سیستم‌ها را بهبود می‌دهد.

« برخی از پروژه‌های شرکت »

پروژه بازشناسی گفتار پیوسته

بازشناسی گفتار پیوسته به معنی تشخیص گفتار انسان توسط كامپیوتر و تبدیل آن به متن است كه در آن گفتار ورودی به صورت دنباله‌ای پیوسته از كلمات و جملات ادا می‌شود. در حال حاضر شركت عصرگویش پرداز با استفاده از جدیدترین تكنیك‌های موجود، یك موتور بازشناسی گفتار پیوسته، مستقل از گوینده و با واژگان بزرگ را توسعه داده است كه با استفاده از آن نرم‌افزار تشخیص گفتار فارسی (نویسا) در نسخه های گوناگون تولید و عرضه شده است. با استفاده از این موتور امكان طراحی و توسعة نرم افزار گفتار به نوشتار برای زبان های دیگر (مانند انگلیسی، عربی، كردی و …) نیز فراهم است.

پروژه بازشناسی گفتار تلفنی

همزمان با فعالیت در بازشناسی گفتار میکروفونی، پروژه بازشناسی گفتار تلفنی نیز در شركت عصر گویش پرداز انجام شده است. تشخیص گفتار تلفنی در مقایسه با بازشناسی گفتار میكروفونی دارای پیچیدگی بیشتری است؛ زیرا گفتار تلفنی كیفیت پایین‌تری داشته و پهنای باند آن  محدود به ۸ كیلوهرتز است. همچنین گفتار تلفنی معمولاً به صورت محاوره‌ای بوده و تنوع گویندگان و همچنین تنوع كانال‌های ارتباطی در آن بسیار بالا می‌باشد. این مسائل باعث می‌شود كه برای بازشناسی گفتار تلفنی از تكنیك‌های متفاوتی نسبت به بازشناسی میكروفونی استفاده گردد. بازشناسی گفتار تلفنی برای بازشناسی اعداد و فرمان‌های گفتاری در سیستم‌های تلفن گویا (IVR) در خطوط آنالوگ، دیجیتال و ویپ (VoIP) استفاده می‌شود.

پروژه تبدیل متن به گفتار (TTS)

هدف از این پروژه خواندن متون الكترونیكی توسط رایانه است. این پروژه شامل دو بخش یا دو زیرپروژه است. بخش اول تبدیل متن به دنباله‌ای از واحدهای آوایی است و بخش دوم تبدیل دنباله واحدهای آوایی به گفتار (سنتز گفتار) می‌باشد. شركت عصرگویش پرداز برای بخش اول یك موتور تبدیل متن به واحدهای آوایی (TTP) را برای زبان فارسی توسعه داده است. برای بخش دوم نیز یك موتور سنتز گفتار با كیفیت بالا با استفاده از روش‌های نوین نوشتار به گفتار، طراحی و توسعه داده شده است كه می‌تواند برای زبان‌های دیگر نیز مورد استفاده قرار گیرد. مهم‌ترین مسئله در تبدیل متن به گفتار، كیفیت گفتار خروجی است كه سعی می‌شود هرچه بیشتر به لحن گفتار انسان نزدیك‌تر بوده و كمتر حالت ماشینی داشته باشد. تلاش‌ها برای افزایش كیفیت گفتار خروجی سیستم تبدیل متن به گفتار در شركت عصرگویش پرداز ادامه دارد.

پروژه شناسایی گوینده از روی صدا

صدای انسان از ویژگی‌های بیومتریك و منحصر به فرد هر شخص است. هدف از شناسایی گوینده، استخراج اطلاعاتی از سیگنال گفتار است که در بردارنده هویت منحصر به فرد گوینده باشد. شناسایی گوینده شامل دو حوزه تشخیص هویت گوینده و تصدیق هویت گوینده (احراز هویت) است. در تعیین هویت گوینده، فرد از روی صحبت کردن شناسایی می شود و در تصدیق هویت، ادعای فرد مبنی بر اینکه چه کسی است، تایید یا رد می‌گردد. سامانه‌های شناسایی گوینده در کاربردهای مختلف امنیتی و کنترل دسترسی، به تنهایی یا در کنار دیگر روش‌های امنیتی مورد استفاده قرار می‌گیرند. شركت عصر گویش پرداز یك سیستم شناسایی گوینده با دامنه باز را توسعه داده است كه قابل اجرا به صورت برخط و برون خط بوده و قادر است پردازش‌ها را بر روی خطوط تلفن و ماهواره نیز انجام دهد.