0

Cart

1874

تشخیص فرمان های صوتی و گفتار

هدف این سامانه ممکن ساختن ایجاد ارتباط بین انسان و ماشین (از جمله رایانه ها) از طریق گفتار است. بدین معنی که انسان برای انجام کارهای معمول با ماشین ها بتواند به جای استفاده از کلید و دکمه، با صحبت کردن با ماشین درخواست خود را به آن منتقل نماید. به عنوان کاربردهایی از این سامانه می توان به موارد زیر اشاره کرد:

  • اجرا و کنترل برنامه های رایانه به کمک گفتار

این قابلیت کاربران را قادر می ساز تا بتوانند با استفاده از گفتار، کارهای کامپیوتری را انجام داده و یا نرم افزارها را کنترل نمایند. به عنوان مثال، کاربر می تواند با گفتن “به اینترنت وصل شو” یا “اینترنت” مرورگر اینترنت را باز نماید و به اینترنت وصل شود. یا با گفتن “اندازه نوشته را بزرگ تر کن” یا “بزرگ تر” اندازه متن نوشته شده در ویرایشگر Wordرا بزرگ تر نماید. به صورت مشابهی، کاربر می تواند فرمان های صوتی مختلفی را در نرم افزارهای نصب شده در رایانه تعریف نموده و با بیان آنها، نرم افزارها را کنترل کند.
با استفاده از سامانة كارا کاركردن با رایانه و نرم افزارها و نرم افزارها برای كاربران(به ویژه برای كاربرانی كه با رایانه آشنایی ندارند و افراد دارای ناتوانی جسمی) راحت تر شده و دسترسی به بخش های مختلف نرم افزارها و منوهای آنها سریع تر می شود.

  • اتوماسیون خانگی و صنعتی با به كارگیری تشخیص گفتار

هدف این سیستم، ارایه راه حلی برای تشخیص گفتار از راه دور جهت کنترل وسایل و ابزارهای مورد استفاده می باشد. از کاربردهای این سیستم، استفاده در خودرو، منزل و یا كارخانه برای اجرای فرمان های متنوعی مانند روشن یا خاموش كردن یك دستگاه، كنترل كردن ربات ها و موارد مشابه می باشد. این سیستم می تواند از پشت خط تلفن نیز به منظور کنترل از راه دور در ساختمان های هوشمند مورد استفاده قرار گیرد.

  • استفاده در نرم افزارهای آموزشی و بازی ها

از فرمان های صوتی می توان برای افزایش قابلیت های جدید به نرم افزارهای مختلف مانند بازی ها و نرم افزارهای آموزشی استفاده نمود. گفتاری نمودن نرم افزارها، علاوه بر افزودن امکانات جدید به آنها، باعث جذاب تر شدن آنها نیز می گردد. به عنوان نمونه هایی از این کاربرد، می توان به نرم افزارهایی که در آنها نیاز به سؤال و جواب وجود دارد (مانند آموزش زبان انگلیسی و آموزش قرآن، نرم افزارهایی با سؤالات چهار جوابی و …) اشاره کرد.

تشخیص گفتار در كامپیوترهای كوچك (تلفن همراه، DSPو … )

استفاده از پردازشگرهای کوچک مانند تلفن های همراه، همراه های دیجیتال (PDA) و DSPها در بسیاری از کاربردها رو به افزایش است. توسعه نرم افزارها در این بسترها با توجه به محدودیت توان پردازشی و حافظه کار مشکل و پیچیده ای است. شرکت عصرگویش پرداز نسخه ای از سیستم تشخیص گفتار با كارایی بالا و سرعت پردازش بهینه توسعه داده است برروی پردازنده های با منابع محدود مانند DSPها (قابل استفاده در کاربردهای embeddedبه صورت بخشی از سایر سیستم ها) و تلفن های همراه قابل استفاده می باشد.برخی از كاربردهای این سیستم ها به صورت زیر است:

  • اجرای فرمان های صوتی برروی سخت افزارهای مختلف (غیر از رایانه ها)
  • اجرای برنامه های كاربردی برروی تلفن همراه با گفتار
  • شماره گیری و تایپ گفتاری SMSدر تلفن های همراه
  • مترجم صوتی گفتار به گفتار (به صورت همراه)

2681
1876

پردازش زبان طبیعی

یکی از پیش نیازهای سیستم های هوش مصنوعی مانند تشخیص گفتار، تبدیل متن به گفتار، ترجمه ماشینی، بازشناسی نویسه های نوری و تصحیح خطاهایی تایپی، مدل های زبانی و اطلاعات زبانی است. شرکت عصرگویش پرداز جهت استخراج و به کارگیری اطلاعات زبانی در سیستم های خود از آخرین روش های موجود در زمینه پردازش زبان های طبیعی استفاده کرده است که نتیجه آن استخراج حجم وسیعی از اطلاعات زبان فارسی برای نخستین بار بوده است. از جمله این اطلاعات که در سیستم های تشخیص گفتار این شرکت مورد استفاده قرار گرفته است، مدل های زبانی آماری فارسی، مدل گرامری فارسی و مجموعه واژگان های محاسباتی مختلف برای زبان فارسی می باشد. این اطلاعات می تواند به صورت های مختلفی در نرم افزارهای کاربردی و فعالیت های پژوهشی مورد استفاده قرار گیرد.

امتیازدهی به صحت تلفظ کلمات و عبارات با کاربرد در نرم افزارهای آموزشی

بررسی میزان صحت تلفط کلمات و عبارات در نرم افزارهای آموزشی (مانند آموزش قرآن و زبان انگلیسی) از جمله قابلیت های هوشمند و مفیدی است که علاوه بر کمک به آموزش بهتر، به جذابیت این نرم افزارها نیز می افزاید. این قابلیت به صورت یک ماژول و SDKدر نرم افزارهای مختلف قابل استفاده بوده و بر اساس تکنیک های بازشناسی الگو و مدل سازی آماری، شباهت میان کلمه/عبارت تلفظ شده توسط کاربر و کلمه/عبارت مرجع را به صورت امتیاز برمی گرداند. این ماژول می تواند به صورت مستقل از گوینده و مستقل از زبان یا وابسته به آنها عمل کند.
از جمله کاربردهای این سیستم که تاکنون مورد استفاده قرار گرفته است، امتیازدهی به تلفظ قرآن است که در نرم افزاری تحت عنوان “اولین نرم افزار قرآنی هوشمند صوتی در جهان اسلام” گنحانده شده است. این نرم افزار به نحوه تلفظ کاربر یک امتیاز می دهد تا به آموزش شیوه قرائت صحیح به کاربران کمک نماید.

1880
2683

بهبود کیفیت گفتار

نیاز به روشی برای قابل فهم کردن و بهبود کیفیت شنیداری صوت یا گفتار با حذف صداها و خش های اضافی از صداهای دیجیتالی شدة نوارهای قدیمی یا برای فایل های ضبط شده در یک سخنرانی و یا کنفرانس همیشه وجود دارد. شرکت عصرگویش پرداز با بهره گیری از آخرین روش های موجود در این زمینه مبادرت به تحقیق و توسعه محصولی برای انجام این کار نموده است که می تواند هم به صورت یك نرم افزار مستقل مورد استفاده قرار گیرد و هم به صورت یک واحد مجزا در نرم افزارهای دیگر به کار گرفته شود. به عنوان مثال استفاده از این واحد در سیستم های بازشناسی گفتار در محیط های نویزی مانند محیط نمایشگاه یا داخل ماشین کارایی و دقت این سیستم ها را بهبود می دهد. این محصول می تواند با توجه به نوع کاربرد، بهینه گردد.

« پروژه های عصر گویش پرداز »

پروژه بازشناسی گفتار پیوسته

بازشناسی گفتار پیوسته به معنی تشخیص گفتار انسان توسط كامپیوتر و تبدیل آن به متن است كه در آن گفتار ورودی به صورت دنباله ای پیوسته از كلمات و جملات ادا می شود. در حال حاضر شركت عصرگویش پرداز با استفاده از جدیدترین تكنیك های موجود، یك موتور بازشناسی گفتار پیوسته، مستقل از گوینده و با واژگان بزرگ را توسعه داده است كه با استفاده از آن نرم افزار دیكته گفتاری فارسی (نویسا) در نسخه های گوناگون تولید و عرضه شده است. با استفاده از این موتور امكان طراحی و توسعة نرم افزار دیكتة گفتاری برای زبان های دیگر (مانند انگلیسی، عربی، كردی و …) نیز فراهم است. تحقیقات بیشتر برای بهبود دقت و افزایش قابلیت های این موتور بازشناسی همچنان ادامه دارد.

پروژه بازشناسی گفتار تلفنی

به موازات پروژه بازشناسی گفتار پیوسته كه در آن گفتار معمولاً از طریق میكروفون به كامپیوتر داده می شود، پروژة بازشناسی گفتار تلفنی نیز در شركت عصرگویش پرداز انجام شده است. بازشناسی گفتار تلفنی در مقایسه با بازشناسی گفتار میكروفونی دارای پیچیدگی بیشتری است؛ زیرا گفتار تلفنی كیفیت پایین تری داشته و پهنای باند آن  محدود به 4 كیلوهرتز است. همچنین گفتار تلفنی معمولاً به صورت محاوره ای بوده و تنوع گویندگان و همچنین تنوع كانال های ارتباطی در آن بسیار بالا می باشد. این مسائل باعث می شود كه برای بازشناسی گفتار تلفنی از تكنیك های متفاوتی نسبت به بازشناسی میكروفونی استفاده گردد. بازشناسی گفتار تلفنی برای بازشناسی اعداد و فرمان های گفتاری در سیستم های تلفن گویای گفتاری و سیستم های IVRمبتنی بر گفتار استفاده می شود.

پروژه تبدیل متن به گفتار (TTS)

هدف از این پروژه خواندن متون الكترونیكی توسط رایانه است. این پروژه شامل دو بخش یا دو زیرپروژه است. بخش اول تبدیل متن به دنباله ای از واحدهای آوایی (مانند واج ها، هجاها و …) است و بخش دوم تبدیل دنبالة واحدهای آوایی به گفتار (سنتز گفتار) می باشد. بخش اول وابسته به زبان بوده و برای هر زبانی باید جداگانه انجام شود ولی بخش دوم می تواند مستقل از زبان انجام شود. شركت عصرگویش پرداز برای بخش اول یك موتور تبدیل متن به واحدهای آوایی (TTP) را برای زبان فارسی توسعه داده است. برای بخش دوم نیز یك موتور سنتز گفتار با كیفیت بالا با استفاده از روش های نوین سنتز، طراحی و توسعه داده شده است كه می تواند برای زبان های گوناگون مورد استفاده قرار گیرد. مهمترین مسئله در تبدیل متن به گفتار، كیفیت گفتار خروجی است كه سعی می شود هرچه بیشتر به لحن گفتار انسان نزدیك تر بوده و كمتر حالت ماشینی داشته باشد. تلاش ها برای افزایش كیفیت گفتار خروجی سیستم تبدیل متن به گفتار در شركت عصرگویش پرداز ادامه دارد.

پروژه شناسایی گوینده از روی صدا

صدای انسان از ویژگی های بیومتریك و منحصربه فرد هر شخص می باشد. هدف از شناسایی گوینده، استخراج اطلاعاتی از سیگنال گفتار است که در بردارنده هویت منحصر به فرد گوینده می باشد. شناسایی گوینده شامل دو حوزه تعیین هویت گوینده و تصدیق هویت گوینده است. در تعیین هویت گوینده، فرد از روی صحبت کردن شناسایی می شود و در تصدیق هویت، ادعای فرد مبنی بر اینکه چه کسی است، تایید یا رد می گردد. سامانه های شناسایی گوینده در کاربردهای مختلف امنیتی و کنترل دسترسی، به تنهایی یا در کنار دیگر روش های امنیتی مورد استفاده قرار مییرند. شركت عصرگویش پرداز یك سیستم شناسایی گوینده با دامنه باز را توسعه داده است كه قابل اجرا به صورت برخط و برون خط بوده و قادر است پردازش ها را برروی خطوط تلفن و ماهواره نیز انجام دهد.