نویسا
آریانا
تست رایگان
021-61931000 Skype ID: agp.support English
0

Cart

« پروژه های عصر گویش پرداز »

پروژه بازشناسی گفتار پیوسته

بازشناسی گفتار پیوسته به معنی تشخیص گفتار انسان توسط كامپیوتر و تبدیل آن به متن است كه در آن گفتار ورودی به صورت دنباله ای پیوسته از كلمات و جملات ادا می شود. در حال حاضر شركت عصرگویش پرداز با استفاده از جدیدترین تكنیك های موجود، یك موتور بازشناسی گفتار پیوسته، مستقل از گوینده و با واژگان بزرگ را توسعه داده است كه با استفاده از آن نرم افزار دیكته گفتاری فارسی (نویسا) در نسخه های گوناگون تولید و عرضه شده است. با استفاده از این موتور امكان طراحی و توسعة نرم افزار دیكتة گفتاری برای زبان های دیگر (مانند انگلیسی، عربی، كردی و …) نیز فراهم است. تحقیقات بیشتر برای بهبود دقت و افزایش قابلیت های این موتور بازشناسی همچنان ادامه دارد.

پروژه بازشناسی گفتار تلفنی

به موازات پروژه بازشناسی گفتار پیوسته كه در آن گفتار معمولاً از طریق میكروفون به كامپیوتر داده می شود، پروژة بازشناسی گفتار تلفنی نیز در شركت عصرگویش پرداز انجام شده است. بازشناسی گفتار تلفنی در مقایسه با بازشناسی گفتار میكروفونی دارای پیچیدگی بیشتری است؛ زیرا گفتار تلفنی كیفیت پایین تری داشته و پهنای باند آن  محدود به 4 كیلوهرتز است. همچنین گفتار تلفنی معمولاً به صورت محاوره ای بوده و تنوع گویندگان و همچنین تنوع كانال های ارتباطی در آن بسیار بالا می باشد. این مسائل باعث می شود كه برای بازشناسی گفتار تلفنی از تكنیك های متفاوتی نسبت به بازشناسی میكروفونی استفاده گردد. بازشناسی گفتار تلفنی برای بازشناسی اعداد و فرمان های گفتاری در سیستم های تلفن گویای گفتاری و سیستم های IVRمبتنی بر گفتار استفاده می شود.

پروژه تبدیل متن به گفتار (TTS)

هدف از این پروژه خواندن متون الكترونیكی توسط رایانه است. این پروژه شامل دو بخش یا دو زیرپروژه است. بخش اول تبدیل متن به دنباله ای از واحدهای آوایی (مانند واج ها، هجاها و …) است و بخش دوم تبدیل دنبالة واحدهای آوایی به گفتار (سنتز گفتار) می باشد. بخش اول وابسته به زبان بوده و برای هر زبانی باید جداگانه انجام شود ولی بخش دوم می تواند مستقل از زبان انجام شود. شركت عصرگویش پرداز برای بخش اول یك موتور تبدیل متن به واحدهای آوایی (TTP) را برای زبان فارسی توسعه داده است. برای بخش دوم نیز یك موتور سنتز گفتار با كیفیت بالا با استفاده از روش های نوین سنتز، طراحی و توسعه داده شده است كه می تواند برای زبان های گوناگون مورد استفاده قرار گیرد. مهمترین مسئله در تبدیل متن به گفتار، كیفیت گفتار خروجی است كه سعی می شود هرچه بیشتر به لحن گفتار انسان نزدیك تر بوده و كمتر حالت ماشینی داشته باشد. تلاش ها برای افزایش كیفیت گفتار خروجی سیستم تبدیل متن به گفتار در شركت عصرگویش پرداز ادامه دارد.

پروژه شناسایی گوینده از روی صدا

صدای انسان از ویژگی های بیومتریك و منحصربه فرد هر شخص می باشد. هدف از شناسایی گوینده، استخراج اطلاعاتی از سیگنال گفتار است که در بردارنده هویت منحصر به فرد گوینده می باشد. شناسایی گوینده شامل دو حوزه تعیین هویت گوینده و تصدیق هویت گوینده است. در تعیین هویت گوینده، فرد از روی صحبت کردن شناسایی می شود و در تصدیق هویت، ادعای فرد مبنی بر اینکه چه کسی است، تایید یا رد می گردد. سامانه های شناسایی گوینده در کاربردهای مختلف امنیتی و کنترل دسترسی، به تنهایی یا در کنار دیگر روش های امنیتی مورد استفاده قرار مییرند. شركت عصرگویش پرداز یك سیستم شناسایی گوینده با دامنه باز را توسعه داده است كه قابل اجرا به صورت برخط و برون خط بوده و قادر است پردازش ها را برروی خطوط تلفن و ماهواره نیز انجام دهد.