این دادگان به منظور تامین داده کافی در کاربردهای پردازش گفتار از قبیل بازشناسی گفتار و گوینده، تشخیص کلمات کلیدی و شبیه به آن آماده شده است. این دادگان در زمره بزرگترین دادگانهای صوتی زبان فارسی در گفتار محاورهای است. در ارائه ابزارهای هوشمند مبتنی بر گفتار و زبان امروزه نیاز به داده زیاد و مناسب است تا با ابزارهای یادگیری ژرف بتوان مدلهای هوشمند گفتاری را آماده نمود. FarsSpon دادگان بزرگ و با تعداد گوینده زیاد است که با طراحی مناسب جمعآوری شده و پس از پالایش با ابزارهای خودکار و نیز به صورت دستی توسط متخصصان برای آموزش و تنظیم پارامترها و ارزیابی سامانههای تحقیقاتی و کاربردی قابل استفاده است.
حجم کل دادگان به صورت کامل به شرح جدول زیر است:
تعداد گویندهها | تعداد فایل گفتاری | زمان (ساعت) | |
مجموعه آموزش | 5215 | 600673 | 520 |
مجموع توسعه | 63 | 6044 | 5 |
مجموعه آزمون | 66 | 6002 | 5 |
این دادگان طی 4 مرحله پالایش دقیقتر شده است و بنا به نوع نیاز کاربران نسخههای پالایش شده انتخابی قابل انتخاب است.
ویژگیهای خلاصه دادگان:
- بیش از 530 ساعت داده صوتی
- بزرگترین دادگان صوتی زبان فارسی
- بیش از 5300 گوینده
- بیش از 11 هزار جمله غیررسمی و محاورهای انتخابی از زبان فارسی
- پالایش چند مرحلهای صداهای ضبط شده و اصلاح دقیق گفتههای مجموعههای توسعه و آزمون
- حدود 10 هزار جمله مجموعه آموزش، 500 جمله مجموعه توسعه و 500 جمله مجموعه آزمون
- استخراج واژگان کل جملات و واجنویسی دستی آن و دارای تنوع تلفظی تمام واژگان
- استقلال کامل گویندگان مجموعههای آموزش، توسعه و آزمون
- استقلال کامل جملات مجموعههای آموزش، توسعه و آزمون
- ضبط صدا از طریق شبکه تلگرام با فرمت ogg و تبدیل آنها به فرمت wav
- تنوع در سطح سواد و جنسیت گویندگان
- تنوع در لهجه گویندگان
- تنوع در شرایط بیان جملات توسط گویندگان
- استفاده از شبکههای اجتماعی برای تهیه دادهها
نقد و بررسیها
هیچ دیدگاهی برای این محصول نوشته نشده است.