0

Cart

فروشگاه

خانهمحصولدادگان FarsSpon

دادگان FarsSpon

جهت سفارش محصول با ما در ارتباط باشید

توضیحات

این دادگان به منظور تامین داده کافی در کاربردهای پردازش گفتار از قبیل بازشناسی گفتار و گوینده، تشخیص کلمات کلیدی و شبیه به آن آماده شده است. این دادگان در زمره بزرگترین دادگان‌های صوتی زبان فارسی در گفتار محاوره‌ای است. در ارائه ابزارهای هوشمند مبتنی بر گفتار و زبان امروزه نیاز به داده زیاد و مناسب است تا با ابزارهای یادگیری ژرف بتوان مدل‌های هوشمند گفتاری را آماده نمود. FarsSpon دادگان بزرگ و با تعداد گوینده زیاد است که با طراحی مناسب جمع‌آوری شده و پس از پالایش با ابزارهای خودکار و نیز به صورت دستی توسط متخصصان برای آموزش و تنظیم پارامترها و ارزیابی سامانه‌های تحقیقاتی و کاربردی قابل استفاده است.

 

حجم کل دادگان به صورت کامل به شرح جدول زیر است:

  تعداد گوینده‌ها تعداد فایل گفتاری زمان (ساعت)
مجموعه آموزش 5215 600673 520
مجموع توسعه 63 6044 5
مجموعه آزمون 66 6002 5

 

این دادگان طی 4 مرحله پالایش دقیق‌تر شده است و بنا به نوع نیاز کاربران نسخه‌های پالایش شده انتخابی قابل انتخاب است.

 ویژگی‌های خلاصه دادگان:

  • بیش از 530 ساعت داده صوتی
  • بزرگترین دادگان صوتی زبان فارسی
  • بیش از 5300 گوینده
  • بیش از 11 هزار جمله غیررسمی و محاوره‌ای انتخابی از زبان فارسی
  • پالایش چند مرحله‌ای صداهای ضبط شده و اصلاح دقیق گفته‌های مجموعه‌های توسعه و آزمون
  • حدود 10 هزار جمله مجموعه آموزش، 500 جمله مجموعه توسعه و 500 جمله مجموعه آزمون
  • استخراج واژگان کل جملات و واج‌نویسی دستی آن و دارای تنوع تلفظی تمام واژگان
  • استقلال کامل گویندگان مجموعه‌های آموزش، توسعه و آزمون
  • استقلال کامل جملات مجموعه‌های آموزش، توسعه و آزمون
  • ضبط صدا از طریق شبکه تلگرام با فرمت ogg و تبدیل آنها به فرمت wav
  • تنوع در سطح سواد و جنسیت گویندگان
  • تنوع در لهجه گویندگان
  • تنوع در شرایط بیان جملات توسط گویندگان
  • استفاده از شبکه‌های اجتماعی برای تهیه داده‌ها

 

دانلود نمونه FarsSpon

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “دادگان FarsSpon”