جشنواره عیدانه هوش مصنوعی
عصر گویش پرداز
  • خانه
  • درباره ما
    • معرفی شرکت
    • توانمندی‌ها و خدمات
    • افتخارات و تأییدیه‌ها
    • مشتریان
    • فرصت‌های شغلی
    • نمایندگی فروش
    • مقالات و انتشارات
  • پروژه‌های هوش مصنوعی
    • نویسالایو: گفتار به نوشتار محاوره‌ای
    • نویسا: گفتار به نوشتار رسمی
    • آریانا: متن به گفتار
    • نیوشا: تلفن گویای هوشمند
    • رومند :ربات هوشمند صوتی
    • شناسا: تشخیص هویت با صدا
    • رمزآوا: سیستم تصدیق هویت صوتی
    • جویا: جستجو در صوت
    • بینا: نویسه‌خوان هوشمند
    • پارسیا: مترجم گفتار به گفتار
    • دادگان هوش مصنوعی
    • دستیارهای صوتی هوشمند
    • تبدیل صدا (Voice Conversion)
    • شیوا: سامانه بهبود گفتار
  • فروشگاه
    • نرم‌افزارها
    • دادگان
    • بسته‌های اعتباری
    • میکروفون و تجهیزات
    • تجهیزات الکترونیکی
    • تجهیزات تلفنی ویپ
  • مقالات علمی
  • وبلاگ
    • رویدادها
  • تماس با ما
  • EN
021-61931000
ورود/ثبت نام
0 آیتم / 0 تومان
فهرست
عصر گویش پرداز
0 آیتم / 0 تومان
ورود/ثبت نام
ورودافزودن حساب کاربری

رمز عبور خود را فراموش کرده اید؟
بزرگنمایی
خانه فروشگاه دادگان پیکره متنی ناب
آریانا سرویس 15,000,000 تومان
بازگشت به محصولات
نویسالایو 25,000,000 تومان–160,000,000 تومان

پیکره متنی ناب

جهت دسترسی و استفاده از پیکره متنی ناب روی دکمه زیر کلیک کنید:

پیکره متنی ناب

افزودن به علاقه‌مندی
دسته: دادگان
اشتراک گذاری:
  • توضیحات
  • نظرات (0)
  • حمل و نقل
توضیحات

این پیکره شامل حدود 130 گیگابایت متن تمیز شده کاملا فارسی که متشکل از 250 میلیون پاراگراف و 15 میلیارد کلمه است. پیکره متنی ناب به صورت کاملا متن باز در اختیار همگان قرار داده شده است و محققان حوزه پردازش طبیعی می‌توانند به راحتی از آن بهره جویند. از مزیت‌های پیکره ناب قرار گرفتن آن بر روی مخزن دیتاست Huggingface است، به‌این ترتیب می‌توانید تمام یا بخشی از این پیکره را به کمک کتابخانه dataset دانلود کرده و برای آموزش مدل خود استفاده کنید.پیکره ناب توسط تیمی از آزمایشگاه پردازش زبان طبیعی و گفتار دانشگاه صنعتی شریف (به سرپرستی دکتر حسین صامتی) به همراه محققان مرکز نوآوری شرکت عصرگویش‌پرداز جمع‌آوری شده است.

جزئیات ناب

  • پیکره PesianNLP: این پیکره شامل مجموعه‌ای از حدود ۷۰ گیگابایت متن خام را شامل می‌شود.
  • پیکره OSCAR-fa: شامل زبان‌های مختلفی از جمله فارسی است. که نسخه اصلی آن شامل ۳۸ گیگابایت دیتای فارسی است که در ناب از نسخه به هم نخورده با حذف جملات تکراری استفاده می‌کنیم که شامل متون رسمی و محاوره‌ای می‌باشد.
  • پیکره AGP: پیکره عصرگویش پرداز که حدود ۲۵ گیگابایت متون رسمی و غیر رسمی است. این پیکره ابتدا به‌صورت کاملا خصوصی مورد استفاده شرکت عصرگویش‌پرداز بود که از این پس به عنوان بخشی از پیکره ناب در دسترس عموم قرار گرفته است.
  • پیکره LSCP: دیتاست محاوره ای LSCP که شامل 5 گیگابایت دیتا محاوره‌ای است. این پیکره جزو معدود دادگان غیر‌ رسمی حجم بالای زبان فارسی است.
  • پیکره Telegram: حدود ۱ گیگابایت داده غیررسمی که توسط تیم تهیه‌کننده ناب از شبکه پیام‌رسانی تلگرام جمع‌آوری شده‌است که شامل متون محاوره‌ای و غیر‌رسمی می‌باشد.
نظرات (0)

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “پیکره متنی ناب” لغو پاسخ

برای ثبت نقد و بررسی وارد حساب کاربری خود شوید.

حمل و نقل

محصولات مشابه

پایگاه داده صوتی فارسی FarsSpon شماره 1
افزودن به سبد خرید
مشاهده سریع
افزودن به علاقه‌مندی

دادگان FarsSpon

دادگان
100,000,000 تومان
deepmine-spl
افزودن به سبد خرید
مشاهده سریع
افزودن به علاقه‌مندی

دادگان DeepMine-SPL

دادگان
150,000,000 تومان
عصر گویش پرداز

عصر گویش پرداز فعال‌ترین شرکت ایرانی در زمینه هوش مصنوعی و پردازش سیگنال است که از سال 1382 با پشتوانه فنی متخصصان دانشگاه صنعتی شریف، مشغول فعالیت بوده است. محصولات و خدمات ارائه شده توسط این شرکت به صورت تخصصی در زمینه‌های تبدیل گفتار به متن، متن به صدا، جستجو در صوت، پردازش تصویر و پردازش زبان طبیعی است.

آخرین مقالات

  • چگونه هوش مصنوعی دنیای نوشتار را دگرگون می‌کند؟
  • انتشار مدل چند زبانهJina-Embeddings-v3
  • انویدیا با همکاری شرکت اماراتی G42 مرکز اختصاصی پیش‌بینی آب‌و‌هوا راه‌اندازی می‌کند
  • تحولی بزرگ در پزشکی؛ ربات‌های میکروسکوپی با خونریزی‌های مغزی مقابله می‌کنند
  • کاربردهای چت بات‌های هوش مصنوعی در پزشکی

پشتیبانی

  • دانلودها
  • به‌روزرسانی محصولات
  • فعال‌سازی محصولات
  • تماس با ما

ارتباط با ما

02161931000
info@asr-gooyesh.com
تهران، خیابان آزادی، خیابان حبیب الهی، بلوار تیموری، نبش کوچه برومند، پلاک ۲، واحد ۱۰
logo-samandehi
کلیه حقوق این سایت نزد شرکت عصرگویش‌پرداز محفوظ است
  • فهرست
  • دسته بندی ها
  • بسته‌های اعتباری
  • تجهیزات الکترونیکی
  • دادگان
  • کارت صدا
  • میکروفون و تجهیزات
  • نرم‌افزارها
  • خانه
  • درباره ما
    • معرفی شرکت
    • توانمندی‌ها و خدمات
    • افتخارات و تأییدیه‌ها
    • مشتریان
    • فرصت‌های شغلی
    • نمایندگی فروش
    • مقالات و انتشارات
  • پروژه‌های هوش مصنوعی
    • نویسالایو: گفتار به نوشتار محاوره‌ای
    • نویسا: گفتار به نوشتار رسمی
    • آریانا: متن به گفتار
    • نیوشا: تلفن گویای هوشمند
    • رومند :ربات هوشمند صوتی
    • شناسا: تشخیص هویت با صدا
    • رمزآوا: سیستم تصدیق هویت صوتی
    • جویا: جستجو در صوت
    • بینا: نویسه‌خوان هوشمند
    • پارسیا: مترجم گفتار به گفتار
    • دادگان هوش مصنوعی
    • دستیارهای صوتی هوشمند
    • تبدیل صدا (Voice Conversion)
    • شیوا: سامانه بهبود گفتار
  • فروشگاه
    • نرم‌افزارها
    • دادگان
    • بسته‌های اعتباری
    • میکروفون و تجهیزات
    • تجهیزات الکترونیکی
    • تجهیزات تلفنی ویپ
  • مقالات علمی
  • وبلاگ
    • رویدادها
  • تماس با ما
  • EN
سبد خرید
بستن
Start typing to see products you are looking for.
فروشگاه
علاقه‌مندی
0 آیتم سبد خرید
حساب کاربری من

Notice: ob_end_flush(): failed to send buffer of zlib output compression (0) in /home/asrgoysh/public_html/fa/wp-includes/functions.php on line 5427