zoomit

تبدیل گفتار به متن فارسی با آوانگار

تبدیل گفتار به متن فارسی با آوانگار

هوش مصنوعی «آوانگار» یکی از سرویس‌های نوآورانه‌ی مجموعه‌ی «ویرا» است؛ سامانه‌ای ایرانی که با هدف گسترش دسترسی فارسی‌زبانان به ابزارهای هوش مصنوعی طراحی شده است.

اگر گزارش اخیر پلتفرم «کافه‌بازار» درباره‌ی اپلیکیشن‌های پرمخاطب هوش مصنوعی را مطالعه کرده باشید، احتمالاً نام «ویرا» را در صدر فهرست مشاهده کرده‌اید. طبق این گزارش، «ویرا» پُر‌دانلودترین اپلیکیشن هوش مصنوعی فارسی در این پلتفرم بوده است؛ حتی بالاتر از اپلیکیشن‌های شناخته‌شده‌ای مانند ChatGPT.

فارغ از ابعاد رقابتی این آمار، می‌توان گفت «ویرا» با ارائه‌ی تجربه‌ای بومی و دقیق، توانسته است جایگاه ویژه‌ای میان کاربران ایرانی پیدا کند. یکی از سرویس‌های شاخص این مجموعه، «آوانگار» است؛ سامانه‌ای که به کمک الگوریتم‌های یادگیری عمیق، گفتار و صوت را با دقت بالا به متن فارسی تبدیل می‌کند. به بیان ساده، آوانگار همان دستیاری است که هر آنچه می‌شنود، برای شما می‌نویسد.

جایگاه آوانگار در اکوسیستم ویرا

آوانگار تنها یکی از چندین سرویس کاربردی در اپلیکیشن «ویرا» است. ویرا مجموعه‌ای از ابزارهای هوش مصنوعی را در خود جای داده تا کاربران فارسی‌زبان، بدون نیاز به دانش فنی یا آشنایی تخصصی با فناوری، بتوانند از مزایای آن بهره‌مند شوند.

 سازندگان ویرا بر این باورند که هر کاربر فارسی‌زبان ــ صرف‌نظر از سن، تحصیلات یا آشنایی با فناوری اطلاعات ــ باید بتواند به‌سادگی از خدمات هوش مصنوعی استفاده کند.

در میان سرویس‌های مشابه موجود در بازار، آوانگار یکی از برجسته‌ترین ابزارهای تبدیل صدا به متن فارسی محسوب می‌شود. این سرویس هم در قالب اپلیکیشن ویرا در دسترس است و هم از طریق «API» در بازارچه‌ی هوش مصنوعی ویرا، برای توسعه‌دهندگان ارائه شده است.

 به‌نظر می‌رسد عملکرد آوانگار، به‌ویژه در شناسایی الگوهای زبانی فارسی، در مواردی حتی از سرویس‌های بین‌المللی نیز بهتر است. دلیل این برتری را باید در تسلط آن بر ساختار و لهجه‌های گوناگون فارسی جست‌وجو کرد؛ عاملی که سرویس‌های خارجی به‌طور طبیعی از آن بی‌بهره‌اند، زیرا چنین ظرایفی تنها با دانش بومی و تخصص زبانی در فارسی قابل‌دستیابی است.

بررسی فرایند تبدیل گفتار به متن در آوانگار

حال پرسش اصلی این است که آوانگار چگونه صدا را به متن تبدیل می‌کند؟

 در ادامه، روند استفاده از سرویس تبدیل گفتار به متن فارسی آوانگار را مرحله‌به‌مرحله مرور می‌کنیم. برای سنجش توانایی این سرویس، آزمایشی دشوار طراحی کردیم: به‌جای یک فایل گفتار عادی، قطعه‌ای موسیقی باکلام از رضا یزدانی با نام آوانگارد را به آوانگار سپردیم. ترکیب موسیقی، ساز و آواز معمولاً چالشی جدی برای سامانه‌های تبدیل گفتار به متن محسوب می‌شود، زیرا نویز موسیقایی دقت مدل را کاهش می‌دهد.

با وجود این دشواری، آوانگار توانست خروجی نسبتاً قابل‌قبولی تولید کند؛ نتیجه‌ای که از دقت و توان پردازش زبانی آن حکایت دارد.

مراحل کار با آوانگار

۱. برای دسترسی سریع، اپلیکیشن «ویرا» را از وب‌سایت رسمی آن (ivira.ai) یا از طریق فروشگاه‌های معتبر نظیر کافه‌بازار و مایکت نصب کردیم.

 توجه: استفاده از اپلیکیشن ویرا نیازمند اتصال اینترنت است.

۲. در صفحه‌ی نخست اپلیکیشن، کاشی‌هایی مشاهده می‌شود که هر یک نمایانگر یکی از سرویس‌های ویرا هستند. با انتخاب کاشی مربوط به «آوانگار» (یا بنر تبلیغاتی آن)، وارد محیط سرویس می‌شوید.

۳. در این بخش، دو گزینه برای استفاده وجود دارد:

  • «ضبط مستقیم صدا»
  • «بارگذاری فایل صوتی» برای ضبط مستقیم، کافی است آیکون آبی پایین صفحه (سمت راست) را انتخاب کنید. برای بارگذاری فایل نیز می‌توانید روی آیکون ابر کوچک در بالای صفحه (سمت چپ) کلیک کنید.

منبع : زومیت

مشاهده بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا