انتشار مدل زبانی متن باز «توکا» توسط متخصصان مرکز تحقیقات هوش مصنوعی پارت
انتشار مدل زبانی متن باز «توکا» توسط متخصصان مرکز تحقیقات هوش مصنوعی پارت
برای نخستین بار در کشور، شرکت دانشبنیان پارت، مدل زبانی BERT large فارسی را با عنوان «توکا» به صورت متنباز ارائه کرده است، تا علاقهمندان به توسعه ابزارهای هوشمند بتوانند بهصورت رایگان به آن دسترسی داشته باشند. این مجموعه، علاوه بر نسخه largeاین مدل زبانی، نسخه پایه آن را نیز به صورت متنباز در اختیار علاقهمندان قرار داده تا مسیر پیشرفت همه فعالان این حوزه هموار شود.
دقت و کیفیت مدل «توکا» که با حجم داده 500 گیگابایت معادل 90 میلیارد توکن توسعه داده شده، تا حدی است که آن را به گزینهای کارآمد برای پیادهسازی سرویسهای فارسیزبان تبدیل کرده است. همچنین، قابلیت اجرا و آموزش این مدل بر روی سختافزارهای نهچندان قدرتمند، این مدل را به انتخابی مناسب برای پژوهشگران، توسعهدهندگان، برنامهنویسان و استارتاپهای حوزه هوش مصنوعی مبدل کرده است.
انتشار نسخه متنباز این مدل زبانی، فرصتی ایجاد مینماید تا شرکتها و توسعهدهندگان حوزه هوش مصنوعی با استفاده از مدل پایه «توکا»، به راحتی به آموزش و توسعه مدلهای زبانی بزرگ بپردازند و از سوی دیگر، با اتکا بر آن، محصولات سفارشیسازیشده، هوشمند و کاملا منطبق با نیازها و خواستههای مخاطبان خود را طراحی و ارائه نمایند.
مدل زبانی فارسی «توکا»، پیشتر در بسیاری از محصولات هوشمند و خدمات تعاملی شرکت پارت، از جمله سرویسهای هوشمند ابری سهاب، سرویس تبدیل صوت به متن «آوانگار»، سرویس تبدیل متن به صوت «آواشو»، چتبات هوشمند «دانابات» و سرویس تبدیل تصویر به متن «نویسهنگار» به کار گرفته شده و عملکرد خوبی از خود به نمایش گذاشته، تا جایی که زمینه استفاده از ابزارهای هوشمند و تعامل آسانتر و رضایتبخشتر با محصولات هوشمند را برای میلیونها کاربر فارسیزبان در ایران فراهم آورده است.
منبع : زومیت