مرکز تحقیقات هوش مصنوعی پارت از تازهترین دستاورد خود در زمینه مدلهای بزرگ زبانی (LLMs) پرده برداشت و یکی از مدل های 8 میلیارد پارامتری خود که متعلق به گروه مدلهای زبانی درنا است را بهصورت متن باز در دسترس اکوسیستم هوش مصنوعی کشور قرار داد. این مدل با استفاده از کلان دادههای زبان فارسی آموزش دیده و به صورت رایگان و متنباز توسط عموم توسعهدهندگان و کسبوکارهای حوزه هوش مصنوعی قابل دریافت است.
بسیاری از LLMهای مطرح دنیا که بهصورت منبعباز ارائه شدهاند، بر پایه زبان انگلیسی، زبانهای برنامهنویسی و برخی از زبانهای پرکاربرد جهانی آموزش دیدهاند و بهترین عملکرد خود را در چنین زبانهایی به نمایش میگذارند. این در حالی است که بسیاری از زبانهای زنده و محبوب مانند فارسی توسط LLMها پشتیبانی نمیشوند و یا در صورت پشتیبانی، با ایرادات بسیاری همراه هستند. در چنین موقعیتی، اهمیت مدلهایی مانند درنا که با تمرکز حداکثری بر زبان فارسی توسعه پیدا کردهاند، بیشازپیش خودنمایی میکند.
طی ماههای اخیر، مرکز تحقیقات هوش مصنوعی پارت با معرفی گروه مدل بزرگ زبانی درنا و مدل زبانی توکا، در راستای هدف خود برای رشد و گسترش زیستبوم نوآوری و هوش مصنوعی فارسی گام برداشته است. حال در امتداد دستیابی به این هدف، پارت قصد دارد تا با عرضه یک مدل 8 میلیارد پارامتری از گروه مدلهای درنا بهصورت متنباز، روند ساخت محصولات مبتنی بر هوش مصنوعی فارسی مانند دستیارها، چتباتها و دیگر ابزارهای هوشمند را برای اکوسیستم هوش مصنوعی و کسبوکارها از همیشه سادهتر و کارآمدتر کند.
این مدل زبانی بزرگ 8 میلیارد پارامتری با استفاده از جدیدترین معماری و فناوری روز دنیا در زمینه مدلهای زبانی توسعه یافته که باعث میشود این مدل فارسی، حتی در مقایسه با برخی مدلهای بزرگتر از خود، کارکرد بهتری داشته باشد و عملکردی دقیقتر از تمامی مدلهای فارسی منتشرشده تا به امروز به ثبت برساند. بهعلاوه، این مدل درنا، در مأموریت خود که توسعه بهینهترین مدلهای زبانی مبتنی بر فارسی است، دستاورد چشمگیری داشته و موفق شده در شاخصهای زبان فارسی از بسیاری از مدلهای مطرح دنیا پیشی گیرد؛ تا جایی که نمره کلی بهتری در ارزیابی و مقایسه با مدلهایی همچون Meta Llama 3 کسب کرده و به طور چشمگیری در تعاملات زبان بومی و پس زمینههای فرهنگی ایرانی و فارسی، عملکرد بهتری نسبت به مشابه های خارجی دارد. جزئيات بیشتر در خصوص مقایسهها و ارزیابیهای این مدل درنا در صفحه مرکز تحقیقات هوش مصنوعی پارت در سایت هاگینگ فیس قابل مشاهده است.
خلاصهسازی متون، کدنویسی، تشخیص احساسات، پاسخ به سؤالات طولانی، پرسش و پاسخهای بله و خیر، پاسخ به سؤالات عمومی، تاریخی، ریاضی، اخبار و… تنها بخشی از توانمندیهای این مدل بزرگ زبانی است و رفتهرفته با افزایش کاربران و اعمال بازخوردهای دریافتی، عملکرد بخشهای مختلف این مدل نیز به طور مداوم بهبود پیدا میکند.
یکی از مهمترین ویژگیهای برنامههای متنباز، قابلیت شخصیسازی گسترده آنهاست و مدل 8 میلیاردی از گروه درنا هم از این قاعده مستثنا نیست. پارت این امکان را برای کسبوکارها، توسعهدهندگان و محققان فراهم کرده که این مدل متنباز درنا را بر پایه دادههای خود شخصیسازی یا به اصطلاح Fine-tune کنند و ویژگیهای گوناگونی را متناسب با کسبوکار و اهداف خود به مدل نهایی خود بیفزایند. علاوه بر این، پارت برای اولین بار در ایران، از این مدل زبانی بزرگ روی سرورهای هاگینگ فیس میزبانی میکند، تا کاربران بدون نیاز به زیرساخت یا سختافزار، به صورت رایگان این LLM ۸ میلیارد پارامتری را در این سایت تست و آزمایش کنند.
با توجه به اقدامات اخیر صورت گرفته توسط این مجموعه، پارت توسعه مدلهای زبانی را در کنار سایر اهداف خود ادامه میدهد و برنامه دارد طی ماههای آینده، در کنار این مدل 8 میلیاردی متنباز، از سایر مدلهای بزرگتر گروه درنا هم در محصولات تجاری خود استفاده کند.
شما میتوانید با مراجعه به لینک زیر، آخرین نسخه از این مدل زبانی را دریافت و آن را به صورت رایگان، تست و ارزیابی کنید:
{لینک دسترسی به مدل درنا}
منبع : زومیت