انتشار کردن مدل زبانی متن باز «توکا» توسط متخصصان مرکز تحقیقات هوش مصنوعی پارت_مستطیل زرد

نوشته و ویرایش شده توسط مجله ی مستطیل زرد
برای نخستین بار در سرزمین، شرکت دانشبنیان پارت، مدل زبانی BERT large فارسی را با گفتن «توکا» به طور متنباز اراعه کرده است، تا علاقهمندان به گسترش ابزارهای هوشمند بتوانند بهصورت رایگان به آن دسترسی داشته باشند. این مجموعه، علاوه بر نسخه largeاین مدل زبانی، نسخه پایه آن را نیز به طور متنباز در اختیار علاقهمندان قرار داده تا مسیر پیشرفت همه فعالان این حوزه هموار بشود.
دقت و کیفیت مدل «توکا» که با حجم داده ۵۰۰ گیگابایت معادل ۹۰ میلیارد توکن گسترش داده شده، تا حدی است که آن را به گزینهای کارآمد برای پیادهسازی سرویسهای فارسیزبان تبدیل کرده است. این چنین، قابلیت اجرا و آموزش این مدل بر روی سختافزارهای نهچندان قوی، این مدل را به انتخابی مناسب برای پژوهشگران، گسترشدهندگان، برنامهنویسان و استارتاپهای حوزه هوش مصنوعی مبدل کرده است.
انتشار کردن نسخه متنباز این مدل زبانی، فرصتی تشکیل مینماید تا شرکتها و گسترشدهندگان حوزه هوش مصنوعی با منفعت گیری از مدل پایه «توکا»، به راحتی به آموزش و گسترش مدلهای زبانی بزرگ بپردازند و از نظر دیگر، با اتکا بر آن، محصولات سفارشیسازیشده، هوشمند و کاملا منطبق با نیازها و خواستههای مخاطبان خود را طراحی و اراعه نمایند.
مدل زبانی فارسی «توکا»، پیشتر در تعداد بسیاری از محصولات هوشمند و خدمات تعاملی شرکت پارت، از جمله سرویسهای هوشمند ابری سهاب، سرویس تبدیل صوت به متن «آوانگار»، سرویس تبدیل متن به صوت «آواشو»، چتبات هوشمند «دانابات» و سرویس تبدیل عکس به متن «نویسهنگار» به کار گرفته شده و کارکرد مساعد از خود به نمایش گذاشته، تا جایی که عرصه منفعت گیری از ابزارهای هوشمند و تعامل آسانتر و رضایتقسمتتر با محصولات هوشمند را برای میلیونها کاربر فارسیزبان در ایران فراهم آورده است.
دسته بندی مطالب