درنای فارسی با 13 میلیارد پارامتر رو به پیشرفت است
در سالهای اخیر، پیشرفت سریع فناوریهای هوش مصنوعی، منجر به آغاز رقابتی شدید میان شرکتها و کشورهای مختلف در توسعه مدلهای زبانی پیشرفته برای زبانهای متنوع شده است. این رقابت پس از رونمایی از نسخههای متعدد مدلهای زبانی شرکت Open AI، به اوج خود رسیده است.
ChatGPT با نمایش تواناییهای خارقالعاده هوش مصنوعی در زمینه پردازش زبان طبیعی، انگیزهای مضاعف برای حفظ زبان فارسی با تولید مدلهای زبانی بومی ایجاد کرده است. در همین راستا، مرکز تحقیقات هوش مصنوعی پارت موفق شده است با معرفی مدل زبانی بزرگ فارسی خود وارد این رقابت فزاینده و جهانی شود. درنا، گروه مدلهای زبانی با ظرفیتهای گوناگون 3، 7 و 13 میلیارد پارامتری است که توسط این مجموعه توسعه داده شده و قرار است در آیندهای نزدیک از مدل پیشرفتهتر 34 میلیارد پارامتری نیز رونمایی شود.
با توجه به اینکه در توسعه اکثر مدلهای زبانی موجود غالبا از دادههای انگلیسی و زبانهای فراگیر دیگر مانند آلمانی، اسپانیایی و فرانسوی استفاده شده و سهم زبان فارسی در توسعه مدلهای زبانی جهانی تنها به چندهزارم درصد خلاصه میشود، اقدام پارت میتواند گامی مهم برای زنده نگه داشتن این زبان در دنیای تکنولوژی باشد.
ایران به عنوان کشوری که بیشترین تعداد کاربران فارسی را دارد، میتواند از طریق توسعه مدلهای زبانی بزرگ فارسی، زمینهساز ساخت ابزارهای هوشمند داخلی نیز باشد زیرا که مدلهای زبانی کاربردهای گستردهای در زمینههای مختلف دارند. از جمله این کاربردها میتوان به چت باتها و اپلیکیشنهای گفتوگومحور، خلاصهسازی متون، ترجمه ماشینی و تولید محتوای متنی اشاره کرد. لذا پیشبینی میشود بهرهبرداری از این مدلهای بومیشده، باعث ارتقای کیفیت محصولات داخلی مبتنی بر هوش مصنوعی شده و مقدمهای برای پیدایش سرویسهای نوآورانهای در حوزههای مختلف باشد.
با این حال، راه رسیدن به یک مدل زبانی بزرگ فارسی در کلاس جهانی، چندان هموار نیست. ابتدا باید از مرحله پایهریزی گذر کرد تا با بهرهگیری از ظرفیتهای موجود، زیرساختهای لازم فراهم شود. پس از آن، نیاز است منابع لازم برای گسترش مدلها تخصیص یابد. در این مسیر، حمایت دولت و سیاستگذاری صحیح، نقشی حیاتی خواهد داشت.
البته نباید از نظر دور داشت که کیفیت مدلهای زبانی، به میزان دادههای آموزشی نیز بستگی دارد. دسترسی به مجموعه دادههای با کیفیت، متنوع و کافی به زبان فارسی، یک پیشنیاز اساسی برای توسعه این مدلها محسوب میشود. بنابراین همکاری بخش خصوصی و دانشگاهی در تولید و اشتراکگذاری داده، اهمیت ویژهای دارد.
در مجموع، زنده نگه داشتن زبان فارسی در دنیای تکنولوژی مستلزم عزم ملی و همدلی بین بازیگران اکوسیستم هوش مصنوعی است تا با همافزایی، چشماندازی روشن برای آینده رقم بخورد.
مرکز تحقیقات هوش مصنوعی پارت با بهرهگیری از تجربه چندساله خود در توسعه و ارائه راهکارهای هوشمند و عرضه بیش از 100 سرویس هوشمند به کاربران و کسبوکارهای مختلف، اکنون قصد دارد با بهکارگیری مدلهای زبانی جدید، گامی تعیینکننده در جهت تحول در حوزه چتباتها و محصولات مبتنی بر هوش مصنوعی فارسی بردارد. انتظار میرود افزایش تدریجی ظرفیت این مدلها، موجب ظهور محصولات نوآورانه و برتر فارسیزبانان در سطح بینالملل شود. لذا در این مسیر، حمایت مستمر و هدفمند از گسترش مدلهای بومی بیش از پیش اهمیت پیدا میکند.