درنای فارسی با 13 میلیارد پارامتر رو به پیشرفت است

وب‌گاه دنیای اقتصاد 1402/12/08 - 12:52 مشاهده در مرجع

در سال‌های اخیر، پیشرفت سریع فناوری‌های هوش مصنوعی، منجر به آغاز رقابتی شدید میان شرکت‌ها و کشورهای مختلف در توسعه مدل‌های زبانی پیشرفته برای زبان‌های متنوع شده است. این رقابت پس از رونمایی از نسخه‌های متعدد مدل‌های زبانی شرکت Open AI، به اوج خود رسیده است.

ChatGPT با نمایش توانایی‌های خارق‌العاده هوش مصنوعی در زمینه پردازش زبان طبیعی، انگیزه‌ای مضاعف برای حفظ زبان فارسی با تولید مدل‌های زبانی بومی ایجاد کرده است. در همین راستا، مرکز تحقیقات هوش مصنوعی پارت موفق شده است با معرفی مدل زبانی بزرگ فارسی خود وارد این رقابت فزاینده و جهانی شود. درنا، گروه مدل‌های زبانی با ظرفیت‌های گوناگون 3، 7 و 13 میلیارد پارامتری است که توسط این مجموعه توسعه داده شده و قرار است در آینده‌ای نزدیک از مدل پیشرفته‌تر 34 میلیارد پارامتری نیز رونمایی شود.

با توجه به اینکه در توسعه اکثر مدل‌های زبانی موجود غالبا از داده‌های انگلیسی و زبان‌های فراگیر دیگر مانند آلمانی، اسپانیایی و فرانسوی استفاده شده و سهم زبان فارسی در توسعه مدل‌های زبانی جهانی تنها به چندهزارم درصد خلاصه می‌شود، اقدام پارت می‌تواند گامی مهم برای زنده نگه داشتن این زبان در دنیای تکنولوژی باشد.

ایران به عنوان کشوری که بیشترین تعداد کاربران فارسی را دارد، می‌تواند از طریق توسعه مدل‌های زبانی بزرگ فارسی، زمینه‌ساز ساخت ابزارهای هوشمند داخلی نیز باشد زیرا که مدل‌های زبانی کاربردهای گسترده‌ای در زمینه‌های مختلف دارند. از جمله این کاربردها می‌توان به چت بات‌ها و اپلیکیشن‌های گفت‌وگومحور، خلاصه‌سازی متون، ترجمه ماشینی و تولید محتوای متنی اشاره کرد. لذا پیش‌بینی می‌شود بهره‌برداری از این مدل‌های بومی‌شده، باعث ارتقای کیفیت محصولات داخلی مبتنی بر هوش مصنوعی شده و مقدمه‌ای برای پیدایش سرویس‌های نوآورانه‌ای در حوزه‌های مختلف باشد.

با این حال، راه رسیدن به یک مدل زبانی بزرگ فارسی در کلاس جهانی، چندان هموار نیست. ابتدا باید از مرحله پایه‌ریزی گذر کرد تا با بهره‌گیری از ظرفیت‌های موجود، زیرساخت‌های لازم فراهم شود. پس از آن، نیاز است منابع لازم برای گسترش مدل‌ها تخصیص یابد. در این مسیر، حمایت دولت و سیاست‌گذاری صحیح، نقشی حیاتی خواهد داشت.

البته نباید از نظر دور داشت که کیفیت مدل‌های زبانی، به میزان داده‌های آموزشی نیز بستگی دارد. دسترسی به مجموعه داده‌های با کیفیت، متنوع و کافی به زبان فارسی، یک پیش‌نیاز اساسی برای توسعه این مدل‌ها محسوب می‌شود. بنابراین همکاری بخش خصوصی و دانشگاهی در تولید و اشتراک‌گذاری داده، اهمیت ویژه‌ای دارد.

در مجموع، زنده نگه داشتن زبان فارسی در دنیای تکنولوژی مستلزم عزم ملی و همدلی بین بازیگران اکوسیستم هوش مصنوعی است تا با هم‌افزایی، چشم‌اندازی روشن برای آینده رقم بخورد.

مرکز تحقیقات هوش مصنوعی پارت با بهره‌گیری از تجربه چندساله خود در توسعه و ارائه راهکارهای هوشمند و عرضه بیش از 100 سرویس هوشمند به کاربران و کسب‌وکارهای مختلف، اکنون قصد دارد با به‌کارگیری مدل‌های زبانی جدید، گامی تعیین‌کننده در جهت تحول در حوزه چت‌بات‌ها و محصولات مبتنی بر هوش مصنوعی فارسی بردارد. انتظار می‌رود افزایش تدریجی ظرفیت این مدل‌ها، موجب ظهور محصولات نوآورانه و برتر فارسی‌زبانان در سطح بین‌الملل شود. لذا در این مسیر، حمایت مستمر و هدفمند از گسترش مدل‌های بومی بیش از پیش اهمیت پیدا می‌کند.

درنای فارسی با 13 میلیارد پارامتر رو به پیشرفت است 2

درنای فارسی با 13 میلیارد پارامتر رو به پیشرفت است 3