معرفی روش جدید سازنده چت جی‌پی‌تی برای جلوگیری از سوگیری

خبرگزاری فارس 1402/05/26 - 08:43 مشاهده در مرجع

به گزارش گروه علم و پیشرفت خبرگزاری فارس به نقل از تک‌کرانچ، شرکت اپن‌ای‌آی ادعا می‌کند که راهی برای استفاده از جی‌پی‌تی‌-4، (مدل هوش مصنوعی مولد پرچم‌دار خود) جهت تعدیل محتوا ایجاد کرده که بار نظارت تیم‌های انسانی را کاهش می‌دهد.

این تکنیک که طی پستی در وبلاگ رسمی اپن‌ای‌آی منتشر شده است، متکی به تحریک جی‌پی‌تی‌-4 با خط مشی مورد نظر است. این روش مدل را در قضاوت‌های اعتدالی و ایجاد مجموعه آزمایشی از نمونه‌های محتوا که ممکن است خط‌مشی را نقض کند یا نکند قرار می‌دهد.

سپس کارشناسان نمونه‌ها را برچسب‌گذاری می کنند و برای آزمایش مدل، نمونه بدون برچسب را به جی‌پی‌تی‌-4 می دهند نتیجه این بود که برچسب‌های مدل با آن هایی که کارشناسان برچسب زده بودند مطابقت داشت و از آنجا خط‌مشی اصلاح می‌شود.

کارشناسان می‌توانند با بررسی تفاوت‌های بین قضاوت‌های جی‌پی‌تی‌-4 و قضاوت‌های یک انسان، از جی‌پی‌تی‌-4 بخواهند تا دلایل مدنظر خود در مورد برچسب گذاری ارائه کرده، ابهام در تعاریف خط مشی را تجزیه و تحلیل کند و بر این اساس در خط‌مشی توضیحات بیشتری ارائه کند.

اپن‌ای‌آی ادعا می‌کند که فرآیند آن می‌تواند زمان لازم برای اجرای سیاست‌های تعدیل محتوای جدید را به ساعت‌ها کاهش دهد و آن را برتر از رویکردهای ارائه شده توسط استارتاپ‌هایی مانند آنتروپیک نشان می‌دهد.

ابزارهای تعدیل مبتنی بر هوش مصنوعی چیز جدیدی نیستند. پِرسپِکتیو توسط تیم فناوری مقابله با سوء استفاده گوگل، چندین سال پیش در دسترس عموم قرار گرفت.

چندین سال پیش، تیمی در ایالت پنسیلوانیا آمریکا دریافتند که پست‌هایی در رسانه‌های اجتماعی در مورد افراد دارای معلولیت می‌توانند با استفاده از مدل‌های تشخیص به‌عنوان منفی‌تر یا آلوده‌تر علامت‌گذاری شوند. در مطالعه دیگری، محققان نشان دادند که نسخه‌های قدیمی پرسپکتیو اغلب نمی‌توانند سخنان تنفرآمیزی را که از تغییرات املایی استفاده می‌کند، تشخیص دهند.

بخشی از دلیل این شکست ها این است که حاشیه نویس ها (افرادی که مسئول اضافه کردن برچسب ها به مجموعه داده های آموزشی هستند) سوگیری های خود را به جدول می آورند. به عنوان مثال، اغلب، تفاوت‌هایی در حاشیه‌نویسی‌ها بین برچسب‌زنانی که خود را آمریکایی‌های آفریقایی‌تبار معرفی می‌کنند و دیگران وجود دارد.

مدل‌های هوش مصنوعی مولد مانند دال - ای2، سوگیری‌های اجتماعی را تقویت می‌کنند و تصاویری از موقعیت‌های اقتدار ایجاد می‌کنند مانند تصاویری از مردان سفید پوست در نقش مدیرعاملی. اما اپن‌ای‌آی هم به طور کامل این مشکل را حل نکرده و خود شرکت نیز این موضوع را تایید می کند.

این شرکت می‌نویسد: «مدل‌های زبانی در برابر سوگیری‌های ناخواسته‌ای آسیب‌پذیر هستند که ممکن است در طول آموزش به مدل وارد شده باشند. مانند هر برنامه کاربردی هوش مصنوعی، نتایج و خروجی ها باید به دقت نظارت و اعتبار سنجی شوند و انسان ها در این حلقه آن را اصلاح کنند.»

شاید قدرت پیش‌بینی جی‌پی‌تی‌-4 بتواند به ارائه عملکرد اعتدال بهتر نسبت به پلتفرم‌های قبلی کمک کند. اما حتی بهترین هوش مصنوعی امروزی هم اشتباه می کند.

هوش مصنوعی این پتانسیل را دارد که به طرق مختلف برای جامعه مفید باشد. از استفاده از تجزیه و تحلیل پیش‌بینی‌کننده برای کاهش خطر بلایا تا استفاده از نرم‌افزار ترجمه برای از بین بردن موانع زبان. این فناوری خواه ناخواه بر زندگی روزمره ما تأثیر گذاشته است. با این حال، پیامدهای منفی نیز وجود دارد، به ویژه اگر اقدامات پیشگیرانه برای اطمینان از توسعه و استفاده مسئولانه و اخلاقی آن انجام نشود. در این میان رئیس جمهور آمریکا نیز اذعان کرده خطرات ناشی از هوش مصنوعی برای امنیت و اقتصاد نیاز به رسیدگی دارد.

پایان پیام /

شما می توانید این مطلب را ویرایش نمایید

این مطلب را برای صفحه اول پیشنهاد کنید چت جی پی تی سوگیری هوش مصنوعی مدل جی پی تی -4 این خبر توسط افراد زیر ویرایش شده است