هوش مصنوعی چطور کار می کند؟ یک راهنمای ساده

وب‌گاه عصر ایران 1402/05/11 - 15:13 مشاهده در مرجع

مهم‌ترین بخش در تمام مدل‌های یادگیری ماشینی، مرحله‌ای است که به آن آموزش می‌گویند، جایی که یک برنامه کامپیوتری حجم عظیمی از داده‌ها - گاهی با برچسب‌هایی که نوع داده را توضیح می‌دهد - و همین طور مجموعه‌ای از دستورالعمل‌ها را دریافت می‌کند.

آیا تا الان توانسته‌اید از هوش مصنوعی سر در بیاورید؟ در شش ماه گذشته چت‌بات‌ها، مانند چت جی‌بی‌تی (ChatGPT) و سازنده‌های تصویر، مثل میدجورنی (Midjourney,) به سرعت به پدیده‌هایی فرهنگی تبدیل شده‌اند. اما هوش مصنوعی (AI) یا مدل‌های «یادگیری ماشینی» مدت‌هاست که در دسترس هستند.

به گزارش بی‌بی‌سی، در این راهنمای ساده کمی فراتر از چت‌بات‌ها نگاه می‌کنیم تا با انواع مختلف هوش مصنوعی و تاثیر آن در زندگی روزمره‌مان آشنا شویم.

دستورالعمل‌ها ممکن است چیزی شبیه این باشد: «تصاویری را پیدا کن که حاوی چهره باشد» یا «این صدا‌ها را دسته‌بندی کن».

در این مرحله برنامه به دنبال الگو‌هایی در داده‌های دریافتی می‌گردد که با اهدافی که برایش تعریف شده، سازگار باشد.

ممکن است در طول مسیر نیاز به تذکر و یادآوری داشته باشد، مثل این که «این یک چهره نیست» یا «این صدا‌ها متفاوتند». در نهایت آنچه که برنامه کامپیوتری از داده‌ها و دستورات و سرنخ‌های دریافتی یاد می‌گیرد، به یک مدل هوش مصنوعی تبدیل می‌شود و اطلاعاتی که برای آموزش در اختیارش گذاشته شده، سطح توانایی آن را تعیین می‌کند.

یک راه برای درک این که چگونه این روند‌های آموزش منجر به خلق انواع متفاوت هوش مصنوعی می‌شود، این است که به گونه‌های مختلف حیوانات نگاه کنیم.

طی میلیون‌ها سال محیط زیست و طبیعت، حیوانات را به یادگیری توانایی‌های مشخصی هدایت کرده است. در روندی مشابه، میلیون‌ها چرخه‌ای که هوش مصنوعی در طول مرحله آموزش داده و اطلاعات طی می‌کند، نحوه شکل‌گیری آن را مشخص می‌کند و به ساخت مدل‌های تخصصی هوش مصنوعی منجر می‌شود.

چه مثال‌هایی می‌تواند نحوه آموزش مدل‌های مختلف هوش مصنوعی برای کسب مهارت‌های متفاوت را نشان دهد؟

چت‌بات چیست؟

چت‌بات‌ها مثل طوطی هستند: تقلید می‌کند و می‌تواند کلماتی را که شنیده با درکی نسبی از فضای مناسب استفاده از آن تکرار کند، اما درک کاملی از معنای آن ندارد.

چت‌بات‌ها هم همین طور کار می‌کنند، اما در سطحی بسیار پیشرفته‌تر و در آستانه مرحله‌ای قرار دارند که می‌توانند رابطه ما با کلمات مکتوب را تغییر دهند.

چت‌بات‌ها نوشتن را از کجا یاد می‌گیرند؟

آن‌ها در واقع نوعی از هوش مصنوعی هستند که با عنوان مدل‌های زبانی بزرگ (LLMs) شناخته می‌شند و با حجم عظیمی از متن آموزش می‌بینند.

یک مدل زبانی بزرگ قادر است نه فقط کلمات را به صورت جداگانه بلکه کل جمله را بررسی کند و شیوه به‌کارگیری کلمات و عبارات در جملات را با مثال‌های دیگری که از طریق داده‌های آموزشی دریافت کرده، مقایسه کند.

با استفاده از میلیارد‌ها مقایسه بین کلمات و عبارات، می‌تواند یک سوال را بخواند و برای آن پاسخی تولید کند؛ مانند سیستم پیش‌بینی کلمات هنگام تایپ پیامک‌ها در تلفن، اما در مقیاسی بسیار وسیع‌تر.

نکته شگفت‌انگیز در مورد مدل‌های زبانی بزرگ این است که می‌توانند قواعد دستور زبان را بیاموزند و معنای کلمات را بدون کمک انسانی کشف کنند.

می‌توان با هوش مصنوعی صحبت کرد؟

اگر از الکسا، سیری یا هر نوع سیستم شناسایی صدایی استفاده کرده باشید، در واقع از هوش مصنوعی استفاده کرده‌اید.

خرگوشی را با گوش‌های درازش تصور کنید که می‌تواند هر گونه لرزش کوچک در صدا را بفهمد.

هوش مصنوعی در حین صحبت صدای شما را ثبت می‌کند، صدا‌های اطراف را حذف می‌کند، کلمات و جملات شما را به واحد‌های آوایی تبدیل می‌کند - آوا‌های جداگانه‌ای که یک کلمه با آن بیان می‌شود - و سپس آن‌ها را با مجموعه‌ای از آوا‌های زبانی که در اختیارش قرار گرفته تطبیق می‌دهد.

بعد از آن صحبت‌های شما به متن تبدیل می‌شود تا قبل از پاسخ دادن، اشتباه‌های شنیداری سیستم تصحیح شود.

این نوع هوش مصنوعی با عنوان پردازش زبان‌های طبیعی شناخته می‌شود.

این فناوری در واقع همه چیز را در این زمینه پوشش می‌دهد: چه وقتی که در پاسخ سوالی از سیستم تلفن - بانک می‌گویید «بله» و چه وقتی که از موبایلتان می‌خواهید وضعیت هوای چند روز آینده را در شهری که به آن سفر می‌کنید برایتان بگوید.

آیا هوش مصنوعی درکی از تصویر دارد؟

آیا تلفن شما تا حالا عکس‌هایتان را در فولدر‌های جداگانه با نام‌هایی مانند «در ساحل» یا «گردش شبانه» ذخیره کرده است؟

در این صورت شما بدون آن که متوجه باشید از هوش مصنوعی بهره برده‌اید. یک الگوریتم هوش مصنوعی الگو‌هایی را در عکس‌های شما پیدا می‌کند و بر اساس آن آن‌ها را دسته‌بندی می‌کند.

این نوع برنامه‌ها از طریق نگاه کردن به حجم بسیار بزرگی از تصاویر دسته‌بندی شده‌اند که همگی آن‌ها همراه با توضیحی ساده در اختیار ماشین قرار گرفته‌اند.

اگر به یک سیستم هوش مصنوعیِ شناسایی تصویر برچسب «دوچرخه» را بدهید، او شروع به کشف این موضوع می‌کند که یک دوچرخه چه شکلی است و چه تفاوتی با یک قایق یا خودرو دارد.

گاهی هوش مصنوعی آموزش داده می‌شود تا اختلافات جز‌ئی را در تصاویر مشابه پیدا کند.

سیستم تشخیص چهره به همین صورت کار می‌کند. دقیق و موشکافانه ویژگی‌های منحصر به فردی را در چهره شما و در تناسب میان اعضای مختلف صورت پیدا می‌کند که هنگام مقایسه با هر چهره دیگری در جهان می‌تواند آن را تشخیص دهد.

الگوریتم‌های مشابهی هم با تصاویر اسکن‌های پزشکی آموزش داده می‌شوند تا بتوانند تومور‌های خطرناک را پیدا کنند و توانایی این را دارند که در مدت زمانی که یک پزشک متخصص می‌تواند درباره تصویر یک اسکن تصمیم بگیرد، هزاران اسکن را بررسی کنند.

چگونه هوش مصنوعی تصاویر جدید می‌سازد؟

سیستم شناسایی تصویر به تازگی با مدل‌هایی از هوش مصنوعی تلفیق شده که می‌توانند یاد بگیرند چگونه مانند یک آفتاب‌پرست قدرت تغییر و دستکاری طرح و رنگ را داشته باشند.

این مدل‌های هوش مصنوعیِ سازنده تصویر می‌توانند با شناسایی الگو‌های پیچیده بصری از میان میلیون‌ها عکس و طرحی که در اختیار دارند، یک تصویر کاملا جدید خلق کنند.

می‌توانید از هوش مصنوعی بخواهید تصویری از یک عکس بسازد که هرگز گرفته نشده است - مثلا عکس یک انسان که روی سطح مریخ قدم می‌زند.

یا این که می‌تواند با ایده‌ای از خودتان دستور خلق یک تصویر را بدهید: «پرتره‌ای از مربی فوتبال انگلیس بساز که به سبک پیکاسو نقاشی شده باشد.»

جدیدترین مدل‌های هوش مصنوعی روند خلق تصویر جدید را با کمک جمع‌آوری مجموعه‌ای تصادفی از پیکسل‌های رنگی شروع می‌کنند.

سیستم به نقطه‌هایی تصادفی نگاه می‌کند تا به سرنخی از الگویی برسد که در مرحله آموزش یاد گرفته است؛ الگو‌هایی برای ساخت اشیا مختلف.

این الگو‌ها رفته رفته با افزودن لایه‌های بیشتری از نقطه‌های تصادفی، بهبود می‌یابند و با حفظ نقاطی که به ساخت الگو کمک می‌کند، بقیه را دور می‌ریزند تا این که در نهایت شباهت آشکار می‌شود.

تمام الگو‌های لازم مانند «سطح مریخ»، «فضانورد» و «قدم زدن» ساخته می‌شود تا با هم تصویر جدیدی را ایجاد کند.

از آن جا که تصویر تازه با لایه‌هایی از پیکسل‌های تصادفی ساخته شده، نتیجه کار چیزی می‌شد و که قبلا هرگز وجود نداشته، اما در واقع با الهام از میلیارد‌ها الگویی ایجاد شده که سیستم از تصاویر اصلی مرحله آموزش یاد گرفته است.

مسئله‌ای که در این شرایط به وجود آمده است که چنین پدیده‌هایی چه معنایی برای حقوق معنوی و اخلاقی خلق آثار هنری دارد که بر اساس آموزش سیستم با آثار واقعی هنرمندان، طراحان و عکاسان پدید آمده است.

ماجرای ماشین‌های خودران چیست؟

ماشین‌های خودران دهه‌هاست که بخشی از بحث‌های مربوط به هوش مصنوعی بوده‌اند و آثار علمی تخیلی تصویری آن‌ها در تصورات عمومی ثبت کرده است.

هوش مصنوعی مربوط به خودرانی به عنوان رانندگی خودگردان شناخته می‌شود و در این سیستم خودرو‌ها به دوربین، رادار و لیزر‌های حسگر فاصله مجهز می‌شوند.

سنجاقک را در نظر بگیرید، زاویه دید 360 درجه دارد و روی بال‌هایش حسگر‌هایی که به مانور دادن و تنظیم مدام جهت پرواز حشره کمک می‌کند.

به شیوه‌ای مشابه، هوش مصنوعی برای شناسایی اشیا و تشخیص ساکن یا متحرک بودن آن‌ها از داده‌های حسگر‌ها استفاده می‌کند و در صورت حرکت بررسی می‌کند که آیا با یک خودرو طرف است یا یک دوچرخه و یا یک عابر پیاده.

به نظر می‌آید که هزاران هزار ساعت آموزش برای فهم و درک رانندگی درست، هوش مصنوعی را قادر کرده است که در دنیای واقعی برای رانندگی خودرو و اجتناب از تصادف، تصمیم بگیرد و به آن عمل کند.

الگوریتم‌های پیش‌بینی‌کننده سال‌ها تقلا کرده‌اند تا از ماهیت غالبا پیش‌بینی‌ناپذیر رانندگی انسان سر در بیاورند، اما اکنون خودرو‌های بدون راننده از میلیون‌ها کیلومتر جاده واقعی اطلاعات جمع می‌کنند. در سان فرانسیسکو این خودرو‌ها در حال مسافرکشی هستند.

رانندگی خودکار یا بدون دخالت یک راننده، مثالی بسیار روشن از این واقعیت است که چطور فناوری‌های جدید باید بر موانعی غلبه کنند که تنها فنی و تکنیکی نیست.

قوانین دولتی و مقررات ایمنی در کنار حس شدید نگرانی از این که اگر کنترل را به ماشین‌ها بدهیم، چه اتفاقی ممکن است بیفتد، همگی موانع بالقوه‌ای هستند که بر سر راه آینده‌ای کاملا خودران در خیابان‌ها و جاده‌ها قرار دارند.

هوش مصنوعی درباره من چه می‌داند؟

بعضی مدل‌های هوش مصنوعی با اعداد و ارقام کار می‌کنند و با جمع‌آوری و ترکیب آن‌ها انبوهی از اطلاعات را پدید می‌آورند که محصولات آن می‌تواند بسیار ارزشمند باشد.

همین الان هم احتمالا چندین شرح حال از فعالیت‌های مالی و اجتماعی شما، به ویژه فعالیت‌های آنلاین، در دسترس است، که می‌تواند برای پیش‌بینی رفتار شما استفاده شود.

کارت‌های سوپرمارکت‌ها با عنوان کارت‌های وفاداری مشتریان شناخته می‌شود، الگوی خرید و ذائقه شما را دنبال می‌کند. شرکت‌های اعتباری میزان موجودی و همین طور تراز کارت اعتباری شما را زیر نظر دارند.

نتفلیکس و آمازون می‌دانند که دیشب چند ساعت فیلم و سریال دیده‌اید و شبکه‌های اجتماعی حساب تعداد پیام‌های شما زیر ویدیو‌ها را دارند.

شما تنها نیستید، آمار و الگو‌های رفتاری همه موجود است و به هوش مصنوعی این قدرت را می‌دهد که با واکاوی آن، جریان‌های غالب اجتماعی را کشف کنند.

این مدل‌های هوش مصنوعی همین الان هم در حال شکل دادن به زندگی شما هستند: از کمک به تشخیص صلاحیت شما برای گرفتن وام از بانک، تا تاثیرگذاری روی خرید با دستچین کردن آگهی‌هایی که به صورت آنلاین به شما نشان می‌دهد.

آیا هوش مصنوعی قدرت انجام تمام کار‌ها را پیدا خواهد کرد؟

آیا امکان دارد که با ترکیب مهارت‌های مختلف، یک مدل هوش مصنوعی واحد و ترکیبی به وجود بیاید؟ این دقیقا موضوعی است که تازه‌ترین پیشرفت‌های هوش مصنوعی بر آن متمرکز است.

به آن هوش مصنوعی چندوجهی می‌گویند که اجازه می‌دهد یک مدل با رصد گونه‌های متفاوتی از داده‌ها - مانند تصویر، متن، صدا و ویدیو - الگو‌های تازه‌ای را در میان آن‌ها کشف کند.

این رویکرد چند وجهی یکی از دلایل اصلی جهشی بزرگ بود که در زمینه توانایی هوش مصنوعی از ChatGPT3 به ChatGBT4 رخ داد. اولی تنها با متن آموزش دیده بود در حالی که نسخه جدیدتر قدرت پردازش تصویر را هم دارد.

ایده یک مدل واحد هوش مصنوعی که قادر به پردازش هر گونه داده‌ای باشد و بتواند از پس هر وظیفه‌ای که به آن محول می‌شود برآید - از ترجمه بین زبان‌های مختلف گرفته تا ساخت دارو‌های جدید - با عنوان هوش جامع مصنوعی (AGI) شناخته می‌شود.

برای بعضی رسیدن به چنین سیستمی هدف نهایی تمام تحقیقات مربوط به هوش مصنوعی است، در حالی که برای عده‌ای دیگر مسیری منتهی به ویران‌شهر‌هایی است که در فیلم‌ها و کتاب‌های علمی تخیلی تصویر شده است و در آن یک سیستم هوشمند ورای فهم انسان به وجود می‌آید که از کنترل او خارج می‌شود.

چگونه هوش مصنوعی را آموزش داده می‌شود؟

تا مدتی پیش روند اصلی آموزش بیشتر مدل‌های هوش مصنوعی روش «یادگیری نظارت‌شده» بود.

در این روش حجم انبوهی از اطلاعات دسته‌بندی شده با برچسبی که انسان برای آن تعیین می‌کند، در اختیار هوش مصنوعی قرار می‌گیرد تا الگو‌های این داده‌ها را پیدا کند.

سپس از هوش مصنوعی خواسته می‌شود که این الگو‌ها را روی داده‌های جدید پیاده کند و درباره دقت آن بازخورد بدهد.

برای مثال در نظر بگیرید که 12 عکس به هوش مصنوعی داده می‌شود که شش تای آن برچسب «خودرو» دارد و شش تای دیگر برچسب «ون».

بعد از هوش مصنوعی بخواهید که الگویی بصری پیدا کند که بتوان بر اساس آن خودرو‌ها و ون‌ها را به دو گروه تقسیم کرد.

حالا اگر از آن بخواهید که عکس‌ها را دسته‌بندی کند چه اتفاقی می‌افتد؟

متاسفانه به نظر می‌آید که هوش مصنوعی فکر می‌کند که این یک ون است که چندان هوشمندانه نیست.

حالا یک ون قرمز را نشانش دهید.

هوش مصنوعی به شما می‌گوید که این یک خودرو معمولی است.

تقریبا مشخص است که کجای کار ایراد دارد.

هوش مصنوعی با تعداد محدود تصاویری که دیده به این نتیجه رسیده است که رنگ، مهم‌ترین وجه تمایز خودرو‌های معمولی و ون‌ها است و آن‌ها را بر همین اساس دسته‌بندی کرده است.

اما نکته شگفت‌انگیز درباره برنامه‌های هوش مصنوعی این است که خودش قدرت تصمیم‌گیری دارد و ما می‌توانیم کمک کنیم تا روند تصمیم‌گیری آن بهبود یابد.

می‌توانیم به هوش مصنوعی بگوییم که دو شیء را اشتباه تشخیص داده و این سرنخ آن را وادار می‌کند که الگوی جدیدی در تصاویر پیدا کند.

اما از همه مهم‌تر ما می‌توانیم وجه گمراه‌کننده روند آموزش را با فراهم کردن تصاویر بیشتر تصحیح کنیم.

این دو اقدام ساده همراه یکدیگر - والبته در مقیاسی وسیع - شیوه‌ای است که بیشتر سیستم‌های هوش مصنوعی بر اساس آن آموزش دیده‌اند تا بتوانند در موقعیت‌های بسیار پیچیده تصمیم بگیرند.

هوش مصنوعی چطور بدون کمک یاد می‌گیرد؟

بیشتر پیشرفت‌های چشمگیر در حوزه هوش مصنوعی از طریق یادگیری عمیق میسر شده است.

به ساده‌ترین عبارت، به این معناست که الگریتم‌های پیچیده و پایگاه داده‌های بسیار عظیم، هوش مصنوعی را قادر می‌کند که بدون راهنمایی انسانی آموزش ببیند.

ChatGPT مشهورترین نمونه آن است.

حجم متن‌ها در اینترنت و کتاب‌هایی که به صورت دیجیتال در آمده آن قدر وسیع است که در عرض چندین ماه ChatGPT توانست یاد بگیرد که چگونه خود کلمات را برای ساختن جمله‌ای معنادار ترکیب کند.

تصور کنید مجموعه‌ای از کتاب‌هایی به یک زبان خارجی دارید که بعضی از آن‌ها ممکن است تصاویری هم داشته باشند.

ممکن است با نگاه به صفحات مختلف دریابید که یک کلمه ثابت در صفحاتی که طرح یا عکسی از درخت دارد تکرار شده و کلمه‌ای دیگر در صفحاتی که تصویری از یک خانه وجود دارد.

بعد احتمالا خواهید دید که معمولا کنار این لغات، یک کلمه مشخصی هست که ممکن است معنای «یک» یا نوعی حرف تعریف را بدهد؛ و این روند به همین ترتیب ادامه پیدا می‌کند.

این مدل یادگیری عمیق است که با عنوان یادگیری بدون نظارت هم شناخته می‌شود.

این روش به قدرت کامپیوتری بسیار بالا نیاز دارد که به هوش مصنوعی اجازه دهد حجم عظیمی از کلمات را - چه به صورت جداگانه، چه به صورت گروهی در یک جمله و در صفحات مختلف - به خاطر بسپارد و سپس با بررسی آن‌ها در کسری از ثانیه بتواند موقعیت‌های مختلف استفاده از آن‌ها را بار‌ها و بار‌ها و بار‌ها مرور و مقایسه کند.

پیشرفت‌های سریعی که با مدل‌های یادگیری عمیق در یک سال اخیر به دست آمده، موج تازه‌ای از اشتیاق و نگرانی هم‌زمان را بر سر توانایی‌های بالقوه هوش مصنوعی به راه انداخته و به نظر نمی‌آید که بحث به این زودی‌ها فروکش کند.

به نظر می‌آید که رویا‌ها و هشدار‌های آثار علمی تخیلی ناگهان در مقابل‌مان ظاهر شده و دریافته‌ایم که همین الان هم در دنیایی زندگی می‌کنیم که هوش مصنوعی در حال آشکار کردن توانایی‌های عجیب و فرابشری است.

کانال عصر ایران در تلگرام بیشتر بخوانید: شکل و شمایل فرشتگان آسمانی را از دیدگاه هوش مصنوعی (فیلم) هوش مصنوعی و داستان کشتی حضرت نوح (ع)! (فیلم) مورگان فریمن هم طعمه هوش مصنوعی شد (فیلم) تصویرسازی هوش مصنوعی از واقعه روز عاشورا (عکس) تماشاخانه