آیا می توان نوعدوستی را به الگوریتم های رایانه ای آموخت؟

آیا تا کنون به هماهنگی فوتبالیست‌های یک تیم اندیشیده‌اید؟ چه چیز سبب موفقیت یک تیم خواهد بود؟ کار گروهی قطعا در فهرست پاسخ‌های شما قرار می‌گیرد. آیا تیمی از ربات‌ها نیز می‌تواند به همین شیوه موفق باشد؟ همکاری در بازی‌های ساده نیز برای هوش مصنوعی ساده نیست. پژوهش‌ها نشان می‌دهد که تشویق بازیکنان مجازی می‌تواند در گسترش همکاری موثر باشد. برای آشنایی بیشتر با این ایده با مجله‌ی فناوری‌های توان‌افزا و پوشیدنی همراه باشید.

ایجاد انگیزه و همکاری در یک جمعیت

انسان‌ها با انگیزه‌هایی مانند پول، غذا، اطلاعات، رقابت و … به جلو حرکت می‌کنند. پژوهش‌ها نشان می دهد که در صورت تزریق این انگیزه‌ها با الگوریتم‌های رایانه‌ای مانند یادگیری ماشین می‌توان عملکرد این الگوریتم‌ها را بهبود داد.

در یک قسمت بازی بازیکن بنقش می‌توانست برای رها کردن بازیکن آبی از داخل جعبه‌ای که اسیر آن بود، تصمیم‌گیری کند.

در یک قسمت بازی بازیکن بنقش می‌توانست برای رها کردن بازیکن آبی از داخل جعبه‌ای که اسیر آن بود، و یا ادامه دادن به جمع‌آوری محصول، تصمیم‌گیری کند.

در پژوهشی جدید بازیکنان یک دنیای دو بعدی به برداشت سیب واداشته شدند. در طی برداشت سیب‌هایی که در اطرافشان سیب‌های بیشتری بود، سریع‌تر رشد می‌کردند.به عبارتی با بیش از حد خالی کردن یک ناحیه، رشد مجدد سیب‌ها هم کم می‌شد. در این‌جا نوعی نیروی متعادل کننده لازم است. در صورتی که منابع تامین کننده‌ی مواد معدنی لازم در نزدیکی سیب‌ها به صورت دائم تمیز نشود، رشد سیب‌ها متوقف می‌شود.

نحوه ی رفتار یک الگوریتم نوعدوستانه

الگوریتم به کار رفته در این مساله، با تصمیم خود برای برداشت محصول، بر تصمیم‌گیری سایر بازیکنان اثر می‌گذاشت. در یک نمونه از این آزمایش، الگوریتم به کار برده شده سعی در تخمین اثر تصمیم دیگران در وضعیت بازی داشت. این الگوریتم با مشاهده‌ی رفتار سایرین، سعی در پیش‌بینی رفتار آنان در آینده داشت. به خصوص پیش‌بینی واکنش همسایه‌ها به تصمیم گرفته شده توسط یک بازیکن. در صورتیکه یک عکس‌العمل خاص همسایه‌ها را بیش سایر عکس‌العمل‌ها تحت تاثیر قرار دهد، این عکس‌العمل مهم است.

پژوهشگران تعداد سیب‌های جمع شده توسط همه‌ی بازیکنان را شمردند. کل جمعیت در حالتیکه مکانیزمی برای تشویق وجود داشت، بهتر از حالت عادی عمل کرد. در پژوهش مکانیزم تشویق جمعیت‌هایی که خودخواه نبود را نیز مغلوب ساخت. در چنین جمعیتی تعداد سیب‌های جمع شده توسط بازیکنان تقریبا یکسان است.

در قسمتی دیگر از این پژوهش به برداشت‌کنندگان محصول امکان برقراری ارتباط، داده شده است. بازیکنانی که به پیام‌های سایرین گوش می‌دهند و با توجه به آن تصمیم می‌گیرند سیب‌های بیشتری را جمع‌آوری می‌کنند.

این گونه مکانیزم‌ها اما در شرایط مختلف،‌عملکرد متفاوتی دارند. خصوصا در صورتیکه یک عامل سودجو در جمعیت وجود داشته باشد. Natasha Jaques به عنوان پیشگام این دسته از پژوهش‌ها، قصد دارد این الگوریتم‌ها را بر روی ربات‌ها نیز به کارگیرد.

 


بیشتر بخوانید:

مروری بر جدیدترین پیشرفت های رباتیک بهار ۹۸

نجات محیط زیست با کمک ربات ها ، میکروب ها و فناوری نانو (بخش نخست)


منبع: spectrum.ieee

«استفاده و بازنشر مطالب تنها با ذکر لینک منبع و نام (مجله فناوری‌های توان‌افزا و پوشیدنی) مجاز است»

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *