هنگامی Ú©Ù‡ انسان به درک یک شیء معین دست پیدا Ù…ÛŒ کند ØŒ برای انزوای آن Ùˆ به وجود آوردن Ùضای کاÙÛŒ برای برداشتن آن ØŒ باید اغلب اوقات از هم گسیختگی خارج شود. Øتی اگر انسانها همیشه به طور کامل آگاه نباشند Ú©Ù‡ این کار را انجام Ù…ÛŒ دهند ØŒ این استراتژی ØŒ معرو٠به "دستکاری قبل از درک" ØŒ به آنها اجازه Ù…ÛŒ دهد تا با کارآمد تر اشیا را درک کنند.
تØقیقات Check Point آسیب پذیری های دوربین DSLR را نشان Ù…ÛŒ دهد
در سال های اخیر ØŒ چندین Ù…Øقق سعی در بازتولید استراتژی های دستکاری انسان در روبات ها کرده اند ØŒ با این Øال مطالعات کمتری روی دستکاری های پیش از تمرکز متمرکز شده اند. با توجه به این نکته ØŒ اخیراً تیمی از Ù…Øققان انستیتوی Ùناوری کارلسروهه (KIT) الگوریتمی را تهیه کرده اند Ú©Ù‡ Ù…ÛŒ تواند برای آموزش روبات ها در هر دو استراتژی Ú†Ù†Ú¯ زدن Ùˆ پیش دستی استÙاده کند. این رویکرد جدید در مقاله ای از قبل منتشر شده در arXiv ارائه شده است .
لارس برشید ØŒ یكی از Ù…Øققانی كه این تØقیق را انجام داده است ØŒ Ú¯Ùت: "در Øالی كه Ú†Ù†Ú¯ زدن یك وظیÙÙ‡ شناخته شده در رباتیک است ØŒ دستكاری هدÙمند پیش از این هنوز چالش برانگیز است." ÙˆÛŒ ادامه داد: این امر در Øال Øاضر ربات ها را نمی توان اشیاء خارج از Ùضای درهم Ùˆ برهم یا تنگ درک کرد ØŒ اما با وجود نوآوری های اخیر در یادگیری ماشین Ùˆ ربات ØŒ ربات ها Ù…ÛŒ توانند یاد بگیرند Ú©Ù‡ چگونه با تعامل با Ù…Øیط خود کارهای مختلÙÛŒ را ØÙ„ کنند. ما Ù…ÛŒ خواستیم رویکردی را Ú©Ù‡ در کار قبلی خود ارائه دادیم نه تنها برای درک ØŒ بلکه در مورد دستکاری های قبل از درک نیز به کار گیریم . "
اعتبار: Berscheid ، Meissner & Kröger.
وقتی یک روبات در Øال یادگیری Ù†Øوه انجام یک کار خاص است ØŒ در اصل باید با Øداکثر رساندن پاداش های خود ØŒ چگونگی ØÙ„ مسئله را تشخیص دهد. Ù…Øققان در مطالع on خود بر روی کارهایی تمرکز کردند Ú©Ù‡ شامل چیدن اشیاء از سطل پرشده تصادÙÛŒ بود.
این روبات در مورد چگونگی درک اشیاء به مدت تقریبی 80 ساعت ØŒ با استÙاده از ورودی از یک دوربین Ùˆ بازخورد گرÙتن از گیرنده آن آموزش داده شده است. هنگامی Ú©Ù‡ آن را با موÙقیت یک Ø´ÛŒ در گیر گیر رباتیک خود Ù†Ú¯Ù‡ داشت ØŒ به یک پاداش بدست آورد. الگوریتمی Ú©Ù‡ توسط Berscheid Ùˆ همکارانش ایجاد شده است ØŒ یک آموزش گام به گام در این ربات را Ø·ÛŒ Ù…ÛŒ کند Ùˆ به آن امکان Ù…ÛŒ دهد برای استراتژی های دستکاری قبل از درک ØŒ مانند تعویض یا Ùشار دادن نیز Ù…Ùید باشد.
برشید ØªÙˆØ¶ÛŒØ Ø¯Ø§Ø¯: "ایده اصلی کار ما این بود Ú©Ù‡ اقدامات عملی را با معرÙÛŒ Øرکات اضاÙÛŒ تغییر یا Ùشار دهیم." "روبات Ù…ÛŒ تواند تصمیم بگیرد Ú©Ù‡ در موقعیت های مختل٠چه عملی را اعمال کند. آموزش ربات ها در واقعیت بسیار مشکل است: اول ØŒ مدت زمان زیادی طول Ù…ÛŒ کشد ØŒ بنابراین خود آموزش باید به صورت خودکار Ùˆ خود نظارت داشته باشد Ùˆ دوم موارد غیر منتظره. Ù…ÛŒ تواند اتÙاق بیÙتد Ú©Ù‡ ربات Ù…Øیط خود را مورد بررسی قرار دهد.همچنین با سایر تکنیک های یادگیری ماشین ØŒ یادگیری ربات همیشه در مصر٠داده های آن Ù…Øدود است. ممکن — Ùˆ Ú†Ù‡ وظایÙÛŒ را Ù…ÛŒ توان با استÙاده از بینش های کش٠شده ربات یاد گرÙت؟ "
اعتبار: Berscheid ، Meissner & Kröger.
همانطور Ú©Ù‡ Berscheid در ادامه ØªÙˆØ¶ÛŒØ Ù…ÛŒ دهد ØŒ یک روبات Ù…ÛŒ تواند در صورت دریاÙت بازخورد مستقیم بعد از هر عملی Ú©Ù‡ انجام Ù…ÛŒ دهد ØŒ با کارآیی بیشتری بیاموزد ØŒ زیرا این مسئله برنده جوایز پراکنده است. به عبارت دیگر ØŒ هرچه بازخورد بیشتری به یک ربات ارائه Ù…ÛŒ شود (یعنی هر Ú†Ù‡ بیشتر از اقدامات موÙقیت آمیز دریاÙت کند) ØŒ سریعتر Ùˆ مؤثرتر Ù…ÛŒ آموزد Ú©Ù‡ چگونه یک کار خاص را انجام دهد.
"این صدا آسان است ØŒ اما گاهی اوقات اجرای آن دشوار است: به عنوان مثال ØŒ Ú©ÛŒÙیت یک دستکاری قبل از Ú†Ù†Ú¯ زدن را چگونه تعری٠می کنید؟" برشید Ú¯Ùت.
رویکرد ارائه شده توسط Ù…Øققان براساس یک مطالعه قبلی است Ú©Ù‡ با استÙاده از تÙاوت در درک اØتمالات قبل Ùˆ بعد از یک اقدام خاص ØŒ با تمرکز بر یک منطقه Ú©ÙˆÚ†Ú© در اطرا٠مØÙ„ انجام عمل ØŒ مورد بررسی قرار گرÙته است. در مطالعه جدید خود ØŒ برشید Ùˆ همکارانش همچنین سعی کردند از اقداماتی پرده برداری کنند Ú©Ù‡ یک روبات باید سعی کند هر Ú†Ù‡ سریعتر یاد بگیرد.
برشید ØªÙˆØ¶ÛŒØ Ø¯Ø§Ø¯: این مشکل شناخته شده اکتشا٠در یادگیری روبات ها است. "ما یک استراتژی اکتشا٠را تعری٠می کنیم Ú©Ù‡ یا اطلاعات خود را به Øداکثر Ù…ÛŒ رساند یا عدم اطمینان اقدامات را به Øداقل Ù…ÛŒ رساند Ùˆ Ù…ÛŒ تواند بسیار کارآمد Ù…Øاسبه شود."
الگوریتم ارائه شده توسط Ù…Øققان به یک ربات این امکان را Ù…ÛŒ دهد تا برای به دست آوردن اقدامات پیش از Ú†Ù†Ú¯ زدن مانند بستن یا تغییر مکان ØŒ Ùˆ همچنین Ù†Øوه انجام این اقدامات برای اÙزایش اØتمال درک موÙقیت آمیز ØŒ موقعیت بهینه را یاد بگیرد. رویکرد آنها باعث Ù…ÛŒ شود Ú©Ù‡ یک عمل خاص (به عنوان مثال تغییر) به دیگری وابسته شود (یعنی درک) ØŒ Ú©Ù‡ در نهایت نیاز به پاداش های پراکنده را برطر٠می کند Ùˆ یادگیری کارآمدتری را امکان پذیر Ù…ÛŒ کند.
Ù…Øققان الگوریتم خود را روی یک بازوی رباتیک Franka اعمال کردند Ùˆ سپس عملکرد آن را روی یک کار Ú©Ù‡ شامل چیدن اشیاء از سطل تا زمانی Ú©Ù‡ کاملا خالی باشد ارزیابی کردند. آنها این سیستم را با استÙاده از 25ØŒ000 عملکرد متÙاوت Ùˆ 2500 تغییر Ø´ÛŒÙت آموزش دادند. یاÙته های آنها بسیار امیدوار کننده بود ØŒ با بازوی روباتیک ØŒ هر دو موردی را Ú©Ù‡ با آن آشنا بود Ùˆ سایر مواردی Ú©Ù‡ قبلاً هرگز با آن روبرو نشده بود ØŒ با موÙقیت Ú©Ø´Ù Ùˆ ضبط کرد.
برشید Ú¯Ùت: "من Ù…ÛŒ دانم Ú©Ù‡ دو نتیجه از کار ما به ویژه جالب توجه است." "ابتدا Ùکر Ù…ÛŒ کنیم Ú©Ù‡ این کار توانایی یادگیری روبات ها را نشان Ù…ÛŒ دهد. به جای اینکه برنامه ریزی کنیم Ú©Ù‡ چگونه کاری انجام دهیم ØŒ به ربات Ù…ÛŒ گوییم Ú†Ù‡ کاری انجام دهد" Ùˆ باید Ùهمید Ú©Ù‡ چگونه این کار را به تنهایی انجام دهد. در این رابطه ØŒ ما قادر به استÙاده Ùˆ روشهایی هستیم Ú©Ù‡ برای دستیابی به دستکاری قبل از درک استÙاده کرده ایم Ùˆ کاربرد آن را تعمیم خواهیم داد. دوم Ùˆ از نظر کاربردی دیگر ØŒ این Ù…ÛŒ تواند در اتوماسیون بسیاری از کارهای صنعتی ØŒ به ویژه برای انتخاب بن ØŒ جایی Ú©Ù‡ ربات باید Ù…Ùید باشد ØŒ Ù…Ùید باشد. بتواند سطل را به طور کامل به تنهایی خالی کند. "
در آینده ØŒ رویکرد توسعه یاÙته توسط Berscheid Ùˆ همکارانش Ù…ÛŒ تواند در سیستم عامل های دیگر روباتیک اعمال شود ØŒ Ùˆ مهارت های دستکاری Ùˆ پیش دستی آنها را تقویت کند. Ù…Øققان اکنون قصد دارند مطالعات دیگری را برای کاوش سایر سوالات تØقیقاتی انجام دهند.
به عنوان مثال ØŒ تاكنون رویكرد آنها Ùقط به بازوی روباتیک Ùرانك اجازه Ù…ÛŒ دهد اشیاء را با دست راست بكشد ØŒ Ùˆ با استÙاده از آنچه كه به آنها "دستهای مسطØ" Ú¯Ùته Ù…ÛŒ شود ØŒ برسد. Ù…Øققان دوست دارند با معرÙÛŒ پارامترهای بیشتر Ùˆ استÙاده از داده های آموزش اضاÙÛŒ ØŒ الگوریتم خود را برای Ùعال کردن چنگهای جانبی گسترش دهند. به Ú¯Ùته برشید ØŒ چالش اصلی هنگام تلاش برای دستیابی به این هد٠، اطمینان از دستیابی روبات به هنگام گرÙتن تعداد تلاش های درستی است Ú©Ù‡ در طول آموزش تمرین Ù…ÛŒ کند.
برشید Ú¯Ùت: "علاوه بر این ØŒ گرÙتن اشیاء اغلب بخشی از یک کار Ø³Ø·Ø Ø¨Ø§Ù„Ø§ است ØŒ به عنوان مثال Ù…ÛŒ خواهیم شیء را در یک موقعیت خاص قرار دهیم." "چگونه Ù…ÛŒ توان یک Ø´ÛŒ ناشناخته دقیقا؟ من Ùکر Ù…ÛŒ کنم Ú©Ù‡ پاسخ به این سوال بسیار مهم است برای مقابله با هر دو برنامه های کاربردی صنعتی Ùˆ جدید در رباتیک خدمات در پروژه ما ما Ù…ÛŒ خواهیم به ØÙظ تمرکز بر دنیای واقعی ربات یادگیری، پل زدن شکا٠بین نمونه های اسباب بازی در تØقیقات Ùˆ برنامه های پیچیده در دنیای واقعی. "