نام پژوهشگر: فرزانه عبداللهی
احمدرضا سعادت خواه وحید جوهری مجد
در این پژوهش روشی برای کنترل آرایش سامانه¬های چند روبات متحرک در حضور آسیب عملگر برای یکی از روبات¬ها ارائه شده است. روبات¬ها به صورت روبات¬های چرخ¬دار تفاضلی در نظر گرفته شده¬اند و با طراحی یک بازخورد خطی ساز ورودی-خروجی و استفاده از یک کنترل کننده تناسبی به کنترل خطای آرایش سامانه پرداخته شده است. آسیب عملگر نیز به صورت آسیب ضربی در ماتریس ضریب بهره عملگر، مدل شده است. هر روبات با بهره¬گیری از فیلتر کالمن به تخمین موقعیت روبات¬های همسایه خود می¬پردازد و از اختلاف بین موقعیت نسبی تخمین زده شده و مقدار مطلوب، مانده آسیب ایجاد می¬شود. در صورتیکه مانده از مقدار آستانه¬ای از پیش تعیین شده بزرگتر باشد، آسیب تشخیص داده می¬شود و پس از شناسایی آسیب، روبات آسیب دیده به بازیابی کنترل کننده خود می¬پردازد. نتایج شبیه¬سازی برای یک سامانه متشکل از چهار روبات چرخ¬دار تفاضلی، نشان دهنده حفظ آرایش مطلوب با استفاده از روش پیشنهادی در حضور آسیب عملگر می¬باشد.
غزاله هادیان وحید جوهری مجد
سامانه کنترل همکاری یک سامانه کنترل توزیعی است که توسط یک گروه از عامل ¬های خودگردان اطلاعات محلی در دسترس از هر عامل همسایه را به کمک حسگرهای خود و یا از طریق ارتباط با عامل¬های دیگر اطلاعات مورد نیاز را دریافت می¬کنند و هدف از این نوع کنترل دستیابی به رفتار گروهی مشخص می¬باشد. حرکت دسته¬ای یکی از اهداف گروهی در سامانه کنترل همکاری است. دسته ، یک شبکه همبند از عامل¬های پویا می¬باشد. در صورتیکه ارتباط همه عامل¬ها به یک گوی با شعاع متناهی محدود شود شبکه را منسجم گویند. حرکت دسته ای در سامانه¬های چند عامله که برگرفته از زندگی گروهی بسیاری از حیوانات در طبیعت نظیر پرندگان و ماهی¬ها می¬باشد؛ حرکت جمعی یک شبکه از عامل¬های خودگردان پویا است که باید با جلوگیری از برخورد عامل¬ها، شبکه را همبند باقی نگه دارند. در یک حرکت دسته¬ای تمامی عامل¬ها باید از سه قانون انسجام (قرارگرفتن اعضای دسته نزدیک به یکدیگر)، جدایی (جلوگیری از برخورد اعضای دسته در همسایگی یکدیگر) و هم راستایی (تطبیق سرعت اعضای دسته نزدیک بهم) پیروی کنند[ ]. به همین منظور تاکنون الگوریتم¬های حرکت دسته¬ای بسیاری معرفی شده است که برقراری هر سه قانون را تضمین می¬کنند، اما همواره برای پیاده¬سازی حرکت دسته¬ای سامانه¬های چند عامله در محیط زمان واقعی باید علاوه بر این سه قانون، قوانین دیگری از جمله جلوگیری از برخورد با موانع و ردگیری هدف را نیز مدنظر قرار داد که این مسئله نیز بسیار مورد توجه محققین قرار گرفته است. در مسئله جلوگیری از برخورد با مانع، موانع موجود در محیط را می توان به صورت محدب و غیرمحدب، و نیز ساکن و پویا در نظر گرفت. که در کارهای انجام شده تاکنون به علت پیچدگی مسئله، فقط موانع محدب و در غالب آنها ساکن درنظرگرفته شده است. به عبارتی برنامه¬ریزی حرکت پویا بسیار دشوارتر از برنامه¬ریزی حرکت ایستا می¬باشد حتی زمانی که اطلاعات کامل از محیط در دسترس باشد[ ]. مساله ردگیری هدف در یک شبکه را می¬توان به صورت دنبال کردن یک رهبر واقعی (مانند یک هدف پویا با ورودی نامشخص و یا از پیش تعیین نشده) و یا یک رهبر مجازی (مانند یک مسیر مرجع یا یک سرعت مطلوب داده شده) تحقق داد[ و ]. سرعت رهبر ممکن است ثابت یا متغیر با زمان باشد. وجود رهبر برای یک گروه یکی از راه¬های تضمین همبندی شبکه در طول حرکت می¬باشد و باعث می-شود عامل¬ها بطور مجانبی با سرعت مطلوب حرکت کنند و منسجم باقی بمانند، این مسئله به صورت یک عبارت بازخورد هدایتی در ورودی کنترلی هر عامل ظاهر می¬گردد به این معنا که همه عامل¬ها از موقعیت و سرعت رهبر آگاهی دارند و یا اندازه¬گیری می¬کنند. از مهم¬ترین الگوریتم¬های کنترلی ارائه شده در این زمینه می¬توان به کار آقای الفتی صابر در سال 2006 اشاره کرد [1]. آگاهی هر عامل از موقعیت و سرعت رهبر با توجه به نوع کاربرد حرکت دسته¬ای مزایا و معایبی دارد. تعیین دقیق معادله دینامیکی رهبر سبب می¬شود که گروه تا پایان عملیات منسجم باقی بماند و یک جهت مشترک را دنبال کند و اما با وجود یک رهبر واقعی در صورتی که به هر دلیلی ارتباط عامل¬ها با رهبر قطع گردد حرکت دسته مختل می¬شود و گروه نمی¬تواند به حرکت خود در یک جهت مشترک ادامه دهد. از طرف دیگر، اعمال معادله دینامیکی رهبر در وروردی کنترلی هر عامل باعث می¬شود که عامل¬ها در طول حرکت تنها ملزم به ردگیری یک هدف خاص و از پیش تعیین شده باشند، اما در صورتی که عامل¬ها بتوانند موقعیت هدف را به صورت پویا تخمین بزنند این مسئله قابل حل خواهد بود در اینصورت هر هدفی با هر سرعت و موقعیتی قابل ردگیری خواهد بود و نیاز به آگاهی قبلی عامل¬ها نخواهد بود. ردگیری مشارکتی هدف در طبیعت در انواع کاربردهای امنیتی و نظامی مشاهده می¬گردد. با توجه به آنچه تاکنون اشاره گردید بدلیل محدودیت حسگرها و عدم دسترسی به اطلاعات کافی برای بکارگیری در رسیدن به همکاری گروهی به یک برنامه تخمین توزیعی برای برآورد موقعیت هدف نیاز است. الگوریتم و تئوری¬های فیلتر کالمن نقش مهمی در مسائل ردگیری هدف ایفا می¬کنند. فیلتر کالمن که تخمین خطی مرتبه دوم نیز نامیده می¬شود؛ الگوریتم بازگشتی است که با بکارگیری مجموعه¬ ای از اندازه¬گیری¬های مشاهده شده در طول زمان یک تخمین بهینه از حالت سامانه واقعی بوجود می¬آورد. داده¬های ورودی حاوی نویز (تغییرات تصادفی ) می¬باشند. در واقع تخمینگر کالمن کمک می¬کند متغیرهای ناشناخته یک سامانه پویا با دقت بیشتری نسبت به حالتی که فقط یک مقدار اندازه¬گیری وجود دارد تخمین زده شوند. فیلتر کالمن استاندارد یک تخمینگر کالمن متمرکز (ckf) است که در آن همه حسگرها خوانده¬هایشان را به واحد مرکزی می¬فرستند تا یک ckf برای تخمین موقعیت هدف به اجرا درآید. در عوض در تخمینگر کالمن توزیعی (dkf) هر روبات تنها با همسایگانش برای تبادل اطلاعات ارتباط دارد و dkf تنها از اندازه¬گیری¬های خودش و اطلاعات همسایگانش برای تخمین متغیر موردنظر استفاده می¬کند[ ]. بطورکلی ایده ادغام تخمین و کنترل یک رهیافت مهم در مطالعه همکاری چند عامله توزیعی بوجود آورده است و در کاربردهای واقعی تخمینگرهای توزیعی طراحی شده را می¬توان بجای برخی حسگرهای گران قیمت مورد استفاده قرار داد[ ]. لازم به ذکر است که طراحی سامانه حلقه بسته با تخمینگرهای توزیعی پیچیدگی بسیار بیشتری نسبت به سامانه¬های بدون تخمینگر توزیعی دارد.