نام پژوهشگر: محمدباقر نقیبی سیستانی

کنترل فازی دو زمانه یک تقاطع شهری
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1388
  احسان عظیمی راد   محمدباقر نقیبی سیستانی

رشد سریع جمعیت در جهان، افزایش روز افزون تعداد خودروها و عدم افزایش ظرفیت راه ها موجی از ترافیک های خسته کننده و سنگین را در شهرها موجب شده است. از جمله مشکلاتی که کم و بیش دست به گریبان همه شهروندان شهرهای بزرگ است، مسئله ترافیک در خیابان ها است. هر لحظه تأخیر بی مورد در خیابان ها به معنی هزاران دلار ضرر اقتصادی، زیست محیطی و اجتماعی است. برای کاهش اثر صف های طولانی خودروها در چهارراه ها تلاش زیادی صورت گرفته است. این تلاش ها عمدتاً در راستای بهینه سازی زمانبندی سیگنال چراغ راهنمایی بوده است. به دلیل طبیعت غیرخطی و غیرقطعی سیستم ترافیک از یک طرف و قابلیت سیستم های فازی در غلبه بر این مشکلات از طرف دیگر، در تحقیقات اخیر استفاده از کنترل کننده های هوشمند فازی با اقبال بیشتری مواجه شده اند. معمولاً کنترل کننده های فازی زمانبندی سیگنال های چراغ راهنمایی و دنباله فاز را کنترل می کنند. طراحی این کنترل کننده ها بر اساس کاهش متوسط زمان انتظار خودروهای داخل صف ها در یک بازه زمانی مشخص انجام می گیرد. بنابراین این کنترل کننده ها توانایی کنترل تقاطع ها را برای شرایط خاص و غیرعادی ترافیک مانند وقوع تصادفات خیابانی ، افزایش ناگهانی خودروها و انسداد خیابان ها ندارند. در این پایان نامه ابتدا یک مدل کلاسیک جامع از رفتار خودروها در ترافیک شهری در یک چهارراه سیگنالیزه دو فاز بر اساس معادلات فضای حالت در نرم افزار سیمولینک 4/7 معرفی شده است. ورودی های سیستم، متغیرهای تصادفی نرمال و خروجی آن تعداد خودروهای در صف است. سپس با استفاده از سیستم فازی ممدانی با 4 ورودی و 4 خروجی، یک کنترل کننده فازی طراحی شده است. سپس، این کنترل کننده با اعمال اغتشاش به سیستم ترافیک در شرایط ترافیک عادی و غیرعادی مورد آزمایش قرار گرفته و پایداری آن بررسی شده است. همچنین در راستای کاربردی کردن این پروژه ، داده های ترافیکی واقعی تقاطع دو فاز چهارراه لشگر (تقاطع امام خمینی– بهار) در شهر مشهد که از مرکز کنترل ترافیک تهیه شده است، به عنوان ورودی به سیستم ترافیک اعمال و نتایج حاصل از شبیه سازی آن در دو حالت بدون کنترل کننده و با کنترل کننده مورد تحلیل قرار گرفته است. در ادامه، نتایج شبیه سازی در این پایان نامه برای داده های تصادفی و واقعی استفاده شده، مقایسه شده است. مقایسه نتایج شبیه سازی سیستم ترافیک با اعمال داده های تصادفی و واقعی ، بیانگر کارآیی مدل مذکور و مطلوب بودن کنترل کننده هوشمند فازی طراحی شده است. نتایج به دست آمده نشان دهنده قابلیت این کنترل کننده در کاهش حجم ترافیک در شرایط غیرعادی در قیاس با کنترل زمان ثابت است.

کنترل پارامترهای استراتژی الگوریتم های تکاملی در یک محیط غیر ایستا با استفاده از کنترلر فازی احتمالی تطبیقی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1389
  مجید مازوچی   محمدباقر نقیبی سیستانی

در تمام الگوریتم های بهینه سازی مبتنی بر جمعیت، مسئله ی برقراری تعادل بین اکتشاف و استفاده از نتایج بدست آمده، مهمترین مسئله ای است که الگوریتم با آن رو به رو است.تا کنون الگوریتم های ژنتیکی تطبیقی بسیاری، که بصورت داینامیک به کنترل بعضی پارامترهای استراتژی الگوریتم می پردازند، ایجاد و معرفی شده اند. هدف اصلی آنان بهبود رفتار الگوریتم مزبور، در ایجاد تعادل بین اکتشاف و بهره بری بوده که در نتیجه منجر به بهبود عملکرد الگوریتم می گردد. مسئله ی mab بطور گسترده برای بررسی کردن مسئله ی ایجاد تعادل بین اکتشاف و بهره بری مورد استفاده قرار می گیرد.چالش انگیز ترین انواع mab، انواع غیر ایستای آنان است که عامل در آن با افزایش پیچیدگی در شناسایی تغییرات در محیط نیز روبروست. در این رساله، با یک مسئله ی mab غیر ایستا، زمان گسسته، با افق زمانی محدود، تعداد اکشن های محدود و پاداش گوئسی مواجه هستیم. در ادامه، برای حل این مسئله یک الگوریتم ژنیک کد حقیقی بر اساس کنترلر فازی احتمالی تطبیقی معرفی و مورد استفاده قرار می گیرد. با استفاده از نتایج شبیه سازی شده ی بدست آمده توسط رهیافت های ارائه شده در این رساله، این نتیجه ی مهم حاصل می گردد که استفاده از کنترلر های فازی احتمالی تطبیقی برای کنترل پارامترهای الگوریتم های ژنتیک،بنا بر بررسی های آماری باعث بهبود در ایجاد تعادل بین بهره بری و اکتشاف شده و در نتیجه عملکرد الگوریتم مزبور را بهبود می بخشد.

محاسبه سرعت حفاری با روش ترکیبی "تخمینگر فازی و مدل کلاسیک یانگ"
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390
  حمیدرضا مرادی   محمدباقر نقیبی سیستانی

فیزیک حفاری در تمام جهان یکسان است اما شرایط زمین، تجربه ی پیمانکار، در دسترس بودن امکانات، مشخصات چاه و عوامل مختلف دیگر نه تنها باعث ایجاد تغییرات وسیع در اجرا و کیفیت حفاری می شود بلکه موجب تغییرات وسیع در هزینه و زمان پیش بینی شده برای حفاری نیز می گردد. با توجه به اینکه این پروژه ها معمولا با ارقام بالا و بصورت مناقصه ای در اختیار پیمانکاران قرار می گیرند لذا تخمین نرخ سرعت حفاری می تواند در ارائه یک پیشنهاد مناسب با ریسک پایین برای پیمانکاران بسیار سودمند باشد. در نتیجه تخمین نرخ سرعت حفاری توجه بسیار زیادی را در دهه های اخیر به خود جلب کرده است. با توجه به اینکه فرایند حفاری تحت تاثیر عوامل و اتفاقات نامعین و تصادفی زیادی قرار می گیرد لذا تخمین نرخ سرعت حفاری به یک مساله پیچیده تبدیل شده است. تکنیک های متفاوتی برای غلبه بر این پیچیدگی ها ارائه شده است، و در میان روشهای ارائه شده مدل بورگوین و یانگ بیشترین توفیق را داشته است. این روش ضمن تخمین سرعت حفاری تاثیر هر یک از عوامل حفاری را نیز بر نرخ سرعت حفاری نشان می دهد. در این تحقیق ابتدا یک مدل هوشمند برای جایگزینی مدل یانگ ارائه شده است که متشکل از یک سیستم فازی است و پارامتر های این سیستم توسط "سردسازی تدریجی" بهینه شده است. . همچنین در این الگوریتم روش نوینی برای خوشه بندی داده ها ارائه می شود، که احتیاجی به ناظر برای خوشه بندی ندارد. در این روش با استفاده از فیلتر "چگالی احتمال فرضی" (که اولین بار برای رهگیری هدف ارائه شده بود) خوشه بندی داده ها انجام شده است. سپس معایب این روش برشمارده شده و برای حل این معایب روش دیگری نیز ارائه شده که در آن مدل یانگ با سیستم فازی ترکیب شده است. این مدل علاوه بر داشتن تمام ویژگی های مدل یانگ می تواند حداقل 45% نرخ حفاری را بهتر پیش بینی کند. داده های استفاده شده در این تحقیق از نه چاه در منطقه خانگیران سرخس ایران بدست آمده است.

بهینه سازی مدیریت سرمایه در گردش با استفاده از شبکه های عصبی مصنوعی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده علوم اداری و اقتصاد 1392
  سعید سمائی رهنی   محمدحسین ودیعی

با توجه به نقش مهم مدیریت سرمایه در گردش در تحقق اهداف شرکت و ایجاد سودآوری برای شرکت ها، بهینه سازی شاخص های مدیریت سرمایه در گردش، به منظور افزایش اثربخشی و کاهش هزینه ها در تصمیمات مربوط به اجرای سیاست های سرمایه در گردش ضروری به نظر می رسد. در این پژوهش به منظور بهینه سازی مدیریت سرمایه در گردش از شاخص های دوره ی گردش حساب های دریافتنی، دوره گردش موجودی کالا، دوره گردش حساب های پرداختنی و دوره تبدیل وجه نقد به عنوان شاخص های کارایی مدیریت سرمایه در گردش استفاده شده است. درصد سود و زیان عملیاتی خالص به مجموع دارایی ها نیز به عنوان معیار سودآوری شرکت در نظر گرفته شد. با استفاده از تکنیک شبکه های عصبی مصنوعی ابتدا رفتار بین متغیر های مستقل و وابسته ی پژوهش مدلسازی شد و سپس به کمک تکنیک جستجوی فراگیر متغیر های بهینه ی مستقل بدست آمدند. این پژوهش به تفکیک، برای 16 گروه از شرکت ها (رایانه و فعالیت های وابسته، ماشین آلات و دستگاه های برقی - محصولات چوبی و محصولات کاغذی - مواد و محصولات دارویی - فراورده های نفتی، کک و سوخت هسته ای – فلزات اساسی – قند و شکر – انواع فراورده های غذایی و آشامیدنی به جز قند و شکر – استخراج کانی های فلزی – محصولات کانی غیر فلزی – کاشی و سرامیک – خودرو و ساخت قطعات – لاستیک و پلاستیک – ساخت محصولات فلزی – ماشین آلات و تجهیزات – مواد و محصولات شیمیایی – سیمان، آهک و گچ) صورت گرفت و نتایج آن حاکی از این است که سطح بهینه ی شاخص های سرمایه در گردش برای هر یک از گروه شرکت ها قابل محاسبه و متفاوت از یکدیگراست.

تولید بلا درنگ مسیر بهینه رویت گر در ردیابی هدف فقط با زاویه سمت در حضور محدودیت های حس گر و محیط
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  امیرحسین نایبی آستانه   محمدباقر نقیبی سیستانی

در سال های اخیر، ربات های خودمختار در صنایع مختلف مورد توجه بسیاری قرار گرفته اند. ویژگی مهم این دسته از ربات ها انجام عملیات مورد نظر در شرایط خطرناک و پرزحمت بدون حضور انسان است. یکی از قابلیت های ربات های خودمختار توانایی آنها در ردیابی هدف می باشد. برای این منظور لازم است از حس گرهایی استفاده شود که سمت و یا فاصله نسبی هدف تا ربات (رویت گر) را اندازه گیری کنند. یکی از مسائل اساسی در زمینه ردیابی هدف، هنگامی که حس گر تنها سمت هدف را اندازه گیری می کند، وابسته بودن دقت تخمین به مسیر حرکت رویت گر می باشد. به عبارت دیگر بعضی از مسیرها منجر به تخمین بهتری از موقعیت هدف نسبت به سایر مسیرها می شوند. موضوع این رساله تعیین مسیر بهینه رویت گر در تخمین پارامترهای حرکت (حالت) هدف متحرک می باشد به طوری که دقت تخمین افزایش یابد. کارهایی که تا کنون در این زمینه انجام شده است یا قابل پیاده سازی به صورت بلادرنگ نیستند و یا قیودی که در عمل در محیط و حس گر وجود دارند را به طور کامل در نظر نمی گیرند در حالیکه وجود این قیود به طور مستقیم بر مسیر بهینه تاثیر می گذارند. در این رساله دو روش جدید و بلادرنگ برای تعیین مسیر بهینه رویت گر با در نظر گرفتن قیود مختلف ارائه شده است. در روش اول با در نظر گرفتن معیار بهینگی در یک گام به جلو (osaotg)، مکان بهینه رویت گر به صورت بلادرنگ در لحظه بعد تعیین می شود. قید میدان دید محدود رویت گر، قید وجود مانع در مسیر حرکت رویت گر و همچنین قید مانورپذیری محدود رویت گر در این روش در نظر گرفته شده است. از ویژگی دیگر این روش لحاظ نمودن حرکت هدف در تعیین مسیر بهینه رویت گر می باشد. در روش دوم بر اساس معیار بهینگی در لحظه نهایی یک قانون کنترل (cpotg) ارائه می شود که کورس رویت گر را به سمت هدف مرتبط می سازد. این روش نیز به صورت بلادرنگ و با در نظر گرفتن قید محدودیت میدان دید رویت گر، مسیر بهینه را تعیین می نماید. کارایی این دو روش نه تنها با شبیه سازی بلکه به صورت عملی نیز در کنترل یک ربات متحرک مجهز به یک دوربین به عنوان حس گر زاویه سمت نشان داده شده است.

پایش وضعیت پیشگیرانه بر مبنای کنترل فازی برای یک واحد پتروشیمی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  حمیدرضا قبادی   محمدباقر نقیبی سیستانی

اغلب اتفاق می افتد که با مشاهده یک وضعیت و یا رفتار بخصوص در حال کار که معمولاً با ابزار و وسایل خاصی صورت گرفته، فهمیده می شود که یک حادثه در حال شکل گیری و وقوع است و ممکن است باعث شکست و ازکارافتادگی وسیله­ای گردد. این گونه علائم به صورت ناگهانی اتفاق نمی­افتد بلکه ایجاد آن ها به شکلی است که به نحوی قابل تشخیص است و با استفاده از این تشخیص و قبل از ایجاد حادثه اقدام های لازم انجام و به سمت منبع اشکال هدایت می گردد و اقدامات پیشگیرانه را در مورد رفع و حذف دلیل شکست به عمل می­آورند. منطق فازی توسط دکتر لطفی زاده پروفسور دانشگاه کالیفرنیا، ارائه گردید ایشان این طور استدلال نمودند که بشر به ورودی های اطلاعاتی دقیق نیازی ندارد و اگر ما کنترل کننده های فیدبک را در سیستم ها طوری طراحی کنیم که بتواند داده های مبهم را دریافت کند، این داده ها می توانند به طور ساده در عمل اجرا شوند. در رهیافت زیر سعی بر آن شده است تا با توجه بر یکسری داده­ها که از آن به عنوان عوامل دخیل درروند کار تجهیز یاد می­کنیم، به پایش وضعیت ماشین­آلات بپردازیم. باید توجه داشت که برخی از این ورودی­ها به شکلی معنادار با یکدیگر مرتبط بوده و پایش آن­ها به صورت ترکیبی گاهاً موجب تسریع درروند عیب­یابی و حذف اغتشاشات احتمالی می­گردد، علاوه بر این نکته در پروژه حاضر طبقه بندی ای نیز جهت میزان اهمیت تجهیزات و سطح مهارت تکنسین­های موجود انجام گرفته است که در واحدهای بزرگ صنعتی نظیر نیروگاه­ها، می­تواند سهم چشمگیری در کاهش خطا­های انسانی و راهنمایی بهره­برداران بهنگام وقوع عیب در تجهیزات مختلف ­گردد. نهایتاً سیستم هوشمندی بر پایه موارد مذکور طراحی گردیده شد و صحت آن با اعمال چندین ورودی واقعی به سیستم و مقایسه خروجی­ها با روش­های موجود آزمایش گردید، نتایج گویای آن است که سیستم حاضر در امر تسریع عیب­یابی پیش از وقوع خطا، موثر بوده و استرس­های نابجای سیستم را کاهش می­دهد.

حل برخط بازی های دیفرانسیلی افق نامحدود برای سیستم های دینامیک-نامعین زمان-پیوسته با استفاده از الگوریتم های یادگیری تقویتی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  شعله یاسینی   علی کریم پور

بازیهای دیفرانسیلی امروزه کاربردهای گسترده در زمینه های مختلف از جمله سیستمهای مخابرات بیسیم و شبکه، سیستمهای اقتصادی و راهبرد های دفاعی یافته اند. حل بازیهای دیفرانسیلی تکیه بر حل معادلات همیلتون-جاکوبی دارد. حل این معادلات در حالت غیرخطی بسیار مشکل بوده و ممکن است حتی در موارد ساده فاقد حل تحلیلی سرتاسری باشند. اکثر روش¬های ارائه شده برای حل این معادلات، روشهای تقریبی برون خطی هستند که در آنها دینامیک سیستم کاملا معین میباشد. در این رساله، سه الگوریتم برخط برای یافتن حل تقریبی بازیهای دیفرانسیلی دونفره مجموع-صفر و چندنفره مجموع-غیرصفر ارائه گردیده است: الگوریتم یادگیری تقویتی همزمان، الگوریتم برنامه ریزی پویای تطبیقی و الگوریتم یادگیری تقویتی انتگرال. مزیت عمده استفاده از یادگیری تقویتی این است که زمینه برای حضور کنترل تطبیقی فراهم میشود و بنابراین میتوان با ترکیب یادگیری تقویتی و شبکه های عصبی، الگوریتم های کنترل بهینه تطبیقی برای سیستم های با دینامیک نامعین ارائه کرد. در روشهای کنترل بهینه تطبیقی، شرط تحریک پایا چالشی است که این تکنیکها را در دست یافتن به تخمین مناسب پارامترهای سیستم محدود نموده است. تمامی روشهای پیشین کنترل بهینه تطبیقی برای حل بازیهای دیفرانسیلی مجموع-صفر و مجموع-غیرصفر نیاز به بررسی شرط تحریک پایا برای تضمین همگرایی الگوریتم به نقطه تعادل بهینه دارند. در این رساله، با استفاده از رویکرد جدید یادگیری همزمان، به شرط محدود کننده تحریک پایا غلبه گردیده و بجای آن شرایط کافی و آسان برای تضمین همگرائی پارامترها بدست آمده است. پایداری سیستم با استفاده از تکنیک لیاپانف تضمین شده و علاوه بر آن، همگرائی به نقطه تعادل نش بازی در همه حالتهای مذکور نشان داده شده است.

شبیه سازی چندعاملی بازار برق به کمک الگوریتم یادگیری تقویتی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1387
  بهزاد نصیری   محمدباقر نقیبی سیستانی

چکیده ندارد.

بخش بندی فازی تعمیم یافته ی مسیرهای فیبری بافت سفید مغز حاصل از dt-mri
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1387
  علیرضا مهرتاش   محمدباقر نقیبی سیستانی

در این پایان نامه، شیوه ای جدید برای مساله خوشه بندی رشته های فیبری بافت سفید مغز، حاصل از تصاویر ام.آر.آی تانسور انتشاری (dt-mri) ارائه شده است. در حال حاضر تصویر برداری انتشار تنها روش موجود در مطالعه ویژگی های بافت سفید مغز انسان زنده می باشد. دنبال کردن بردار ویژه های اصلی تانسورها جهت بازسازی مسیرها با عمل tractography روشی متداول در مشاهده و تحلیل تصاویر dt-mri است. گروه بندی مسیرهای فیبری در دسته های آناتومیکی مربوط، تحلیل و ارائه نتیجه گیری های مناسب ازاین داده ها را ممکن می سازد. اخیرا روش های گوناگونی به منظور خوشه بندی فیبر های بافت سفید ارائه شده است. الگوریتم پیشنهادی برتری های بسیاری نسبت به روش های قبلی دارا می باشد. الگوریتم خوشه بندی ارائه شده نوعی تعمیم برای الگوریتم خوشه بندی فازی کلاسیک می باشد. در مساله خوشه بندی رشته های فیبری بافت سفید مغز، اشیاء، رشته های فیبری می باشند که از منظر ریاضیاتی به صورت منحنی های سه بعدی نمونه برداری شده مدل می شوند. برای پیاده سازی و به کار گرفتن یک الگوریتم خوشه بندی فازی بر روی این نوع خاص از داده ها، روابط ریاضی و برخی تعریف ها به گونه ای مناسب تعمیم داده شدند و با تعریف مفهوم درخت پروتو تایپ دسته (bundle prototype tree)، bpt امکان انجام مقایسه دقیق میان فیبرهای مختلف و پروتوتایپ هر دسته فیبری فراهم شده است. همچنین برای اولین بار به جای در نظر گرفتن تنها یک معیار شباهت برای بررسی نزدیکی فیبرها، از ترکیب تمامی عوامل شباهت از جمله فاصله، شکل، طول و نقاط ابتدایی و انتهایی به شکل مناسبی بهره برده ایم. نتایج حاصل از این روش موجب افزایش سرعت دسته بندی در کنار افزایش دقت روش و مقاوم بودن الگوریتم در برابر نویز و outlier ها می گردد.

طراحی مسیر در مساله نقشه‎ ‎یابی و مکان‎ ‎یابی ربات متحرک
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1388
  علی ایزدی پور   محمدباقر نقیبی سیستانی

یافتن مختصات عوارض زمینی و شاخص های یک محیط ناشناخته از دیرباز مورد بحث دانشمندان گوناگون قرار ‏داشته است. اگر تخمین مکان شاخص ها توسط ربات متحرکی که مختصات محلی آن معلوم است انجام شود به ‏این مساله نقشه یابی گویند. مساله یافتن مکان ربات در یک محیط معلوم نیز به مکان یابی مشهور است. حال ‏اگر عمل اکتشاف و جستجوی ربات متحرک در محیطی کاملا ناشناخته و نامعلوم انجام شود، ربات قادر به ‏یافتن مکان خود یا یافتن نقشه محیط به صورت مجزا نیست و برای انجام جستجو در این قبیل محیط ها، می ‏بایست از ترکیب همزمان این دو که به مسأله ‏simultaneous localization and mapping ‎‎(slam)‎‏ معروف است، استفاده شود. تا به امروز روش های مختلفی برای حل مسأله ‏slam‏ ارائه شده اند ‏که از آن جمله می توان به فیلترهای کالمن توسعه یافته و فیلترهای ذره ای اشاره کرد. در مساله ‏slam‏ وجود ‏نقاط میانی به عنوان نقاطی که بین نقطه شروع و پایان قرار گرفته و گذر ربات از آن ها باعث بالا رفتن دقت ‏نقشه تولیدی می شود، بسیار تاثیرگذار است و جایابی بهینه آن ها حائز اهمیت می باشد. ‏ در این رساله نگارنده با ارائه و اعمال پیشنهادها و روش هایی سعی بر بالا بردن دقت نقشه نولیدی توسط ربات ‏متحرک داشته است. لذا این رساله در دو گام به حل مسئله فوق می پردازد: در گام نخست، فرض شده است که ‏مکان شاخص ها در محیط مشخص است و به منظور یافتن مسیر همواری که حداکثر محیط را پوشش داده و به ‏صورت عملی قابل پیاده سازی باشد، از منحنی های ‏cubic spline‏ استفاده شده است. از آنجایی که این ‏مسیرها شامل دسته وسیعی از منحنی های ‏spline‏ می باشند، پس از معرفی معیار بهینگی یک مسیر، ابزار ‏دسته بندی ‏svm‏ به منظور برچسب زدن و جداسازی مسیرهای بهینه از غیربهینه مورد استفاده قرار گرفته ‏است. معیار بهینگی مسیر حداکثرسازی پاداش دریافت شده توسط ربات و حداقل سازی مجموع مربعات خطای ‏مسیر(‏sse‏) حرکت ربات از شاخص ها می باشد. علت استفاده از ابزار ‏svm، پیاده سازی ‏online‏ این مساله ‏در محیط های عملی است. در انتها از الگوریتم هوشمند یادگیری تقویتی به منظور جایابی بهینه مکان نقاط ‏میانی استفاده گردیده است. در این مرحله هدف، یافتن نقشه محیط در حداقل زمان، حداقل انرژی و در عین ‏حال حداکثر پوشش محیط است.‏ در گام دوم فرض خواهیم کرد که مکان شاخص ها و ربات نامشخص بوده و محل بهینه نقاط میانی توسط یک ‏ناظر انسانی آگاه تعیین شده است. به منظور تخمین مکان ربات و شاخص ها ابزار تخمینگر فیلتر کالمن توسعه ‏یافته، استفاده شده است. جهت بررسی دقیق عدم قطعیت های موجود در محیط و اثر گردش های تند ربات بر ‏تخمین، شبیه سازی در دو محیط مقیاس بزرگ و مقیاس متوسط انجام گرفته و نیز رهیافت هایی به منظور بالا ‏بردن دقت نقشه ارائه و اعمال گردیده اند که نتایج حاصل از اعمال آن ها مورد مقایسه قرار گرفته است.‏