نام پژوهشگر: محمدمهدی مدرسی

استفاده از مدل های آزمایشی بر پایه داده ها در تصفیه فاضلاب
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده عمران و محیط زیست 1393
  محمدمهدی مدرسی   احمد میرباقری

در این پایان نامه به بررسی روش های داده-هدایت شونده در تصفیه خانه ها پرداختیم. مشکلاتی از جمله خراب شدن سنسورهای اندازه گیری ، هزینه بر بودن اندازه گیری بعضی از پارامترهای یا مقایسه عملکردی سنسورهای اندازه گیری استفاده از این نوع مدل ها را در تصفیه خانه توجیح می-کند.از معایب این گونه مدل ها این است که به داده ها بسیار حساس هستند. از جمله مشکلات داده ها می توان به داده های خارج از محدوده ، نویز اندازه گیری وسایل ، مقادیر گمشده و رابطه خطی داده ها با یکدیگر اشاره کرد. از داده های تصفیه خانه شهرک قدس به مدت دو سال برای مدل سازی استفاده شده است که از هر پارامتر میزان 179 داده موجود داشتیم. در ابتدا به روش مرتبه بندی استاندارد و روش چشمی داده های خارج از محدوده با تعداد 19 عدد که می تواند تأثیر منفی در روند طراحی داشته باشند را از میزان دیتابیس حذف نمودیم . روند کار روش مرتبه بندی استاندارد بدین گونه است که داده ها را به گونه ای تغییر می دهیم که میانگین و انحراف معیار آن ها صفر شود و سپس داده های که قدر مطلق آنها از 2/5 بیشتر باشد به عنوان داده خارج از محدوده انتخاب می شود. سپس با استفاده از ماتریس همبستگی و روش som که روشی برای استخراج ویژگی است ، ارتباط خطی میان داده ها را نشان دادیم . در نهایت دو سناریو را انتخاب نمودیم. در مرحله بعد این دو سناریو را به دو روش خطی pls و pcr مدل کردیم. در روش های خطی پارامتر مهم میزان انتخاب اجزا اصلی می باشد که با استفاده از cross-validation این کار انجام گرفت. این روش به این گونه است که داده ها به دو دسته داده های آموزش داده های اعتبار سنجی تقسیم می شوند و از دادههای آموزش برای برازش مدل استفاده می کنیم و در نهایت میزان خطا برای دسته اعتبار سنجی تعیین می شود و مدلی با میزان اجزای اصلی انتخاب می شود که کمترین میزان خطا را در دسته اعتبار سنجی داشته باشد.در مرحله بعد دو سناریو به روش som برازش شدند که این روش به گونه ای روشی برای جایگزینی مقادیر گمشده به روش غیر خطی است. در نهایت دو سناریو به روش ann و روش ترکیبی som-ann مدل شدند که در هر دوی این روش ها داده ها به سه دسته آموزشی ، آزمایشی و اعتبار سنجی به نسبت 70% ، 15% و 15% تقسیم شدند. همچنین برای یافتن مدل با نرون های بهینه ، این دو سناریو با نرون های مختلف بین 5 تا 50 نرون در لایه میانی برای این دو سناریو ساخته شدند و مدلی که کمترین میزان خطا را در دسته اعتبار سنجی داشت به عنوان شبکه عصبی برتر شناخته شد. در روش ترکیبی از som به عنوان یک روش برازش استفاده شد که مقادیر خارج از محدوده و گمشده به وسیله این روش جایگزین شدند و مدل با استفاده از 179 داده ساخته شد. نتایج نشان از برتری روش های برازش غیر خطی داشتند که از میان روش ترکیبی som-ann با وجود داشتن داده های بیشتر نتایج بهتری را هم در برداشت. همچنین روش ann نسبت به روش pls , pcr و som برتری مشهودی داشت.