نام پژوهشگر: شفیق پارسازاد
شفیق پارسازاد هادی صدوقی یزدی
طبقه بندی و ارتباط، شایع ترین مسائل در داده کاوی برای استخراج دانش، یادگیری ماشین، تخمین ، دسته بندی و ابزار مهمی برای برآورد و پیش بینی هستند. هدف طبقهبندی دادهها، سازماندهی و تخصیص دادهها به کلاسهای مجزا میباشد. در این فرآیند بر اساس دادههای توزیع شده، مدل اولیهای آموزش داده میشود و سپس این مدل برای پیشگویی کلاس دادهی جدید مورد استفاده قرار می گیرد. در این پایان نامه مدل جدیدی برای طبقه بندی داده ها با الهام گرفتن از قانون انرژی پتانسیل گرانشی در بین ذرات به نام "طبقه بندی مبتنی بر جاذبه" ارایه شده است. مبنای اصلی در این طبقه بند یافتن مکان تعادل برای جداساز می باشد. در روش پیشنهادی داده ها به صورت ذرات دارای جرم و ثابت، که بر اساس قانون جهانی گرانش نیوتن با یکدیگر در تعامل هستند، مدل شده اند. انرژی پتانسیل، نوعی انرژی ذخیره شده است. انرژی پتانسیل، اثری سیستمی است و برای جسمی کاملاً منزوی وجود ندارد. جسم به اعتبار کمیت مکانی اش نسبت به سایر اجسامی که بر آن نیرو وارد می کنند و یا به دلیل موقعیت مکانی اش در میدانی که بر آن نیرو وارد می کنند، دارای انرژی پتانسیل است. هیچ جسم منفردی انرژی پتانسیل ندارد. همه اجسامی که برهمکنش متقابل دارند، به طور جمعی انرژی ذخیره می کنند.در مدل مطرح شده، پیکربندی پایدار وضعیتی می باشد که انرژی پتانسیل گرانشی حداقل باشد. بنابراین برای حل این مسأله بایستی انرژی پتانسیل گرانشی طبقه بند را معین و سعی در کمینه کردن آن نماییم. برای ارزیابی کارایی، ابتدا الگوریتم پیشنهادی به صورت تحلیلی مورد بررسی قرار گرفته و رسیدن به جواب بهینه سراسری برای آن اثبات شده است. سپس از دیدگاه های مختلف، ساختار و جایگاه آن مورد بررسی قرار گرفته است. در نهایت با کمک آزمایشاتی که بر روی مجموعه داده های مصنوعی، uci و هم چنین مجموعه داده های پزشکی در زمینه تشخیص سرطان انجام گرفته، کارایی الگوریتم نمایش داده شده است. این روش از قابلیت استفاده برای داده های نویزی، داده های با توزیع نامتوازن و داده هایی که اهمیت متفاوتی دارند، برخوردار می باشد. در بخش پایانی ضمن بررسی نقاط ضعف و قوت این روش، راه کارهایی برای بهبود عملکرد الگوریتم از جمله استفاده در کاربردهای برخط ارایه شده است.