نام پژوهشگر: حسام عمرانپور
زینب ترابی دشتی حسام عمرانپور
خوشه بندی یکی از اعمال اصلی در داده کاوی می باشد که به معنای گروه بندی نمونه¬های مشابه است. این تکنیک به دنبال کشف ساختار در داده¬ها از طریق بررسی شباهت¬ها و تفاوت¬های میان آنهاست.به طورکلیدسته بندی متنوعی از الگوریتم¬های خوشه بندی وجود دارد.نوعیاز این دسته بندی الگوریتم¬ها رابه دو دسته روش¬های تفکیکی و روش¬های سلسله مراتبی تقسیم می کند.در این پایان نامه به یکی از الگوریتم¬هایخوشه بندی تفکیکی به نامk-medoids پرداخته شده است. الگوریتم خوشه بندی pam یکی از اولین و ساده ترین انواع الگوریتم k-medoids به شمار می آید که به دلیل انتخاب تصادفی اشیاء نماینده و غیرنماینده در ابتدای الگوریتمبه بهینه محلی همگرا بوده و لزوما جواب بهینه رادر خوشه بندی تولید نمی کند. در این مقاله با استفاده از الگوریتم بهینه سازی گروه ذرات، دو روش جهت بهبود این الگوریتم خوشه بندی ارائه شده است. اولین روش پیشنهادی از الگوریتم بهینه سازی گروه ذرات درجهت خوشه بندی داده ها با هدف بهینه نمودن تابع هزینه در الگوریتم pam استفاده شده است. در دومین روش پیشنهادی به ترکیب دو الگوریتم مذکور (pso+pam) می پردازیم، که هدف از به کار بردن الگوریتم بهینه سازی گروه ذرات در این مدل ترکیبی، تعیین بهترین غیر نماینده ها در الگوریتم pamاست. در بخش ارزیابی، دو الگوریتم جدید با مجموعه داده های مختلف تست و نتایج حاصل از آنها با الگوریتم خوشه بندی pamمقایسه میشود. بررسی نتایج بدست آمده نشان می دهد که الگوریتم ترکیبی پیشنهادی نسبت به سایر الگوریتمهای خوشه بندی مورد بررسی از کارایی و اثربخشی بالاتری جهت خروج از مینیمم محلی و رسیدن جواب بهینه خوشه بندی برخوردار است.
ساره امیدی همایون موتمنی
چکیده امروزه با گسترش شبکه جهانی اینترنت، مدیاهای دیجیتال به آسانی در اختیار ما قرار می گیرند. این مدیاهای دیجیتال شامل عکس، صدا، ویدئو می باشند که از تخلف کپی رایت، دستکاری اطلاعات و توزیع غیر قانونی زیان و خسارت زیادی را متحمل می شوند. حفاظت از این داده های دیجیتالی یک مسئله بسیار مهم است، در واقع توانایی جایگذاری اطلاعات امنیتی در داخل مولتی مدیاها امروزه به یک نیاز فوری تبدیل شده است. مطالعاتی که دراین زمینه انجام شده است، نشان می دهد یکی از راه حل های مناسب برای این مسئله نهان نگاری دیجیتالی است. هدف از نهان نگاری، پنهان کردن اطلاعات در ساختار دیجیتال است. در نهان نگاری با توجه به کاربردهای مختلف، مقاومت در برابر تغییرات نیز اهمیت دارد. این پایان نامه، نهان نگاری را به عنوان یکی از مباحث مهم در حفاظت از رسانه ها مورد توجه قرار می دهد. اکثر محققان معتقدند که بیشتر الگوریتم های نهان نگاری دارای ضعف می باشند. لذا یک روش نهان نگاری غیرقابل مشاهده و مبتنی بر تکنیک تبدیل موجک گسسته که از الگوریتم توده ذرات جهت افزایش استحکام استفاده شده است، پیشنهاد می گردد. در مرحله جایگذاری تصویر میزبان وتصویر واترمارک به چهار زیر مجموعه ll,hl,lh,hh تقسیم می شود و نهان نگاری در مجموعه ll از تصویر میزبان انجام میشود. دراستخراج تصویر نهان نگاری واترمارک از الگوریتم توده ذرات جهت انتخاب یک فاکتور مقیاس مناسب استفاده می شود. پیاده سازی این پایان نامه در نرم افزار matlab 2011 انجام میشود.
ناهید نخعی حسام عمرانپور
در این پایانامه سعی شده است با الهام گرفتن از روشهای موجود کاهش ابعاد و ترکیب الگوریتم بهینه سازی گروه ذرات با مسئله دسته بندی روش جدیدی در حیطه کاهش ابعاد ارائه شود.
سعیده پولادخانی حسام عمرانپور
در این پایان نامه یک روش حل مسائل دسته بندی ارائه می شود. کرنلها در روشهای حل مسائل دسته بندی کاربرد بسیاری دارند. با استفاده از کرنل، داده ها به فضایی با ابعاد بالاتر انتقال داده می شوند. به طور ایده آل انتظار می رود که در این فضا داده های مشابه در کنار یکدیگر قرار بگیرند. نو آوری این پایان نامه در به کار گرفتن روش دسته بندی k نزدیکترین همسایه در این فضا است. این عمل از نظر تئوری عملکرد مناسبی خواهد داشت. کرنل ها پارامترهایی دارند که با تغییر آنها داده ها به فضاهای با توزیع متفاوتی نگاشت می شوند. لذا با استفاده از روش بهینه سازی گروه ذرات به یافتن مقدار بهینه این پارامتر ها پرداخته می شود. لذا با تنظیم این پارامترها به دقت بالاتری دست می یابیم. نوآوری دیگر این پایان نامه به کار بردن مقدار k در روش دسته بندی k نزدیکترین همسایه به صورت گسسته در بازنمایی ذرات روش بهینه سازی است. برای ارزیابی، روش پیشنهادی روی داده های معیار استاندارد uci پیاده سازی شده اند. نتایج نشان دهنده این است که روش پیشنهادی به دقت بالاتری نسبت به سایر روشهای دسته بندی دست یافته است.
رضا شش بلوکی حسام عمرانپور
دسته بندی یا تعیین نوع کلاس در یادگیری ماشین از اهمیت بسزایی برخوردار است. در واقع طبقه بندی اطلاعات روشی است که در همه علوم خواه یا ناخواه استفاده میشود. در علم کامپیوتر روش های بسیاری برای این مهم وجود دارد. هر روش نقطه ضعف و نقطه قوت خاص خود را دارد. اما در بعضی مواقع تنها یک روش برای طبقه بندی اطلاعات کافی نیست و مجبوریم که از چند روش و بررسی نتایج آنها این کار را انجام دهیم. راه های زیادی برای ترکیب طبقه بندی اطلاعات وجود دارد. اما با تغییر در روند ترکیب اطلاعات به روش دقیق تری دست پیدا میکنیم که بالطبع نتایج بهتری حاصل میشود. در روش پیشنهادی قبل از اجرای ترکیب دسته بندی کننده ها بر روی دسته بندی کننده ها عمل خوشه بندی صورت میگیرد. نوع الگوریتم خوشه بندیو همچنین تعداد کلاس ها یا لیبل ها اهمیتی ندارد. ما میتوانیم به روش های مختلف مانند k-means یا dbscan یا روش های دیگر خوشه بندی را انجام دهیم. بعد از انجام خوشه بندی و ایجاد کلاس های مختلف ، روی هر کلاس چند عمل کلاسه بندی)طبقه بندی( با روش های مختلف انجام میشود. هر روش خطای مربوط به خود را دارد. بعد از انجام این کار طبقه بندی کننده ها یا کلاسیفایر ها با هم ادغام شده. به بیان دیگر نتایج کلاسیفایر ها بررسی میشود و هر داده ای بنا به روش ترکیب کلاسیفایر مربوط به یک کلاس خاص میشود. الگوریتم ها و روش های زیادی برای ترکیب کلاسیفایر ها وجود دارد که در این پژوهش از الگوریتم adaboost که زیر مجموعه الگوریتم بوستینگ است استفاده شده. شرط استفاده از الگوریتم adaboost این است که کلاسیفایر ها نتایج بهتر از 5 % یا تصادفی داشته باشند.