نام پژوهشگر: محمد جواد زمردیان

وفقی سازی الگوریتم نزدیکترین همسایه برای دسته بندی داده های جریانی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز 1390
  محمد جواد زمردیان   منصور ذوالقدری جهرمی

امروزه در بسیاری از کاربرد ها، جریان داده به سرعت و در حجم زیاد تولید می شود. یکی از روش های با اهمیت در کاوش داده، دسته بندی آن است. از چالش های مهم دسته بندی جریان داده، تغییر مفهوم داده با گذشت زمان است که نیاز به، به روز رسانی مدل دسته بندی را مطرح می کند. تاکنون بسیاری از روش های سنتی دسته بندی داده برای تعامل با جریان داده بهبود داده شده اند. یکی از این الگوریتم های سنتی یادگیری، الگوریتم نزدیکترین همسایه است که یکی از الگوریتم های جذاب حوزه داده کاوی است. الگوریتم نزدیکترین همسایه با توجه به مکانیزم ساده تصمیم گیری در تحقیقات گذشته بسیار مورد توجه قرار گرفته است. این الگوریتم برای دسته بندی داده های جریانی با مشکلاتی مواجه خواهد شد که یکی از این مشکلات حجم نمونه ها است. ضمنا تعیین تعداد همسایه ها نیز برای تصمیم گیری این الگوریتم چالش برانگیز است. در این رساله دسته بندی جدیدی مبتنی بر الگوریتم نزدیکترین همسایه پیشنهاد شده است. مدل افزایشی این دسته بندی کننده، برای دسته بندی جریان داده بکار رفته است. سرعت مناسب یادگیری، انعطاف پذیری در زمان پاسخ و پایداری در برابر اغتشاش از مزایای این روش افزایشی هستند. دقت روش پیشنهادی با روش-های شناخته شده در این حوزه روی مجموعه داده های استاندارد واقعی و مصنوعی مقایسه شده است. نتایج بدست آمده حاکی از بهبود دقت، زمان و حافظه در روش افزایشی پیشنهادی است