نام پژوهشگر: راضیه زال

یک روش مبتنی بر یادگیری نیمه نظارتی برای طبقه بندی داده های چند رابطه ای
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی 1393
  محمد رضا کیوان پور

یکی از زمینه های کاربردی روش های یادگیری ماشین و تشخیص الگو در زمینه ی تجارت هوشمند برای سازمان ها می باشد. روش های تجارت هوشمند سازمان ها را قادر می سازد که تحلیل خردمندانه ای داشته باشند و تصمیم های به موقع و هوشمندانه اخذ کنند که تغییرات قابل ملاحظه ای در رقابت خود و شرایط بازار ایجاد کنند. بنابراین کاوش دانش روی داده های واقعی با استفاده از روش های یادگیری ماشین بسیار پرارزش می باشد. هرچند، قابلیت های روش های تشخیص الگو و یادگیری ماشین در مسیر اصلی تجارت هوشمند نتوانسته جایگاه اصلی خود را پیدا کند، مانع کلیدی برای این امر عدم سازگاری بین شکل های داده های ورودی برای اکثر روش های یادگیری ماشین و شکل های استفاده شده برای داده های سازمان-های واقعی می باشد. برای شرح دقیق تر علت عدم سازگاری می توان به این نکته اشاره کرد که بیشتر داده های جهان واقعی(سازمان ها) در چندین رابطه از پایگاه داده های رابطه ای موجود هستند. در همین راستا روش های داده کاوی چند رابطه ای مطرح شده اند که الگوهایی را که درگیر در چندین جدول از پایگاه داده های رابطه ای می باشند، را جستجو می کند. از جمله روش های مطرح شده در حوزه ی داده کاوی چند رابطه ای، روش های داده کاوی چند رابطه ای مبتنی بر یادگیری چند دیدی می باشند، اما این روش های پیشنهاد شده از اطلاعات همبستگی و مفید بین دیدها کاملا بهره نمی برند، پس نیاز به ارائه روشی می باشد که بتواند اطلاعات مفید بین دیدها را استخراج کند و در روند یادگیری از آن ها استفاده کند. همچنین، در کاوش پایگاه داده های رابطه ای، استفاده از روش های یادگیری نظارتی اغلب به دلیل هزینه-ی بالا برای برچسب زدن داده ها، کارآمد نیست. به همین دلیل در سال های اخیر علاقه مندی برای الگوریتم هایی که بتوانند هم از داده های برچسب دار و هم از داده های بدون برچسب برای کار پیش بینی استفاده کنند، افزایش یافته است. در این راستا، در این رساله سعی بر آن است که روش داده کاوی چند رابطه ای مبتنی بر یادگیری چند دیدی و یادگیری نیمه-نظارتی ارائه شود که بتواند از مزیت های هر دو رویکرد استفاده کند.