نام پژوهشگر: جواد دوگانی آغچغلو

کاوش قوانین وابستگی در جریانات سریع داده
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1391
  جواد دوگانی آغچغلو   محمدهادی صدرالدینی

کشف قوانین وابستگی (association rule) یکی از پرکاربردترین الگوهاییاست که توسط داده کاوی استخراج می گردند و به معنای یافتن همه قوانین موجود در مشاهده اقلام مجمو عه های داده ای است.مهمترین فاز یافتن قوانین وابستگی، یافتن الگوهای پرتکرار می باشد. کشف قوانین وابستگی در جریان سریع داده ها با مشکلاتی روبروست. با توجه به ماهیت جریان داده ای، امکان ذخیره سازی داده های ورودی و مرور دوباره آنها وجود نداشته و می بایست به جای جواب های دقیق به دنبال جواب های نسبی باشیم که تا حد امکان به جواب های دقیق نزدیک باشند. به دلیل این محدودیت ها، به جای یافتن همه الگوهای پرتکرار به دنبال زیرمجموعه ای از آنها هستیم که در عین حال جزء جذاب ترین آنها نیز باشند.در این رساله نوع خاصی از الگوهای پرتکرار به نام الگوهای پرتکرار را معرفی نموده و الگوریتم جدیدی مبتنی بر پنجره کشویی برای کاوش آن معرفی می نماییم. این بخش جذاب ترین الگوها را از میان کلیه الگوهای پرتکرار انتخاب می نماید. برای رسیدن به این منطور از ساختمان داده ای پویا برای نگهداری نتایج ارزیابی در هر لحظه استفاده می گردد. از آنجایی که داده هایی که اخیرا مشاهده گردیده اند دارای اولویت بیشتری نسبت به داده های قدیمی می باشند از پنجره کشویی برای نگهداری این داده ها استفاده می گردد. جریان داده ورودی به پنجره هایی تقسیم می گردد. در واقع واحد عملیات به روز رسانی، پنجره می باشد. در این راستا از داده های مکمل داده ورودی برای رسیدن به هدف استفاده می گردد. استفاده از داده های مکمل پیپیدگی محاسباتی را کاهش خواهد داد. در نهایت روش پیشنهاد شده با استفاده از یک سری مجموعه های داده ای استاندارد مورد ارزیابی قرار گرفته و با سایر الگوریتم های ارائه شده در این زمینه مورد مقایسه قرار گرفته است. نتایج، بیانگر کیفیت روش معرفی شده در مقایسه با سایر روش ها از لحاظ زمان اجرا و همچنین کیفیت جواب های تولیدی می باشد.