کاوش قوانین وابستگی در جریانات سریع داده

پایان نامه
چکیده

کشف قوانین وابستگی (association rule) یکی از پرکاربردترین الگوهاییاست که توسط داده کاوی استخراج می گردند و به معنای یافتن همه قوانین موجود در مشاهده اقلام مجمو عه های داده ای است.مهمترین فاز یافتن قوانین وابستگی، یافتن الگوهای پرتکرار می باشد. کشف قوانین وابستگی در جریان سریع داده ها با مشکلاتی روبروست. با توجه به ماهیت جریان داده ای، امکان ذخیره سازی داده های ورودی و مرور دوباره آنها وجود نداشته و می بایست به جای جواب های دقیق به دنبال جواب های نسبی باشیم که تا حد امکان به جواب های دقیق نزدیک باشند. به دلیل این محدودیت ها، به جای یافتن همه الگوهای پرتکرار به دنبال زیرمجموعه ای از آنها هستیم که در عین حال جزء جذاب ترین آنها نیز باشند.در این رساله نوع خاصی از الگوهای پرتکرار به نام الگوهای پرتکرار را معرفی نموده و الگوریتم جدیدی مبتنی بر پنجره کشویی برای کاوش آن معرفی می نماییم. این بخش جذاب ترین الگوها را از میان کلیه الگوهای پرتکرار انتخاب می نماید. برای رسیدن به این منطور از ساختمان داده ای پویا برای نگهداری نتایج ارزیابی در هر لحظه استفاده می گردد. از آنجایی که داده هایی که اخیرا مشاهده گردیده اند دارای اولویت بیشتری نسبت به داده های قدیمی می باشند از پنجره کشویی برای نگهداری این داده ها استفاده می گردد. جریان داده ورودی به پنجره هایی تقسیم می گردد. در واقع واحد عملیات به روز رسانی، پنجره می باشد. در این راستا از داده های مکمل داده ورودی برای رسیدن به هدف استفاده می گردد. استفاده از داده های مکمل پیپیدگی محاسباتی را کاهش خواهد داد. در نهایت روش پیشنهاد شده با استفاده از یک سری مجموعه های داده ای استاندارد مورد ارزیابی قرار گرفته و با سایر الگوریتم های ارائه شده در این زمینه مورد مقایسه قرار گرفته است. نتایج، بیانگر کیفیت روش معرفی شده در مقایسه با سایر روش ها از لحاظ زمان اجرا و همچنین کیفیت جواب های تولیدی می باشد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

توسعه فازی الگوریتم apriori برای کاوش قوانین وابستگی

در دنیای کنونی، اطلاعات به عنوان یکی از فاکتورهای تولیدی مهم مطرح است. در نتیجه، تلاش برای استخراج اطلاعات از داده ها از جمله چالش های اساسی در صنعت اطلاعات و حوزه های وابسته به آن است. حجم داده ها دائماً در حال رشد است و در همه ی محیط ها و به صورت متنوع در قالب های مختلف وجود دارد، که این نمایانگر پیچیدگی کار تبدیل داده ها به اطلاعات است. داده کاوی یکی از پیشرفت های اخیر در زمینه فناوری مدیریت ...

15 صفحه اول

بررسی وابستگی وقوع بیماری آسم آلرژیک با ویژگی های محیطی با استفاده از کاوش قوانین وابستگی مکانی فازی

آلرژی یکی از بیماری هایی است که به دلیل آلوده شدن محیط اطراف زندگی انسان به عوامل محرک آلرژی، در سالیان اخیر گسترش فزاینده ای داشته است. بهترین روش برای درمان بیماری آلرژی، شناسایی عامل آلرژی زا و سپس، دوری جستن از آن عامل است. در این میان، عوامل ناشناخته بسیاری هستند که می توانند موجب ایجاد آلرژی گردند که اغلب این عوامل از محیط زندگی افراد ناشی می شوند. این مقاله، به بررسی وابستگی میان وقوع نو...

متن کامل

کاوش قوانین وابستگی فازی با حفظ حریم شخصی

داده کاوی با حفظ محرمانگی داده ها زمینه تحقیقاتی جدیدی در دو دهه اخیر می باشد. در حقیقت هدف اصلی الگوریتم های داده کاوی با حفظ محرمانگی تغییر داده های پایگاه داده ورودی به گونه ای است که داده های خصوصی و همچنین دانش های محرمانه، حتی پس از عملیات داده کاوی محرمانه بمانند. کاوش قوانین وابستگی با حفظ محرمانگی یکی از تکنیک های اصلی داده کاوی با حفظ محرمانگی به شمار می آید و هدف آن جلوگیری از استخرا...

بررسی وابستگی وقوع بیماری آسم آلرژیک با ویژگی های محیطی با استفاده از کاوش قوانین وابستگی مکانی فازی

آلرژی یکی از بیماری هایی است که به دلیل آلوده شدن محیط اطراف زندگی انسان به عوامل محرک آلرژی، در سالیان اخیر گسترش فزاینده ای داشته است. بهترین روش برای درمان بیماری آلرژی، شناسایی عامل آلرژی زا و سپس، دوری جستن از آن عامل است. در این میان، عوامل ناشناخته بسیاری هستند که می توانند موجب ایجاد آلرژی گردند که اغلب این عوامل از محیط زندگی افراد ناشی می شوند. این مقاله، به بررسی وابستگی میان وقوع نو...

متن کامل

کاوش قوانین وابستگی زمانی مبتنی بر تقویم با استفاده از دوره های زمانی انعطاف پذیر

با پیشرفت های اخیر در فناوری اطلاعات و ذخیره سازی در کامپیوتر، مقدار داده ذخیره شده در پایگاه های داده فراتر از آن است که بتوان داده ها را بدون استفاده از شیوه های تحلیلی خودکار تحلیل کرد. علیرغم این که اطلاعات زیادی در این مجموعه داده‏ها نهفته است، این اطلاعات مستقیماً در اختیار کاربرها قرار ندارد. داده کاوی فرایندی است که در آن دانش نهفته در میان انبوهی از داده ها استخراج می گردد. دانش مفهومی ...

15 صفحه اول

بهبود کیفیت داده ها در کامل بودن داده با استفاده از قوانین وابستگی

در دنیای امروزی، فعالیت های سازمان ها و شرکت ها بیش از پیش بر اساس داده ها و اطلاعات حاصل از تحلیل آن ها است. بنابراین، کیفیت داده ها مسئله ی بسیار مهمی است، امّا معمولاً در مسائل داده کاوی و کشف دانش از پایگاه داده ها نادیده گرفته می شود و یا توجه زیادی به آن نمی شود. یکی از مهم ترین فاکتورهای کیفیت داده ها کامل بودن داده ها و مسئله ی داده های گمشده است. تاکنون تکنیک ها و روش های بسیار زیادی برا...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023