نام پژوهشگر: سهیلا شاهمرادی

کاوش k زیرگراف با بیشترین تکرار از گراف های جریانی
پایان نامه دانشگاه تربیت معلم - تهران - دانشکده مهندسی کامپیوتر 1391
  سهیلا شاهمرادی   منوچهر کلارستاقی

امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد. از سوی دیگر، امروزه نیز استفاده ی همگانی از وب و اینترنت ما را با حجم زیادی از داده و اطلاعات مواجه می کند. با این رشد انفجاری در داده های ذخیره شده، نیاز به روشهایی است که اصطلاحا به کشف دانش بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند. داده کاوی یکی از مهمترین این روشها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند. کشف الگوهای مکرر، به عنوان یکی از فرآیندهای مهم در دانش داده کاوی با چالش های مختلفی رو به رو است. استفاده از داده های جریانی جهت فرآیند کاوش- که از حجم و سرعت تولید بالا برخوردار هستند- یکی از این چالش ها است. در سال های اخیر افزایش سرعت ایجاد پایگاه داده های گراف موجب شده است که توجه فراوانی به داده کاوی میان گراف ها یا گراف کاوی جلب شود. در میان الگوهای متفاوتی که در پایگاه داده های گراف وجود دارد، کاوش زیرگراف های تکراری از اهمیت زیادی برخوردار است. زیرگراف تکراری زیرگرافی است که به صورت مکرر در پایگاه داده های گراف دیده می شود. کاوش گراف ها به خودی خود، یک امرمهم و چالش برانگیز است، وحتی این چالش، با پردازش داده های جریانی که در زمان واقعی استنتاج می شوند، پررنگ تر می شود. بیشتر کارهای قبلی در رابطه با کاوش الگوی گراف مکرر به تعیین یک حداقل حد آستانه ی پشتیبانی به منظور انجام کاوش نیاز دارند و در حالت ایستا در نظر گرفته شده اند (مورد کاوش قرار گرفته اند). با این حال بعضی مواقع تعیین مقدار مناسب حداقل پشتیبانی برای کاربران آسان نیست. بر همین اساس در این تحقیق ضمن بررسی کارهای موجود در زمینه ی کاوش زیرگراف های مکرر، یک الگوریتم موثر، به منظور کاوش الگوی گراف با k بیشترین تکرار بدون حداقل پشتیبانی با استفاده از مدل پنجره ی لغزان وزن دار در گراف های جریانی توسعه داده می شود. مطابق دانش کسب شده، این زمینه اولین کار بر روی کاوش زیرگراف های مکرر در گراف های غیرثابت جریانی است.