نام پژوهشگر: صمد قادری مجاوری
صمد قادری مجاوری زرین تاج برنایی
در دنیای بشدت رقابتی امروز، اطلاعات بعنوان یکی از فاکتورهای تولیدی مهم پدیدار شده است و تلاش برای استخراج اطلاعات از داده ها توجه بسیاری از افراد دخیل در صنعت اطلاعات و حوزه های وابسته را به خود جلب نموده است. تعداد زیادی از شرکت ها، سازمان ها و مراکز تجاری و دولتی، دارای مراکز داده ای با حجم بالایی هستند و در میان انبوه داده ای خود، نیاز به دسترسی سریع به اطلاعات جهت اخذ تصمیم گیری های مدیریتی دارند. لذا مجتمع شدن این حجم از داده در پایگاه های داده ای و انجام عملیات کشف دانش و داده کاوی بر روی این منابع امری ضروری است که می تواند به سازمان مربوطه در رسیدن هر چه بهتر به اهداف نهایی اش یاری رسانده و با ارائه گزارشاتی که از دل الگوهای پنهان و احتمالا سودمند پایگاه های داده ای بیرون می آورد، تاثیر چشم گیری در نحوه تصمیم گیری مدیران و روند عملیاتی سازمان ایفا کند. قواعد انجمنی را می توان یکی از پرکاربرد ترین و مفید ترین این الگو ها بر شمرد که به عنوان مساله مهمی در راستای عملیات کشف دانش و کاوش داده ای پدیدار شده است. کاوش قواعد انجمنی به عملیات کشف مجموعه ای از ویژگی های مشترک میان تعداد زیادی از اشیاء موجود در پایگاه داده ای اطلاق میشود. در این میان، کاوش داده های حجیم و ادامه دار، که با سرعت بالایی انباشت می شوند، چالش های جدید و فراوانی را پیش روی روش های کشف دانش و قواعد انجمنی موجود قرار داده است و در نهایت منجر به رسیدن به این نتیجه شد، که دیگر نمی توان با الگوریتم های قدیمی که بر روی پایگاه های داده ای سنتی اعمال می شد اقدام به انجام عملیات داده کاوی نمود. بنابراین تلاش های بسیاری در جهت ارتقاء روش های موجود انجام شد که در اینجا سعی در معرفی و بیان این چالش ها و روش های کارامد پیش روی آن و ارائه روشی نوین جهت کشف مجموعه اقلام تکراری جریان های داده ای بر پایه ساختار گراف می نمائیم. در این تحقیق، رویکردی نوین در استخراج مجموعه اقلام تکراری مورد نیاز جهت کاوش قواعد انجمنی جریان های داده ای ، با استفاده از ساختار گراف پیشنهادی، ارائه شده است، که این رویکرد بر خلاف روش های موجود، نه تنها کاملا مبتنی بر گراف جهت دار است بلکه می تواند با دریافت هر تراکنش به محض ورود، اقدام به اجرای عملیات کاوش با دقت 100% نموده و با استفاده از ساختاری بهینه، منجر به کاهش زمان پردازش و حافظه مصرفی شده و قابلیت نگهداری و به روز رسانی بدون محدودیت مجموعه اقلام را در حداکثر یک گذر از تراکنش ها فراهم سازد.