نام پژوهشگر: احمد ژولاشکری
احمد ژولاشکری محمدحسین سرایی
با پیشرفت های اخیر در فناوری اطلاعات و ذخیره سازی در کامپیوتر، مقدار داده ذخیره شده در پایگاه های داده فراتر از آن است که بتوان داده ها را بدون استفاده از شیوه های تحلیلی خودکار تحلیل کرد. علیرغم این که اطلاعات زیادی در این مجموعه دادهها نهفته است، این اطلاعات مستقیماً در اختیار کاربرها قرار ندارد. داده کاوی فرایندی است که در آن دانش نهفته در میان انبوهی از داده ها استخراج می گردد. دانش مفهومی فراتر از داده و اطلاعات است. دانش استنتاج کردن و شناخت الگوها و روندهای پنهان میان داده ها و اطلاعات است. داده کاوی انواع مختلفی دارد. در این پایان نامه کاوش قوانین وابستگی به عنوان یکی از مورد توجه ترین انواع داده کاوی دنبال می شود. قوانین وابستگی تلاش در کشف الگوهای رخداد همزمان صفت های خاصه در پایگاه داده را دارند. در این نمونه از کاربرد داده کاوی رابطه ها و وابستگی های جالب بالقوه میان داده ها تشخیص داده می شود. در سال های اخیر کشف شده که اطلاعات وابسته به زمان در داده کاوی مهم است و در کشف قانونها و الگوها، زمان نیز باید در نظر گرفته شود. در این پایاننامه بعد زمان در روش های بحث شده برای کاوش مورد توجه قرار گرفته است. جنبههای زمانی زیادی وجود دارند که میتوانند برای تشریح جنبههای زمانی دانش با الگوهای به دست آمده مرتبط شوند. از جمله این جنبهها میتوان فاصله اعتبار برای یک الگو را نام برد. یعنی به همراه قانون وابستگی، فاصلهای از زمان آورده می شود که نشان میدهد قانون مذکور در چه موقعی از زمان معتبر است. بنابراین با معلوم شدن فاصله زمانی یک الگو، سودمندی دانش به دست آمده افزایش مییابد. یکی دیگر از ویژگیهای زمانی مورد توجه در دادهکاوی زمانی که میتواند برای تشریح جنبههای زمانی دانش با الگویهای به دست آمده مرتبط شود، دوره یک رویداد است. یک سری از رخ دادهای تکرار شونده از یک نوع رویداد معین در فاصلههای منظم به عنوان یک رویداد دورهای بیان میشود. هنگامی که زمان در کاوش قوانین وابستگی منظور شود، کاوش قوانین وابستگی زمانی مطرح شده است. در این پایان نامه هر دو عامل فاصله زمانی و دوره زمانی در کاوش قوانین وابستگی زمانی مورد توجه قرار گرفته است. به منظور ایجاد طرحی انعطاف پذیر برای بیان زمان اعتبار قانون ها، یکی از سیستم های ارایه شده را توسعه داده ایم. این طرح از زمان های مطابق با تقویم برای کاوش و نمایش قانون ها استفاده می کند، لذا قانون های تولید شده می توانند مفهومی دقیق و مناسب در کاربردهای عملی داشته باشند . طرح مذکور را به گونهای تعمیم داده ایم که توانایی نمایش دوره های زمانی را به صورتی بهتر و کامل تر داشته باشد. دوره های زمان در طرح پیشنهادی دارای انعطاف پذیری بیشتری است و علاوه بر توانایی نمایش دوره های بیان شده در سیستم قبل، قادر به نمایش دوره های پیچیده تر زمان نیز می باشد. علاوه بر توسعه نحوه بیان دوره های زمان، فاصلههای زمان را نیز در سیستم مذکور اعمال کرده ایم که باعث افزایش بیشتر دقت زمان برقراری قانون ها می شود. بنابراین تغییرات صورت گرفته در سیستم زمان قانون های وابستگی باعث دقیق تر شدن زمان مرتبط با هر قانون می شود که به سودمندی بیستر قانون ها منجر می شود. علاوه بر این نتایج پیاده سازی نشان می دهد که این تغییرات باعث کشف قانون های بیشتری نسبت به قبل از داده های یکسان می شود.