نام پژوهشگر: اشرف السادات حیدری یزدی
اشرف السادات حیدری یزدی محسن کاهانی
روز به روز در کاربردهای بیشتری از قبیل مدل سازی ترافیک، شبکه های حسگر و دنبال کردن در کاربردهای نظامی، پردازش داده های برخط و غیره، شاهد تولید هر روزه حجم عظیمی از داده های جریان دارهستیم. کشف دانش بهینه از این جریان های داده، یک حوزه تحقیقاتی فعال در داده کاوی با کاربردهای متفاوت بوجود آورده است. برخلاف داده های ایستای موجود در پایگاه داده های سنتی، داده های جریان دار اغلب به صورت پیوسته با سرعت بالا و با حجم زیاد و همچنین با توزیع داده متغیر دریافت می شود. از طرفی مقادیر آنتولوژی ها و حاشیه نویسی هایمعنایی موجود بر روی داده ها نیز به طور پیوسته در حال افزایش می باشد. این نوع داده های پیچیده و ناهمگن چالش های جدیدی را در حوزه تحقیقاتی داده کاوی بوجود آورده است. اصلی ترین چالش در این مسأله، نیاز فناوری های کاوش قوانین انجمنی به تراکنش ها می باشد، در حالی که در داده های معنایی تعریف دقیقی از تراکنش وجود ندارد. کارهای مشابهی که در این زمینه انجام گردیده اند، اغلب با کمک کاربر تراکنش ها را برای داده های معنایی تعریفکرده و سپس به کمک الگوریتم های داده کاوی سنتی اقدام به کاوش قوانین انجمنی از این تراکنش ها می نمایند و لازمه این کار تسلط کاربر به ساختار داده های معنایی و دامنه کاربرد مورد نظر می باشد. لذا روشی مورد نیاز است که انسجام معنایی را در تمام مراحل کار برقرار سازد و تعریفی کلی و یکپارچه برای تراکنش ها و سایر مفاهیم مرتبط ارائه دهد. بنابراین در اینتحقیق به ارائه روشی جهت رفع چالش های ذکر شده و امکان پذیر ساختن پردازش حجم وسیع داده های معنایی جریان دار موجود و کشف و ذخیره سازی قوانین انجمنی جدید در سطح معنایی بالاتر با استفاده از غنای معنایی مفاهیم موجود در آنتولوژی و بهره وری از دیگر فناوری های معنایی پرداخته شده است.