نام پژوهشگر: کوثر کاظمی زرکویی

پویش محیطی و تحول کاوی با ابزارهای متن کاوی و مدل ریاضی مورد متون فناوری اطلاعات و سلامت
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده فنی مهندسی 1388
  کوثر کاظمی زرکویی   محمد مهدی سپهری

با گسترش اینترنت و پایگاه های داده متعدد در حوزه ها و علوم مختلف، شاهد رشد نمایی داده ها هستیم. داده کاوی ابزاری نیرومند و کارا جهت کشف الگوهای پنهان، جالب توجه، غیر منتظره و با ارزش از داده های ساخت یافته ای است که در جداول این پایگاه ها نگهداری می شوند. اما بسیاری از داده های در اختیار ما مانند گزارش های علمی و خبری تحت وب غیر ساخت یافته و به صورت متن هستند. بازیابی و استخراج اطلاعات از این نوع داده ها و به کارگیری تکنیکهای داده کاوی برای کشف دانش موجود در آنها متن کاوی نامیده می شود. یکی از کاربردهای مهم متن کاوی، فراهم نمودن دانش مورد نیاز برای پشتیبانی تصمیم گیری در فرایند پویش محیطی است. این اطلاعات به منظور تصمیم گیری های استراتژیک در اختیار مدیران قرار می گیرد. در این تحقیق ضمن شناسایی روندهای موجود در حوزه فناوری و سلامت با استفاده از تکنیک قواعد انجمنی، یک مدل برنامه ریزی ریاضی برای بهبود فرایند همتاگزینی قواعد کاوش شده در دو دوره زمانی ارائه گردیده است. داده های مورد نیاز برای انجام تحقیق از اینترنت و با قالب html جمع آوری شده اند. پس از طی مراحل بازیابی اطلاعات شامل "زدودن نشانه ها و استخراج متن اصلی خبر"، "شکستن متن به کلمه ها"، "زدودن کلمه های معمولی و پرتکرار" و "ریشه یابی کلمات"؛ از روش شمارش df برای انتخاب مشخصه و از روش وزن دهی tf-idf برای دسته بندی و فیلترینگ خبرها استفاده شده است. مرحله استخراج اطلاعات نیز شامل کاوش قواعد انجمنی، شناسایی روندها و تحول کاوی می باشد. دستاورد این تحقیق، متن کاوی اخبار اینترنتی با موضوع "فناوری اطلاعات و سلامت" و کشف روندها و تغییرات آنها در طول زمان (تحول کاوی) و نوآوری این تحقیق، توسعه روش جدیدی برای همتاگزینی قواعد کاوش شده در فرایند تحول کاوی می باشد.