نام پژوهشگر: مریم خرازی

کشف روابط ریشه واژه های قرآنی با رویکرد داده کاوی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده صنایع 1390
  مریم خرازی   سمیه علیزاده

همان گونه که می دانیم، داده کاوی به معنای استخراج دانش و کشف الگوهای پنهان از پایگاه داده های بسیار بزرگ می باشد. داده کاوی موجب تحول عظیمی در استفاده از داده ها شده است به گونه ای که پا را از استخراج اطلاعات فراتر گذاشته و به کشف دانش نهفته در دل داده ها می پردازد. شاخه ای از داده کاوی که اصلی ترین منابع داده ای بشر یعنی مستندات متنی را پوشش می دهد، متن کاوی نام دارد. متن کاوی در واقع پیش پردازش قوی متون غیر ساخت یافته برای استفاده از تکنیک های داده کاوی روی پایگاه داده های ساخت یافته است. مهم ترین منبع متنی در اختیار انسان ها، قرآن کریم است. در گذشته، پروژه های آماری و داده کاوی زیادی بر روی این گنجینه دانش انجام شده است. در این پژوهش سعی شده با پیش پردازش پایگاه داده قرآن کریم و استفاده از قواعد تلازمی، برای کشف باهمآیی ریشه های قرآنی، تلاشی نو صورت گیرد و همچنین گراف روابط ریشه ها رسم گردد. در خلال این پژوهش، خوشه بندی روی سوره های قرآن انجام گرفته و از تکنیک هایی دسته بندی برای تفسیر موضوعی قرآن استفاده شده است.