نام پژوهشگر: رسول دژکام
رسول دژکام محمدرضا مطش بروجرودی
رشد بی رویه داده های روی وب اداره و کاوش اطلاعات را مشکل می سازد. هدف وب معنایی آن است که پایگاه دانش معنایی را به صفحات وب که شامل ابرمتون زبان طبیعی می باشند، اضافه نماید، تا قدرت جستجوی عمیق و جامعیت اطلاعات را بوجود آورد. از آنجا که ساخت یک پایگاه داده و هستان شناسی بصورت دستی بسیار هزینه بر و زمان گیر است، مانعی بر سر راه پیشرفت فعالیت های وب معنایی می باشد. به همین دلیل محققین سعی دارند برای دنیای وب هستان شناسی ها را بطور خودکار تولید نمایند، تا هدف وب معنایی محقق شود. همچنین باید روش هایی جهت ارزیابی هستان شناسی های خودکار ساخت بوجود آید، تا بتوان به نقاط ضعف و قوت روش های ساخت خودکار پی برد و به روش های بهتری دست یافت. در این پژوهش ابزاری را که توسعه داده ایم، توصیف می نماییم. این ابزار از روش راهکار دوگانه جهت استخراج اطلاعات هستان شناسی استفاده می نماید و هستان شناسی را بطور خودکار با جستجو بر روی موتور جستجوی سایت pubmed ایجاد می نماید. این روش ابتدا مهم ترین دانش ارایه شده در هر مقاله را استخراج و ذخیره می نماید، سپس با تحلیل اطلاعات استخراج شده و ذخیره شده، هستان شناسی را ایجاد می کند. در پایان با یک طرح ارزیابی جامع هستان شناسی خودکار ساخت را با هستان شناسی های متناظر دست ساخت مقایسه می نماییم. روش ارزیابی ما از دسته تکنیک های ارزیابی کاربردهای زبان طبیعی می باشد.