نام پژوهشگر: مهدیه حاجی محمد حسینی

ساخت خودکار ابرمتن در متن های فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی 1391
  مهدیه حاجی محمد حسینی   بهروز مینایی بیدگلی

در دسترس بودن متن های الکترونیک، کاربران را ترغیب به مطالعه ی آن ها می کند. به همین دلیل امکان دارد کاربر با نیازهای اطلاعاتی روبرو شود و به دنبال کسب اطلاعات بیشتر یا اطلاعات مرتبطی در مورد کلمه یا عبارت خاصی درون متن باشد. در این صورت نیاز به جستجوی درون متن پیدا کرده که در نتیجه ی آن امکان دارد با مشکلات مربوط به جستجو روبرو شود. ابرمتن، یک روش سریع برای بازیابی اطلاعات است. تبدیل دستی حجم زیادی از اسناد به ابرمتن زمان بر و گاهی ناممکن است. به همین دلیل در این مقاله، قصد پیاده سازی یک روش تبدیل خودکار متن ساده به ابرمتن را داریم. این فعالیت اولین پیاده سازی در مورد اسناد فارسی است. در این روش، با استفاده از شبکه ی عصبی som و دو فرآیند برچسب زنی و تحلیل آن ها، دو نوع پیوند از کلمات بیانگر موضوع اصلی و کلمات کم اهمیت تر سند ایجاد شدند. پیوندهای تک کلمات و عبارت های دو کلمه ایجاد شدند. داده های به کار گرفته شده مقاله هایی از مرکز تحقیقات علوم اسلامی بود. علاوه بر ساخت ابرمتن، روی ایجاد پیوند بین قطعات متنی هم تمرکز کردیم. این فعالیت، با پیاده سازی دو رویکرد، با استفاده از ملاک های cosine و dice انجام شد.