نام پژوهشگر: علی فرهمندنژاد

ایجاد خزشگر تاکیدی و هست شناسی برای موتور جستجوی معنایی در حوزه صفحات فارسی ict
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فناوری اطلاعات 1388
  علی فرهمندنژاد   حسن ابوالحسنی

گسترش بیش از حد وب، نیاز بر سامانه های بازیابی اطلاعات را بیش از پیش نموده است. یکی از این دست سامانه ها، که تحقیقات بسیاری را معطوف خود نموده است، موتور های جستجو هستند. رشد نماییِ استفاده از موتور های جستجو در میان کاربران وب به اندازه ای است که بسیاری حتی در انجام کار های روزمره، استفاد از آن را در اولویت قرار می دهند. این میزان رشد نمایان گر نیاز بر تمرکز بیش از پیش بر توسعه موتور های جستجویی با قابلیت بیشتر در پاسخگویی به نیاز کاربران است. ازجمله نیاز های مهم کاربران، بازیابی صفحاتِ وب مبتی بر دامنه خاص، جستجوی دقیق تر، ارائه رهنمون های مناسب و رتبه بندی کارآمد صفحات وب است. این نیاز ها درطی تحقیقاتِ جامع منجر به معرفی مفاهیم معنایی در موتور های جستجو شده است. امروزه تمرکز بسیاری از توسعه دهندگان موتور های جستجو، مهاجرت از موتور های جستجوی نحوی خود به سمت موتور های جستجوی معنایی است. بیان انجام این مهاجرت در کلام ساده بوده و پیاده سازی آن نیاز به ممارست فراوان دارد. از جمله مشکلات موجود استخراج دانش دامنه ای و مبتنی بر زبانی است که موتور های جستجو با آن روبرو هستند. این پایان نامه آغاز نگرشی در جهت توسعه موتور های جستجوی معنایی به زبان فارسی در حوزه فناوری اطلاعات و ارتباطات است. بر اساس معماری ارائه شده برای موتور جستجوی معنایی خود، دو رویکرد مورد توجه بوده است. در بخش نخست از این پایان نامه مکانیزم خزش متمرکز مورد توجه بوده است. خزش گر یکی از مهم ترین و شکننده ترین مولفه هر موتور جستجو است که وظیفه استخراج صفحات وب به منظور استفاده های آتی، همانند یادگیری هست شناسی و ساخت شاخص، را بر عهده دارد. در این میان مکانیزم خزش متمرکز جدیدی ارائه و مورد ارزیابی قرار گرفت. در بخش دوم، یادگیری هست شناسی به عنوان زیربنای موتور های جستجوی معنایی مورد تحقیق و بررسی قرار گرفت. یادگیری هست شناسی در صفحاتِ حوزه فناوری اطلاعات و ارتباطات به زبان فارسی با مشکلات و نقیصه هایی همراه بوده که این نقیصه ها مورد بررسی قرار گرفته و لزوم پیاده سازی نرم افزار هایی در این باب به چالش کشیده شده است. بنابر الگوریتم های یادگیری هست شناسی مورد استفاده، مهم ترین نقطه ضعف در این حوزه عدم وجود نرم افزار هایی مناسب پردازش زبان طبیعی به زبان فارسی است.