ایجاد خزشگر تاکیدی و هست شناسی برای موتور جستجوی معنایی در حوزه صفحات فارسی ict
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فناوری اطلاعات
- نویسنده علی فرهمندنژاد
- استاد راهنما حسن ابوالحسنی احمد فراهی
- سال انتشار 1388
چکیده
گسترش بیش از حد وب، نیاز بر سامانه های بازیابی اطلاعات را بیش از پیش نموده است. یکی از این دست سامانه ها، که تحقیقات بسیاری را معطوف خود نموده است، موتور های جستجو هستند. رشد نماییِ استفاده از موتور های جستجو در میان کاربران وب به اندازه ای است که بسیاری حتی در انجام کار های روزمره، استفاد از آن را در اولویت قرار می دهند. این میزان رشد نمایان گر نیاز بر تمرکز بیش از پیش بر توسعه موتور های جستجویی با قابلیت بیشتر در پاسخگویی به نیاز کاربران است. ازجمله نیاز های مهم کاربران، بازیابی صفحاتِ وب مبتی بر دامنه خاص، جستجوی دقیق تر، ارائه رهنمون های مناسب و رتبه بندی کارآمد صفحات وب است. این نیاز ها درطی تحقیقاتِ جامع منجر به معرفی مفاهیم معنایی در موتور های جستجو شده است. امروزه تمرکز بسیاری از توسعه دهندگان موتور های جستجو، مهاجرت از موتور های جستجوی نحوی خود به سمت موتور های جستجوی معنایی است. بیان انجام این مهاجرت در کلام ساده بوده و پیاده سازی آن نیاز به ممارست فراوان دارد. از جمله مشکلات موجود استخراج دانش دامنه ای و مبتنی بر زبانی است که موتور های جستجو با آن روبرو هستند. این پایان نامه آغاز نگرشی در جهت توسعه موتور های جستجوی معنایی به زبان فارسی در حوزه فناوری اطلاعات و ارتباطات است. بر اساس معماری ارائه شده برای موتور جستجوی معنایی خود، دو رویکرد مورد توجه بوده است. در بخش نخست از این پایان نامه مکانیزم خزش متمرکز مورد توجه بوده است. خزش گر یکی از مهم ترین و شکننده ترین مولفه هر موتور جستجو است که وظیفه استخراج صفحات وب به منظور استفاده های آتی، همانند یادگیری هست شناسی و ساخت شاخص، را بر عهده دارد. در این میان مکانیزم خزش متمرکز جدیدی ارائه و مورد ارزیابی قرار گرفت. در بخش دوم، یادگیری هست شناسی به عنوان زیربنای موتور های جستجوی معنایی مورد تحقیق و بررسی قرار گرفت. یادگیری هست شناسی در صفحاتِ حوزه فناوری اطلاعات و ارتباطات به زبان فارسی با مشکلات و نقیصه هایی همراه بوده که این نقیصه ها مورد بررسی قرار گرفته و لزوم پیاده سازی نرم افزار هایی در این باب به چالش کشیده شده است. بنابر الگوریتم های یادگیری هست شناسی مورد استفاده، مهم ترین نقطه ضعف در این حوزه عدم وجود نرم افزار هایی مناسب پردازش زبان طبیعی به زبان فارسی است.
منابع مشابه
ایجاد روش هایی برای اندیس گذاری, جستجو و رتبه بندی صفحات برای موتور جستجوی معنایی در حوزه صفحات فارسی ict
با توجه به رشد روزافزون اطلاعات و دانش, حجم¬های بسیار بالا از این اطلاعات و دانش¬ها موجود می باشد که جستجو برای یافتن اطلاعاتی خاص در آن¬ها, به دلیل حجم¬های بالای آنها دیگر کار آسانی نمی¬باشد. همواره نیاز به سیستم¬هایی که بتواند اطلاعات مورد نیاز افراد را فراهم کند احساس ¬شده است. چالش¬های فنی در مسیر طراحی این گونه سیستم¬ها را می¬توان در دسته¬های کلی تقسیم¬بندی کرد. می¬توان به نحوه ذخیره سازی ...
ریخت شناسی معنایی وزن در شعر فارسی
مفهوم « شکل اثر ادبی » که در آثار فرمالیستها اهمیت زیادی پیدا کرده است، به دو پیشنهاد مهم آنها وابسته است: 1) هر نکتة ادبی از واژه تا سخن، باید در پیوندی که با سایر نکته ها می یابد، بررسی گردد و شناخته شود و به این اعتبار شناخت ساختار یا شالودة اصلی اثر، مهمترین جنبةپژوهش ادبی است. 2) پژوهش «همزمانی » ــ که سوسور مطرح کرده است ــ روش اصلی پژوهش ادبی است. این مقاله، برآن است تا با مبنا قرار دادن...
متن کاملالگوهای تعامل و راهبردهای بازآرایی پرسوجو توسط کاربران در یک موتور جستجوی فارسی
فرایند جستجو در وب با زندگیِ برخط امروزی عجین شده است. موتورهای جستجو، با دریافت پرسوجوهای کاربران، تعداد محدودی از اسناد مرتبط را از میان چندین میلیارد صفحۀ وب بازیابی میکنند. بنابراین موتورهای جستجو با ثبت مجموعۀ پرسوجوهای کاربران در درازمدت میتوانند به مجموعهای از اطلاعات دربارۀ الگوهای رفتاری کاربران دست یابند. این الگوها میتوانند در فرایندهایی مانند گسترش پرسوجو، پیشنهاد پرسوجو و تص...
متن کاملآیا شرق شناسی را پایانی هست؟
ﺑﻪ ﻧﻈﺮ ﻣﻲ رﺳﺪ ﻫﻴﭻ ﮔﺮوﻫﻲ ﻛﻪ ﻧﻴﺴﺖ ﻣﺒﻬﻢ ، ﻗﺮﺑﺎﻧﻲ ﺗﺼﻮﻳﺮﺳﺎزی ﻣﺨﺪوش و اﻗﺘﺪارﻃﻠﺒﺎﻧﻪ ﻧﺸﺪه ﺑﺎﺷﺪ . ﺑﺮ اﻳﻦ اﺳﺎس ﻧﻈﺮﻳ اﻳﻦ ﻣﻘﺎﻟﻪ ﻗﺼﺪ دارد در ﭼﺎرﭼﻮب ﺔ ﺷﺮق» « ﺷﻨﺎﺳﻲ درﺑﺎر، ﺑﻪ ﺗﺤﻠﻴﻞ ﺗﺼﻮﻳﺮی ﺑﭙﺮدازد ﻛﻪ در آﺛﺎرﻣﻜﺘﻮب ﻛﺮد» ة « ﻫﺎ اراﺋﻪ ﺷﺪه اﺳﺖ .اﻳﻦ ﻣﻘﺎﻟﻪﻧﺸﺎن ﻣﻲ دﻫﺪ ﻛﻪ در اﺳﻨﺎد ﺑﺮرﺳﻲ ﺷﺪه ﻛﻠﻴﺸﻪ، ﻫﺎی ﺷﺮق ﺷﻨﺎﺳﺎﻧﻪ اﺳﺖ «ﻛﺮدﻫﺎ» در ﻣﻮرد اﻋﻤﺎل ﺷﺪه.
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فناوری اطلاعات
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023