انتخاب بهینه ی کلمات کلیدی برای موتور های جستجو

پایان نامه
چکیده

به طور کلی، روش های ارائه شده جهت استخراج خودکار کلمات کلیدی، سعی در بدست آوردن نتایج بهتر در معیارهایی مانند بازخوانی و دقت دارند. اگرچه این معیارها، میزان کارایی روش استخراج کلمات کلیدی در نقش یک انسان را نشان می دهد اما با توجه به نقش غیرقابل انکار موتورهای جستجو در دنیای امروز، به نظر می رسد که در انتخاب کلمات کلیدی علاوه بر توجه به معیارهای رایج بازیابی اطلاعات باید به افزایش میزان دسترسی پذیری متن توسط موتورهای جستجو نیز توجه ویژه ای شود. در این تحقیق روشی جدید برای استخراج خودکار کلمات کلیدی ارائه شده است که همزمان با افزایش دسترسی پذیری متن، امتیاز مناسبی در معیارهای بازخوانی و دقت نیز کسب می کند. روش ارائه برای استخراج کلمات کلیدی از دو تابع امتیاز دهی استفاده می کند: تابع امتیاز دهی به کلمات کلیدی و تابع ارزیابی میزان دسترسی پذیری. تابع اول سعی در بالا بردن بازخوانی و دقت دارد در حالیکه تابع دوم در طول فرایند آموزش با استفاده از الگوریتم ژنتیک و بازخوردهای موتورهای جستجو به بهینه سازی ضرایب خصوصیات درتابع اول می پردازد. همچنین در این پروژه با بهره گیری از کلمات برجسته ساز، فرایند پس پردازشی ارائه شده که با گزینش نهایی کلمات کلیدی از میان لیست کلمات کاندید، منجر به بهبود کارایی روش در معیار دقت می شود. آزمایشات نشان می دهد که با به کارگیری تعداد تکرار مناسب در طی فرایند آموزش و ایجاد موازنه منطقی در کسب هریک از سه معیار یاد شده می توان به نتایج مطلوبی در هر سه معیار دست یافت.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه روشی برای استخراج کلمات کلیدی و وزن‌دهی کلمات برای بهبود طبقه‌بندی متون فارسی

Due to ever-increasing information expansion and existing huge amount of unstructured documents, usage of keywords plays a very important role in information retrieval. Because of a manually-extraction of keywords faces various challenges, their automated extraction seems inevitable. In this research, it has been tried to use a thesaurus, (a structured word-net) to automatically extract them. A...

متن کامل

جستجوی کلمات کلیدی در رشته ی گفتار

تشخیص کلمات کلیدی یا keyword-spotting در حالت کلی به معنای یافتن یک کلمهی کلیدی در یک پروندهی نوشتاری و یا گفتاری است. در این تحقیق، یک روش جدید تشخیص یا بازشناسی کلمات کلیدی در زبان فارسی، در دوحالت پیوسته و گسسته معرفی شده است. در هر دوحالت تشخیص کلمات کلیدی در گفتار پیوسته و گسسته، از روش dynamic time warping(dtw) استفاده شده است که با سیستمهایی که بر اساس مدل مخفی مارکوف طراحی شده و امروزه ...

ارائه روشی جدید برای شاخص‌گذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشه‌بندی متون

Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, i...

متن کامل

روش جدید متن‌کاوی برای استخراج اطلاعات زمینه کاربر به‌منظور بهبود رتبه‌بندی نتایج موتور جستجو

Today, the importance of text processing and its usages is well known among researchers and students. The amount of textual, documental materials increase day by day. So we need useful ways to save them and retrieve information from these materials. For example, search engines such as Google, Yahoo, Bing and etc. need to read so many web documents and retrieve the most similar ones to the user ...

متن کامل

ارزیابی تراکم کلمات کلیدی در وب سایت های برتر کتابخانه مرکزی دانشگاه های علوم پزشکی ایران

امروزه وب، اصلی‌ترین ابزار دسترسی و اشاعه اطلاعات به شمار می‌رود، به گونه‌ای که کتابخانه‌ها و مراکز اطلاع‌رسانی، بسیاری از خدمات خود را از طریق وب به کاربران ارائه می‌دهند. بررسی‌ها حاکی از آن است که توانایی وب‌سایتها در تبلیغ و بازاریابی خدمات کتابخانه‌ها و مراکز اطلاع‌رسانی به اثبات رسیده است. از دلایل اصلی موفقیت در بازاریابی، امکان بازیابی سریع و دقیق اطلاعات از وب‌سایت کتابخانه‌ها ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023