مدل جدیدی برای جستجوی عبارت بر اساس کمینه جابهجایی وزندار
author
Abstract:
Finding high-quality web pages is one of the most important tasks of search engines. The relevance between the documents found and the query searched depends on the user observation and increases the complexity of ranking algorithms. The other issue is that users often explore just the first 10 to 20 results while millions of pages related to a query may exist. So search engines have to use suitable algorithms with high performance to find the most relevant pages. The ranking section is an important part of search engines. Ranking is a process in which the web page quality is estimated by the search engine. There are two main methods for ranking web pages. In the first method, ranking is done based on the documents’ content (traditional rankings). Models, such as Boolean model, probability model and vector space model are used to rank documents based on their contents. In the second method, based on the graph, web connections and the importance of web pages, ranking process is performed. Based on researches on search engines, the majority of user queries is more than one term. For queries with more than one term, two models can be used. The first model assumes that query terms are independent of each other while the second model considers a location and order dependency between query terms. Experiments show that in the majority of queries there are dependencies between terms. One of the parameters that can specify dependencies between query terms is the distance between query terms in the document. In this paper, a new definition of distance based on Minimum Weighted Displacement Model (MWDM) of document terms to accommodate the query terms is presented. In the Minimum Weighted Displacement Model (MWDM), we call the minimum number of words moving a text to match the query term by space. In addition, because most of the ranking algorithms use the TF (Term Frequency) to score documents and for queries more than one term, there is no clear definition of these parameters; in this paper, according to the new distance concept, Phrase Frequency and Inverted Document Frequency are defined. Also, algorithms to calculate them are presented. The results of the proposed algorithm compared with multiple corresponding algorithms shows a favorable increase in average precision.
similar resources
بررسی میزان استفاده از اینترنت برای جستجوی اطلاعات سلامت در میان زنان بر اساس مدل پذیرش فناوری (TAM)
چکیده: زمینه و هدف: امروزه اینترنت به یکی از منابع مهم برای جستجوی اطلاعات سلامت تبدیل شده است که یکی از مهمترین گروههای استفاده کننده از آن برای جستجوی اطلاعات سلامت را زنان تشکیل میدهند. مواد و روشها: مطالعه حاضر یک پژوهش کمی از نوع توصیفی- تحلیلی است و استفاده از اینترنت برای جستجوی اطلاعات سلامت در میان زنان را با استفاده از مدل پذیرش فناوری مورد ارزیابی قرار داده است. ابزار مورد استفاده ...
full textامدادرسانی زمانمند بر اساس جستجوی فراکتال
پس از وقوع بحران، آمادگی برایامدادرسانی کارآمدنقشی اساسی در کاهش هزینهها و تلفات انسانی احتمالی حادثه خواهد داشت. امدادرسانی بهعنوان یکی از مهمترین مراحل توسعه سامانههای مدیریت بحران شناخته میشود. به منظور توسعه رویکردی کارا برای امدادرسانی زمانمند، در این پژوهش به حل مسئلهای بر اساس مسئله مسیریابی موجودی با وضعیت چند دورهای و چند کالایی پرداخته شده است. جهت حل مدل، از یک الگوریتم بهبود...
full textزیرگونه جدیدی از سنجد تلخ (Elaeagnus rhamnoides (L.) A.Nelson) برای ایران بر اساس دادههای مولکولی
سنجد تلخ (Elaeagnus rhamnoides (L.) A.Nelson) گیاهی دارویی، مقاوم به خشکی، تثبیتکننده ازت و یک گونه پیشآهنگ جنگلی است. در این پژوهش برای اولین بار در ایران، شناسایی مولکولی سنجد تلخ در رویشگاههای مختلف کشور و مقایسه آنها با زیرگونههای شناخته شده در سایر نقاط جهان انجام شد. از پنج رویشگاه در استانهای البرز، مازندران، آذربایجانشرقی و غربی و قزوین نمونهبرداری انجام گردید. از نشانگر هستها...
full textتعیین شاخص سوز باد استان اصفهان بر اساس دمای کمینه
آب و هوا تاثیر بسیار مهمی در حیات موجودات زنده کره زمین دارد. وزش باد با دما اثر تلفیقی احساس محیط را ایجاد مینماید، بطوریکه به کاهش دما همراه با باد، سوزباد و برعکس آن گرم باد اطلاق میشود. در این تحقیق سوزباد دمای کمینه در استان اصفهان مورد بررسی قرار گرفت. دمای کمینه و سرعت وزش باد برای 10 ایستگاه همدیدی استان طی دوره آماری 1372 تا 1394 از سازمان هواشناسی کشور تهیه گردید. نتایج نشان داد...
full textرشد درونزا: یک مدل جستجوی تصادفی برای فن آوری جدید
این مقاله رشد درونزا، بر پویایی مدلی در انباشت دانش تاکید دارد. با توجه به نا اطمینانی موجود در هر فرایند جستجو، مدل یک ساختار پویای تصادفی که در آن فن آوری و انباشت دانش مکمل همدیگر می باشند ارائه میکند که هر یک از دو موتور رشد انباشت سرمایه و فن آوری تا یک نقطه مکمل همدیگر می باشند و بعد از آن تاثیر هریک مقید به سطح دیگری است. نشان داده میشود که هر دو عامل انباشت سرمایه و پیشرفت فن آوری برا...
full textاصلاح مدل بیلان حجمی با بهبود عبارت ذخیره سطحی برای آبیاری جویچه ای
راندمان سیستمهای آبیاری سطحی در ایران بسیار پائین است. در صورتیکه بتوان پارامترهای مهم و موثر در طراحیآبیاری سطحی، از قبیل فرصت نفوذ و زمان پیشروی را در ازای یک دبی مشخصبه خوبی برآورد کرد، میتوانراندمان کاربرد این سیستم را به مقدار قابل توجهی افزایش داد. مدل بیلان حجمی یکی از مدلهای ساده و رایج درطراحی و ارزیابی آبیاری جویچهای میباشد. با توجه به فرضیاتی که در مدل بیلان حجمی اعمال میشود دقت این ...
full textMy Resources
Journal title
volume 15 issue 4
pages 71- 84
publication date 2019-03
By following a journal you will be notified via email when a new issue of this journal is published.
No Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023