نتایج جستجو برای: دسته بندی متون rocchio
تعداد نتایج: 85655 فیلتر نتایج به سال:
امروزه با توجه به رشد روزافزون دسترسی به اسناد الکترونیکی از منابع مختلف، برای استفاده هر چه مفیدتر و دسترسی آسان به اسناد مطلوب، مساله دسته بندی خودکار اهمیت ویژه ای یافته است. این مساله هر چند در حوزه بازیابی اطلاعات قرار دارد اما روشهایی که در این زمینه بکار برده می شوند، روشهای هدایت شده یادگیری ماشین هستند.معمولا در این روشها، ساختن یک دسته بند با کارایی بالا نیاز به نمونه های برچسب خورده ...
Given a large amount of documents it is hard to find the documents that you need. These days most -if not allof these documents are available electronically. Information Retrieval (IR) systems help in finding the documents that satisfy the user’s information need. There are many techniques that are used by these IR systems. One of these techniques is learning classification. This technique uses...
The Rocchio relevance feedback algorithm is one of the most popular and widely applied learning methods from information retrieval. Here, a probabilistic analysis of this algorithm is presented in a text categorization framework. The analysis gives theoretical insight into the heuristics used in the Rocchio algorithm, particularly the word weighting scheme and the similarity metric. It also sug...
This paper concerns supervised classification of text. Rocchio, the method we choose for its efficiency and extensibility, is tested on three reference corpora "20NewsGroups", "OHSUMED" and "Reuters", using several similarity measures. Analyzing statistical results, many limitations are identified and discussed. In order to overcome these limitations, this paper presents two main solutions: fir...
امروزه با افزایش حجم داده ها امکان جمع آوری و دسته بندی سریع داده ها توسط انسان غیرممکن شده است و نیاز به دسته بندی و تحلیل دادها به صورت خودکار از جایگاه ویژه ای برخوردار است. دسته بندی داده ها عملیاتی است که ابتدا، طی یک فرایند ، نمونه های آموزشی به همراه برچسب آن ها به یک عامل یادگیر داده می شود تا ارتباط بین نمونه ها و برچسب ها را یاد بگیرد و سپس برچسب داده های آموزشی را پیش بینی کند. از ط...
در یادگیری ماشین، داده های آموزشی نقش مهمی را در تعیین کارایی الگوریتم یادگیری ایفا می کنند. تعداد این داده های آموزشی در طول زمان افزایش می یابد وداده های جدیدی از راه می رسد. این داده های جدید، ممکن است دید جدیدی از داده های قبلی را ارائه دهند یا توزیع آماری داده ها را تغییر دهند. از این رو، فهمیدن اهمیت داده های جدید و اجازه به این داده ها، برای نقش داشتن در آموزش، به منظور افزایش کارایی سیس...
An investigation has been conducted on two well known similarity-based learning approaches to text categorization: the k-nearest neighbor (k-NN) classifier and the Rocchio classifier. After identifying the weakness and strength of each technique, a new classifier called the kNN model-based classifier (kNNModel) has been proposed. It combines the strength of both k-NN and Rocchio. A text categor...
اکثر لغات جدید برای زبان آموزان زبان انگلیسی به صورت "دسته بندی های معنایی" از پیش طراحی شده اند، یعنی گروهی از کلمات که از لحاظ معنایی و نحوی شبیه به هم هستند مانند: چشم، بینی، گوش، دهان، چانه. اگر چه دسته بندی از این نوع، فعالیتهایی را که روش های فعلی برای آموزش زبان به کار می برند را تسهیل می کند و با نگاه اول به نظر می رسد یادگیری لغات را هم آسان می کند، اما هیچ توجیه عملی توسط محققان در حم...
دسته بندی یکی از مهمترین فرآیندهای مورد مطالعه در حوزه یادگیری ماشین و داده کاوی است که در برنامه های کاربردی فراوانی از جمله دسته بندی متن، تشخیص پزشکی، بیوانفورماتیک و... مورد استفاده قرار می گیرد. مسائل دسته بندی را می توان براساس تعداد برچسب های منتسب به هر یک از داده ها به دو دسته کلی مسائل دسته بندی تک برچسبی و مسائل دسته بندی چند برچسبی تقسیم کرد. در مسائل دسته بندی تک برچسبی، هر داده دا...
نمودار تعداد نتایج جستجو در هر سال
با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید