برچسب‌گذاری ادات سخن زبان فارسی با استفاده از مدل شبکۀ فازی

Authors

Abstract:

Part of speech tagging (POS tagging) is an ongoing research in natural language processing (NLP) applications. The process of classifying words into their parts of speech and labeling them accordingly is known as part-of-speech tagging, POS-tagging, or simply tagging. Parts of speech are also known as word classes or lexical categories. The purpose of POS tagging is determining the grammatical category of the words in a sentence. Grammatical and syntactical features of words are determined based on these tags. The function of existing tagging methods depends on the corpus. As if the educational and test data are extracted from a corpus, the methods are well-functioning, or if the number of educational data is low, especially in probabilistic methods, the accuracy level also decreases. The words used in sentences are often vague. For example, the word 'Mahrami' can be a noun or an adjective. Existing ambiguity can be eliminated by using neighbor words and an appropriate tagging method. Methods in this domain are divided into several categories such as:based on memory [2], rule based methods [5], statistical [6], and neural network [7]. The precision of more of these methods is an average of 95% [1]. In the paper [13], using the TnT probabilistic tagging and smoothing and variations on the estimation of the three-words likelihood function, a tagging model has been created that has reached 96.7% in total on the Penn Treebank and NEGRA entities. [14] Using the representation of the dependency network and extensive use of lexical features, such as the conditional continuity of the sequence of words, as well as the effective use of the foreground in the linear models of linear logarithms and fine-grained modeling of the unknown words, on the Penn Treebank WSJ model, 97.24% accuracy is achieved. The first work in Farsi that has used the word neighborhoods and the similarity distribution between them. The accuracy of the system is 57.5%. In [19], a Persian open source tagger called HunPoS was proposed. This tag uses the same TnT method based on the Hidden Markov model and a triple sequence of words, and 96.9% has reached on the ''Bi Jen Khan'' corpus. In this paper a statistical based method is proposed for Persian POS tagging. The limitations of statistical methods are reduced by introducing a fuzzy network model, such that the model is able to estimate more reliable parameters with a small set of training data. In this method, normalization is done as a preprocessing step and then the frequency of each word is estimated as a fuzzy function with respect to the corresponding tag. Then the fuzzy network model is formed and the weight of each edge is determined by means of a neural network and a membership function. Eventually, after the construction of a fuzzy network model for a sentence, the Viterbi algorithm as s subset of Hidden Markov Model (HMM) algorithms is used to specify the most probable path in the network. The goal of this paper is to solve a challenge of probabilistic methods when the data is low and estimation made by these models  is mistaken. The results of testing this method on ``Bi Jen Khan'' corpus verified that the proposed method has better performance than similar methods, like hidden Markov model, when fewer training examples are available. In this experiment, several times the data is divided into two groups of training and test with different sizes ascending. On the other hand, in the initial experiments, we reduced the train data size and, in subsequent experiments, increased its size and compared with the HMM algorithm. As shown in figure 4, the train and test set and are directly related to each other, as the error rate decreases with increasing the training set and vice versa. In tests, three criteria involving precision, recall and F1 have been used. In Table 4, the implementation of HMM models and a fuzzy network is compared with each other and the results are shown.  

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

منطق فازی تک‌نرم گزاره‌ای با ادات صدق

منطق تک‌نرم UL یک منطق فازی، زیرساختاری و نیمه‌ربطی است. سیستم گنتزن UL از حذف قواعد انقباض و تضعیف از سیستم گنتزن منطق فازی گودل بدست می‌آید. UL فاقد «طرد شق ثالث»، «پارادوکس مثبت» و «پارادوکس منفی» است. تابع ارزش تک‌نرم تضعیفی ربطی از تابع t-نرم است. در این مقاله منطق جدید ULΔ را معرفی می‌کنیم. ULΔ با افزودن اپراتور وجهی Δ به UL بدست می‌آید. ULΔ که بسطی از منطق کلاسیک است، یک منطق موجهات نرما...

full text

جایگاه زبان و سخن اخلاقی در ادبیات فارسی

. اخلاق و کارکرد آن، یکی از مهم‌ترین بن مایه‌های متون گوناگون زبان و ادب فارسی است و موضوعات مختلف اخلاقی و پند و اندرزهای فراوان در بیشتر این آثار دیده می‌شود. یکی از مهم‌ترین و مؤثرترین موضوعات اخلاقی و تعلیمی «زبان و سخن» و کارکرد مثبت و منفی آن است. در بیشتر متن‌های ادبی، عرفانی و تاریخی ما در باره اهمیت زبان، ویژگی‌های آن، مخاطب، ویژگی‌های سخن و ... نکته‌هایی درخور تأمل و به شیوه‌ای مؤثر، ...

full text

اولویت‌بندی برنامه‌های بهبود سازمان با استفاده از مدل غربالگری فازی

We can call “EFQM excellence model” as a transition from the great number of different models and approaches to unity in context of organizational improvement and excellence.Doing self assessment to find areas for improvement (AFIs) is the most important applications of this model. Organizations specially those ones which are on lower levels of total quality management will encounter lots of AF...

full text

طراحی مدل سازمان خادم با استفاده از دیمتل فازی

هدف این پژوهش طراحی مدل سازمان خادم برآمده از دانش خبرگان دانشگاهی با استفاده از فن دیمتل فازی بود. برای این کار، پس از شناسایی 6 مؤلفة اصلی شکل‏دهندة سازمان خادم از پیشینة پژوهش (انگیزه‏های خدمت، نگرش خدمت‌گرا، کنش‏های خادمیت‏محور، مطالبه‌گری محیطی، رهبری خادم، فضای خدمت) و گنجاندن آن‌ها در پرسشنامه‏ای بسته مبتنی بر طیف لیکرت پنج‏گزینه‏ای، 10 خبره شناسایی و پرسشنامه میان آن‌ها توزیع شد تا نظر ...

full text

مدل سازی قابلیت اطمینان با استفاده از منطق فازی

به کارگیری منطق فازی در فرایندهای عملیاتی دستگاه ها مدتی است که معمول گردیده است.از آنجا که نحوه کارکرد این دستگاه ها به شرایط خرابی آن بستگی دارد، به کارگیری منطق فازی در مهندسی  قابلیت اطمینان دستگاه ها و عملیات نیز غیر منتظره نیست. تا به حال بررسی های مبتنی بر برازش توابع مختلف قابلیت اطمینان بر مبنای منطق دو دویی انجام شده و دستگاه یا کاملاً سالم و یا کاملاً  خراب در نظر گرفته می شده است. اما...

full text

محاسبه‌ی تعادل فازی توریم با استفاده از مدل واندروالس

توریم یک آکتینید با عدد اتمی 90 است. توریم طبیعی پرتوزا بوده و اگرچه شکافت ­پذیر نیست اما تحت واکنش هسته ­ای (n, γ) و پرتوزایی به عنصر شکافت ­پذیر اورانیم تبدیل می ­شود. در این مقاله، برخی خواص ترمودینامیکی توریم بررسی شده است. از طرف دیگر، معادله ­ی حالت، ابزار مهم و مناسبی برای بررسی رفتار گرمافیزیکی مواد و پیش ­بینی آن­ ها در شرایط مختلف به لحاظ فشار، دما و مقدار است. در حال حاضر معادله­ های...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 15  issue 4

pages  123- 130

publication date 2019-03

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023