سیستم شناسایی و طبقهبندی موجودیتهای اسمی در متون زبان فارسی بر پایه شبکه عصبی
نویسندگان
چکیده مقاله:
Named Entity Recognition (NER) is a fundamental task in natural language processing and also known as a subset of information extraction. We seek to locate and classify named entities in text into predefined categories such as the names of persons, organizations, locations, expressions of times, etc. Named Entity Recognition for English texts has been researched widely for the past years, however only a few limited researches have emphasized on Persian NER due to the absence of resources for Persian named entities and the limited amount of progress made in Persian natural language processing in general. In this paper, a Persian named entity recognition system has been developed based on neural network with the study of researches conducted in other languages and benefiting from the latest methods in this area such as using the vector representation of words. The results from the proposed model show that word embedding features in Persian not only resolve the problem of feature selection, but also it could lead to the development of an efficient system with the least dependence to the domain.
منابع مشابه
سیستم شناسایی و طبقه بندی اسامی در متون فارسی
Name entity recognition (NER) is a system that can identify one or more kinds of names in a text and classify them into specified categories. These categories can be name of people, organizations, companies, places (country, city, street, etc.), time related to names (date and time), financial values, percentages, etc. Although during the past decade a lot of researches has been done on NER in ...
متن کاملشیوههای بیان گزاره اسمی در زبان روسی و فارسی
مقالة حاضر، به بررسی گزارة اسمی در زبان روسی و فارسی میپردازد. مفهوم گزاره و انواع آن مدت زمان مدیدی است که مورد بررسی دانشمندان و دستورنویسان میباشد. به هنگام بررسی گزارة اسمی در زبان روسی میبایست این نکته را خاطرنشان ساخت که در رابطه با ابن موضوع اختلاف نظرهای اساسی وجود دارد. در بحث مربوط به تئوری گزاره در زبان فارسی همچون زبان روسی، نقاط ضعف و نارساییهایی نیز وجود دارد. در این مقاله، ان...
متن کاملسلسلهمراتب دسترسی گروه اسمی: فراگیری بندهای موصولی در زبان فارسی
کینان و کامری (1977) پس از بررسی 50 زبان، نظریۀ سلسلهمراتب دسترسیِ گروه اسمی را معرفی کردند. در این نظریه ادعاشدهاست که زبانها بهطور جهانی برای موصولیسازی از یک سلسلهمراتب پیروی میکنند. بر این اساس، محققان فراگیری زبان فرضیهای را مطرح کردند که بر پایۀ آن، میتوان ترتیب دشواریِ فراگیریِ بندهای موصولی در زبان دوم را پیشبینی کرد. در این مقاله سعی بر آن است تا با بررسی زبانِ میانیِ فارسی آموزان...
متن کاملبررسی باهمایی ترکیبات پایدار فعلی- اسمی در زبان روسی و مقایسة آن با زبان فارسی
توضیح برخی پدیدههای زبانی گاهی بسیار دشوار و پیچیده میشود، از جمله اینکه چرا در یک زبان، برخی واژگان یا ترکیب خاصی از واژگان وجود دارد یا چرا یک زبان دارای ساختار دستوری، صرفی یا نحوی ویژة خود است. تمامی این پدیدهها حاصل فرایند درازمدت رشد و گسترش زبان است. هر فردی بیآنکه راجع به آنچه میخواهد بگوید تفکر کند، واژگان را در ساختار جملههای کامل بهکار میبرد. بههمین ترتیب، در گفتار خود از تر...
متن کاملپیکره اعلام: یک پیکره استاندارد واحدهای اسمی برای زبان فارسی
Named entity recognition (NER) is a natural language processing (NLP) problem that is mainly used for text summarization, data mining, data retrieval, question and answering, machine translation, and document classification systems. A NER system is tasked with determining the border of each named entity, recognizing its type and classifying it into predefined categories. The categories of named...
متن کاملواژههای پایهی زبان فارسی مبتنیبر متون مطبوعاتی
آموزش واژههای زبان، یکی از مهمترین مؤلفههای آموزش زبان خارجی است که میتواند هر چهار مهارت اصلی زبان (شنیداری، گفتاری، خواندن و نوشتن) را تحت تأثیر قرار دهد. بر پایة پژوهشهایی که در حوزۀ آموزش واژه انجام شدهاست، واژههای پربسامد و پایة زبان، به دلیل فراگیری آسان و کاربرد فراوان در زبان روزمره، از اهمیت ویژهای برخوردار هستند. فهرست واژههای پربسامد یا پایه، مجموعهای از واژههاست که در پیک...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 34 شماره 1
صفحات 473- 486
تاریخ انتشار 2018-12
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023