کاوش و استخراج رویدادهای مرتبط به اشخاص در متون عربی

پایان نامه
چکیده

استخراج رویداد یکی از مهم ترین و چالش برانگیزترین وظیفه های استخراج اطلاعات است؛ که به عنوان زیربنایی برای بسیاری از کاربردهای پردازش زبان طبیعی مانند جستجوی معنایی اطلاعات، خلاصه سازی متون و غیره به شمار می رود. استخراج رویداد به تشخیص و استخراج رویدادهای مهم مانند رویداد مرگ، تولد، درگیری و دیگر موارد در متونی با زبان طبیعی می‎پردازد. استخراج رویداد از دو مرحله‎ی کلی استخراج حوزه‎ی رویداد و استخراج اطلاعات و یا عوامل درگیر در رویداد تشکیل شده است. در این پایان نامه به استخراج رویداد و اطلاعات مربوط به آن در متون اسلامی تاریخی عربی پرداخته شده است؛ که دارای ساختار زبان شناسی پیچیده و متفاوت نسبت به متون متداول امروزی است و می‎تواند ابزاری بسیار مفید برای محققین در این حوزه باشد. تشخیص درست حوزه ی رویداد و تعیین جملاتی که رویداد را توصیف می کنند به عنوان اولین و موثرترین گام، صحت فرایند استخراج اطلاعات رویداد را تحت تأثیر قرار می دهد. از این رو در این پایان نامه ابتدا به پیاده سازی و مقایسه ی کارایی عملی و کاربرد روش های گوناگون استخراج حوزه رویداد پرداخته شده است که می تواند محققین را در انتخاب روش مناسب استخراج رویداد با توجه به امکانات و شرایط موجود کمک نماید. در این پژوهش سه شیوه ی دانش گرا (مبتنی بر مجموعه کلمات کلیدی و قوانین)، داده گرا (مبتنی بر ماشین بردار پشتیبان) و معناگرا (مبتنی بر زنجیره ی لغوی) را برای رده بندی خودکار جملات شامل رویداد در متون تاریخی عربی به کار بسته ایم و کارایی و کاربرد آن ها را با یکدیگر مقایسه نموده ایم. پیاده سازی این سیستم ها نشان می دهد که شیوه های دانش گرا و مبتنی بر یادگیری ماشین دارای دقت بسیار بالایی در فرایند استخراج رویداد است و شیوه ی معناگرا با دقت مناسب و قابل قبول نیاز به دانش تخصصی مورد نیاز روش های دانش گرا و پیش‎پردازش های مورد نیاز روش های داده گرا را کمینه می کند و خودکارسازی استخراج رویداد از متن خام را بهبود می بخشد. در گام بعد به استخراج عوامل درگیر در رویداد مانند زمان وقوع رویداد، مکان وقوع رویداد و عوامل دیگر با استفاده از شیوه‏های مبتنی بر قانون پرداختیم. روال کار به این صورت است که ابتدا پیش پردازش‏های لازم جهت استخراج اطلاعات مانند تعیین روابط گرامری جمله انجام گرفته و سپس با استفاده از یک ساختار پیمانه‎ای به استخراج هر یک از عوامل رویداد به صورت مستقل پرداخته می‏شود.

منابع مشابه

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

بازتاب فرهنگ وتمدن هند در متون عربی

سرزمین هند به واسطه برخورداری از تاریخ کهن  وقدمتی  چند هزار ساله، تاثیر زیادی بر گاهواره تمدن جهان، بویژه ادبیات ومتون عربی به جا گذاشت؛.با نگاهی به متون نظم ونثرعربی درزمان های مختلف ، این تاثیر به خوبی  مشهود است. در این نوشتارسعی برآن شده که به شکل موجز،تعریفی ازهند وروابط آن با عرب ها، وانعکاس فرهنگ هند درادبیات دوره های مختلف عربی ارائه شود. همچنین از خدمات بی شائبه" ابوریحان بیرونی "به ع...

متن کامل

ارزیابی روشمند متون ترجمه شده از عربی به فارسی

ارزیابی حلقه رابط تئوری و عمل ترجمه است.نکته‌گوئی‌ها و کلی‌گوئی‌ها در این عرصه بسیار است.حتی در مدل‌های مختلف ارزیابی، معیارهایی که برای ترجمه خوب و ارزیابی ذکر شده، گاه بسیار کلی بوده، از همین‌رو راه را برای اعمال سلیقه باز گذاشته‌اند.این مشکل در خصوص متون ترجمه شده از عربی به فارسی و بالعکس که از نظر مباحث تئوری ضعف دارد، حادتر است.تلاش ما در این مقاله آن است که معیارهایی دقیق‌تر و جزئی‌نگر ب...

متن کامل

آشکارسازی و تعیین مکان متون فارسی - عربی در تصاویر ویدیویی

Video text detection plays an important role in applications such as semantic-based video analysis, text information retrieval, archiving and so on. In this paper, we propose a Farsi/Arabic text detection approach. First, with an appropriate edge detector, edges are extracted and then by using edges cross ponts, artificial corners are extracted. Artificial corner histogram analysis is done for ...

متن کامل

ارایه یک الگوریتم به منظور کاوش معانی در متون حقوقی

متون حقوقی یکی از پرکاربردترین مسائلی است که مردم زیادی با آن برخورد دارند با توجه به حجم زیاد داده و عدم توانایی کاوش معانی توسط انسان، ارائه یک الگوریتم به منظور کاوش معانی ضروری است. با استفاده از الگوریتم ارائه شده می توان به کشف دانش در پایگاه های داده مرتبط با متون حقوقی پرداخت. در الگوریتم ارائه شده از ساختمان داده گراف استفاده شده است و با در نظر گرفتن اصول داده کاوی پیاده سازی شده است...

پیشینه دانش پزشکی و علوم عقلی در ایران (به روایت متون ادب فارسی و عربی)

ایرانیان، سهم بزرگی در پیشرفت علوم به ویژه دانش­های عقلی، پزشکی، داروسازی و پیراپزشکی در دوران پیش از اسلام و بعد از داشته­اند. وجود دانشگاه­های علوم پزشکی جندی شاپور اهواز و «ریو اردشیر» (بوشهر فعلی) در آن زمان، حکایت از آن دارد که در زمان ساسانیان، ایرانیان، عنایت خاصی به تدوین علوم عقلی داشته­اند. آثار پزشکی ایرانی، یکی از منابع مهم پزشکی در جهان اسلام به شمار می­رفته و علل اصلی تأثیر ایران...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023