استخراج اطلاعات خاص از اسناد نیمه ساخت یافته با استفاده از یادگیری ماشین

پایان نامه
چکیده

با رشد وسیع اطلاعاتی که روزانه در وب در دسترس قرار می گیرد، توانایی توسعه سریع عاملهای اطلاعاتی جهت بازیابی و استخراج اطلاعات جدی تر شده است . جزء حیاتی هر عامل اطلاعاتی در وب ، مجموعه ای از پوشش هاست که می توانند اطلاعات مربوطه را از منابع اطلاعاتی نیمه ساخت یافته استخراج نمایند. سیستمهای استقراء پوشش ، از یادگیری استقرایی که یکی از روشهای یادگیری ماشین می باشد، جهت تولید خودکار پوشش استفاده می کنند. این سیستمها با توجه به مثالهای آموزشی بر چسب خورده توسط کاربر، الگوهای استخراج را استنتاج می نمایند. برچسب گذاری مثالهای آموزشی مهمترین محدودیت در طراحی سیستمهای استقراء پوشش می باشد. هدف از نمونه برداری انتخابی که یکی از روشهای یادگیری فعال است ، کاهش میزان برچسب گذاری می باشد. این رساله یک سیستم استقراء پوشش توسعه داده است که از الگوهای مشترک بین مثالهای آموزشی برچسب نخورده، به منظور نمونه برداری انتخابی و تولید الگوهای استخراج استفاده می نماید. این سیستم با بهترین سیستم استقراء پوشش یعنی stalker مقایسه شده است . نتایج آزمایشات نشان می دهند که سیستم طراحی شده می تواند با برچسب گذاری کمتر، به صحتی در سطح سیستم stalker برسد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تشخیص آسیب در سازه ها با استفاده از اطلاعات مودال بسط یافته و ماشین یادگیری کرانه یی

در نوشتار حاضر، روش نوینی برای تشخیص محل و میزان آسیب در سازه‌ها ارائه شده است. در روش پیشنهادی از اطلاعات مودال سازه، شامل بسامد و شکل مودی استفاده شده است. با توجه به محدودیت موجود در تعداد حس‌گرهای به‌کار رفته در سازه، برای به‌دست آوردن اطلاعات مودال نسبت به مدل اجزاء محدود، اطلاعات مودال به‌دست آمده از حس‌گرها با استفاده از روش کاهش بهبود یافته، بسط داده شده و به‌عنوان ورودی برای آموزش ماشی...

متن کامل

دسته‌بندی کور کدهای فضا-زمان با استفاده از یادگیری ماشین

مهم‌ترین خصوصیتی که شناسایی کور کدهای فضا-زمان را از سایر انواع شناسایی کور مخابراتی متمایز می‌کند این است که برای نفوذ در بسیاری از سامانه‌های مخابراتی مدرن که از روش‌های ارسال و دریافت چندآنتنی استفاده می‌کنند، اولین قدم شناسایی کور کد فضا-زمان به‌کاررفته است. در این مقاله، دسته‌بندی کور در مجموعه وسیعی از کدهای فضا-زمان با استفاده از ابزارهای یادگیری ماشین مورد بررسی قرار گرفته است. از آنجا ...

متن کامل

تهیه نقشه حساسیت سیل با استفاده از دو مدل یادگیری ماشین جنگل تصادفی و مدل خطی تعمیم یافته بیزین

امروزه پدیده­ی سیل یکی از پیچیده­ترین رخدادهای مخاطره­آمیز است که بیش از سایر بلایای طبیعی دیگر، همه‌ساله در نقاط مختلف دنیا منجر به ایجاد خسارت­های جانی و مالی و تخریب اراضی کشاورزی می­شود؛ بنابراین تهیه نقشه حساسیت به وقوع سیلاب نخستین گام در برنامه مدیریت سیلاب است. هدف از این پژوهش شناسایی مناطق حساس به سیل با استفاده از دو مدل یادگیری ماشین جنگل تصادفی (RF) و خطی تعمیم‌یافته بیزین (GLMbaye...

متن کامل

یادگیری نیمه نظارتی کرنل مرکب با استفاده از تکنیک‌های یادگیری معیار فاصله

Distance metric has a key role in many machine learning and computer vision algorithms so that choosing an appropriate distance metric has a direct effect on the performance of such algorithms. Recently, distance metric learning using labeled data or other available supervisory information has become a very active research area in machine learning applications. Studies in this area have shown t...

متن کامل

رویکردی با ناظر در استخراج واژگان کلیدی اسناد فارسی با استفاده از زنجیره‌های لغوی

Keywords are the main focal points of interest within a text, which intends to represent the principal concepts outlined in the document. Determining the keywords using traditional methods is a time consuming process and requires specialized knowledge of the subject. For the purposes of indexing the vast expanse of electronic documents, it is important to automate the keyword extraction task. S...

متن کامل

استخراج ویژگی‌ از داده‌های عمق با استفاده از روش یادگیری عمیق برای کنترلِ باناظر ربات چرخ‌دار

این مقاله چارچوبی از یادگیری عمیقِ با ناظر را جهت ناوبری ربات‌ چرخ‌دار در زمین‌های هموار با محوریت وظایف پیگیری دیوار و اجتناب از موانع ارائه می‌نماید. در اینجا، فرض بر این است که ربات تنها به یک سیستم بینایی (دوربین کینکت) مجهز است. چالش‌ اصلی در هنگام استفاده از تصاویر عمق، ابعاد بالای تصاویر و استخراج ویژگی‌های مناسب از آنها با هدف کاهش ابعاد ورودی کنترلگر می‌باشد. برای این منظور در این مقاله...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023