استخراج اطلاعات خاص از اسناد نیمه ساخت یافته با استفاده از یادگیری ماشین
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز
- نویسنده احمد خاتون آبادی
- استاد راهنما منصور ذوالقدری جهرمی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1380
چکیده
با رشد وسیع اطلاعاتی که روزانه در وب در دسترس قرار می گیرد، توانایی توسعه سریع عاملهای اطلاعاتی جهت بازیابی و استخراج اطلاعات جدی تر شده است . جزء حیاتی هر عامل اطلاعاتی در وب ، مجموعه ای از پوشش هاست که می توانند اطلاعات مربوطه را از منابع اطلاعاتی نیمه ساخت یافته استخراج نمایند. سیستمهای استقراء پوشش ، از یادگیری استقرایی که یکی از روشهای یادگیری ماشین می باشد، جهت تولید خودکار پوشش استفاده می کنند. این سیستمها با توجه به مثالهای آموزشی بر چسب خورده توسط کاربر، الگوهای استخراج را استنتاج می نمایند. برچسب گذاری مثالهای آموزشی مهمترین محدودیت در طراحی سیستمهای استقراء پوشش می باشد. هدف از نمونه برداری انتخابی که یکی از روشهای یادگیری فعال است ، کاهش میزان برچسب گذاری می باشد. این رساله یک سیستم استقراء پوشش توسعه داده است که از الگوهای مشترک بین مثالهای آموزشی برچسب نخورده، به منظور نمونه برداری انتخابی و تولید الگوهای استخراج استفاده می نماید. این سیستم با بهترین سیستم استقراء پوشش یعنی stalker مقایسه شده است . نتایج آزمایشات نشان می دهند که سیستم طراحی شده می تواند با برچسب گذاری کمتر، به صحتی در سطح سیستم stalker برسد.
منابع مشابه
تشخیص آسیب در سازه ها با استفاده از اطلاعات مودال بسط یافته و ماشین یادگیری کرانه یی
در نوشتار حاضر، روش نوینی برای تشخیص محل و میزان آسیب در سازهها ارائه شده است. در روش پیشنهادی از اطلاعات مودال سازه، شامل بسامد و شکل مودی استفاده شده است. با توجه به محدودیت موجود در تعداد حسگرهای بهکار رفته در سازه، برای بهدست آوردن اطلاعات مودال نسبت به مدل اجزاء محدود، اطلاعات مودال بهدست آمده از حسگرها با استفاده از روش کاهش بهبود یافته، بسط داده شده و بهعنوان ورودی برای آموزش ماشی...
متن کاملدستهبندی کور کدهای فضا-زمان با استفاده از یادگیری ماشین
مهمترین خصوصیتی که شناسایی کور کدهای فضا-زمان را از سایر انواع شناسایی کور مخابراتی متمایز میکند این است که برای نفوذ در بسیاری از سامانههای مخابراتی مدرن که از روشهای ارسال و دریافت چندآنتنی استفاده میکنند، اولین قدم شناسایی کور کد فضا-زمان بهکاررفته است. در این مقاله، دستهبندی کور در مجموعه وسیعی از کدهای فضا-زمان با استفاده از ابزارهای یادگیری ماشین مورد بررسی قرار گرفته است. از آنجا ...
متن کاملتهیه نقشه حساسیت سیل با استفاده از دو مدل یادگیری ماشین جنگل تصادفی و مدل خطی تعمیم یافته بیزین
امروزه پدیدهی سیل یکی از پیچیدهترین رخدادهای مخاطرهآمیز است که بیش از سایر بلایای طبیعی دیگر، همهساله در نقاط مختلف دنیا منجر به ایجاد خسارتهای جانی و مالی و تخریب اراضی کشاورزی میشود؛ بنابراین تهیه نقشه حساسیت به وقوع سیلاب نخستین گام در برنامه مدیریت سیلاب است. هدف از این پژوهش شناسایی مناطق حساس به سیل با استفاده از دو مدل یادگیری ماشین جنگل تصادفی (RF) و خطی تعمیمیافته بیزین (GLMbaye...
متن کاملیادگیری نیمه نظارتی کرنل مرکب با استفاده از تکنیکهای یادگیری معیار فاصله
Distance metric has a key role in many machine learning and computer vision algorithms so that choosing an appropriate distance metric has a direct effect on the performance of such algorithms. Recently, distance metric learning using labeled data or other available supervisory information has become a very active research area in machine learning applications. Studies in this area have shown t...
متن کاملرویکردی با ناظر در استخراج واژگان کلیدی اسناد فارسی با استفاده از زنجیرههای لغوی
Keywords are the main focal points of interest within a text, which intends to represent the principal concepts outlined in the document. Determining the keywords using traditional methods is a time consuming process and requires specialized knowledge of the subject. For the purposes of indexing the vast expanse of electronic documents, it is important to automate the keyword extraction task. S...
متن کاملاستخراج ویژگی از دادههای عمق با استفاده از روش یادگیری عمیق برای کنترلِ باناظر ربات چرخدار
این مقاله چارچوبی از یادگیری عمیقِ با ناظر را جهت ناوبری ربات چرخدار در زمینهای هموار با محوریت وظایف پیگیری دیوار و اجتناب از موانع ارائه مینماید. در اینجا، فرض بر این است که ربات تنها به یک سیستم بینایی (دوربین کینکت) مجهز است. چالش اصلی در هنگام استفاده از تصاویر عمق، ابعاد بالای تصاویر و استخراج ویژگیهای مناسب از آنها با هدف کاهش ابعاد ورودی کنترلگر میباشد. برای این منظور در این مقاله...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023