استخراج روابط معنایی در سطح گفتمان از متن
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی
- نویسنده محمد هادی زاهدی
- استاد راهنما محسن کاهانی
- سال انتشار 1392
چکیده
وب فعلی برای استفاده انسان ایجاد شده تا قادر به مشاهده اطلاعات مورد نیاز خود و فهم آنها باشد. وب معنایی در کنار این مهم، تعامل ماشین با محتویات وب و درک خودکار مفاهیم آن را مورد توجه قرار داده است. در این وب، محتویات بایستی بگونه ای قابل فهم برای ماشین نمایش داده شوند. عمده کارها در این حوزه به دو دسته استخراج مفاهیم و استخراج روابط تقسیم می شوند. بسیاری از کاربردها در استخراج اطلاعات، اکتساب دانش، فهم زبان طبیعی و بازیابی اطلاعات نیازمند درک در سطح مفهوم، معنا، رابطه و روابط معنایی می باشد. هر کدام از موجودیتهای ذکر شده دارای ویژگیها و تعاریف مشخص می باشند. رابطه معنایی به روابط بین مفاهیم موجود در ذهن که به آن مفاهیم ادراکی یا به روابط بین کلمات که روابط لغوی نامیده می شوند، اشاره دارد. روابط معنایی در حوزه متن می توانند در سطوح پایین و بین واژگان و یا در سطوح بالاتر بین عبارات، جمله ها، پاراگرافها و حتی بالاتر از بخشهای یک متن مثلا بین دو سند یا مجموعه ای از اسناد رخ دهد. سطوح ذکر شده دارای یک محدوده تعریف ساختاری می باشند؛ اما سطح دیگری در حوزه زبان شناسی که علیرغم اهمیت بالا، کمتر در حوزه زبان شناسی رایانه ای به آن پرداخته شده است سطح گفتمان نام دارد؛ که محدوده تعریف آن نه ساختار بلکه معنا است. در این سطح، مقیاس نه یک جمله یا پاراگراف یا سند بلکه واحد معنایی است؛ و ممکن است بین چند جمله، چند پاراگراف و یا تمام متن باشد. نکته قابل توجه وقوع این روابط معنایی در سطح گفتمان، بصورت صریح و یا ضمنی در متن می باشد و اهمیت آن به دلیل انتشار روزافزون اطلاعات در سطح وب است که غالبا در قالب متن هستند و اکتساب دانش و استخراج اطلاعات مورد نیاز از بین این حجم انبوه داده مستلزم درک مفاهیم و روابط معنایی حاکم بین آنها بویژه در حوزه های زبان شناسی، روانشناسی، علوم شناختی و در این رساله زبان شناسی محاسباتی است. این رساله روشی جدید محاسباتی به منظور استخراج و نمایش روابط معنایی صریح و ضمنی در سطح گفتمان از متن ارایه داده است که مکمل و توسعه دهنده روشهای پیشین است. بهره گیری از روشهای پردازش زبان طبیعی در کنار محاسبات آماری و روش تجزیه مقدار تکینه و روش استخراج و شناسایی الگو بدون ناظر از مشخصه های روش پیشنهادی است. هدف کمک به درک و فهم دقیق و عمیق تر از متن و پیاده سازی در کاربردهای بسیار در حوزه های مرتبط با زبان شناسی، روانشناسی، علوم شناختی و بویژه زبان شناسی محاسباتی است. تحقیقات موجود نشان می دهد که روشهای ارایه شده هوش مصنوعی و یادگیری ماشین در این حوزه نیازمند به سطح بالایی از مهندسی دانش یا پایگاه داده های بزرگ برای یادگیری و آزمایش هستند. روش ارائه شده ضمن نوآوری در حوزه پیشنهادی، محدودیت های و مشکلات ماقبل را حل نموده است. در این پایان نامه توسعه، پیاده سازی و ارزیابی روش برای محاسبه کارآیی، دقت و صحت انجام پذیرفته است. روش محاسباتی پیشنهادی از شیوه جبر خطی تجزیه مقدار تکینه در کنار انجام برخی پردازشها و پیش پردازشها در حوزه زبان طبیعی از جمله برچسب گذاری نقش معنایی ، برچسب زنی نحوی و تکنیکهای آماری پردازش زبان طبیعی و روشهای محاسبه پیوستگی و همبستگی نیز بهره گرفته است. کاربردهایی در ایجاد هستان شناسی و تکامل و توسعه آن، استخراج دانش، سیستم های پرسش و پاسخ، خلاصه ساز متن و بازیابی اطلاعات مانند موتورهای جستجو از آن جمله می باشد. ارزیابی روش پیشنهادی با دو رویکرد صورت پذیرفته است: 1) اعمال روش بر روی داده های استاندارد و 2) پیاده سازی روش پیشنهادی در موارد حوزه کاربرد. ارزیابیهای حاصل نشانگر عملکرد قابل توجه روش پیشنهادی دارد.
منابع مشابه
بخش بندی معنایی نظارتی ضعیف با استفاده همزمان از اطلاعات سطح شی و سطح متن
در این مقاله، روش جدیدی برای بخشبندی معنایی تصاویر در حضور دادههای آموزشی نظارتی ضعیف ارائه میگردد. هدف اصلی در بخشبندی معنایی اختصاص برچسب به تمامی پیکسلهای تصویر است. در دادههای آموزشی نظارتی ضعیف، تنها برچسبهای معنایی موجود در تصویر مشخص میگردد و مکان آنها در تصویر مشخص نمیگردد. نوآوری روش پیشنهادی، استفاده همزمان از اطلاعات سطح شی و سطح متن در تعیین برچسبهای معنایی در تصویر میبا...
متن کاملاستخراج روابط معنایی بین کلمات فارسی با استفاده از داده کاوی متن ها
استخراج اطلاعات یکی از زمینه های رایج پردازش زبان های طبیعی است که فعالیت خود را از همان ابتدای پیدایش پردازش هایی روی زبان های طبیعی آغاز کرده است. هدف از استخراج اطلاعات بدست آوردن اطلاعات مفیدی از منابع وسیع و غیر ساخت یافته موجود در فضای مجازی است. استخراج روابط معنایی یکی از شاخه های رایج در زمینه استخراج اطلاعات است. روابط معنایی زیادی را می توان تعریف کرد که از جمله مهمترین آنها رابطه ها...
15 صفحه اولمؤلفههای معنایی واژه «انفاق» در گفتمان قرآن کریم با تأکید بر روابط همنشینی
This article has no abstract.
متن کاملبررسی توانش معنایی کودکان در سطح روابط معنایی بین گزاره ای حاوی کمیت نمای «هر»
معنا یکی از شاخصههای مهم در بررسی فرآیند یادگیری زبان مادری است. مطالعة آنچه کودکان راجع به معنا در سطوح مختلف میدانند، میتواند راهی برای دستیابی به چگونگی سخنوری بشر باشد. هدف از این تحقیق، بررسی میزان فهم کودک از نقشهای معنایی کمیتنمای جهانی «هر» در سطح روابط بین گزارهای است. بررسی روابط معنایی بینگزارهای حاوی کمیت نمای «هر» در کودکان، نه تنها گام ارزشمندی در دستیابی به معناشناسی «هر»...
متن کاملمهندسی خودکار هستی شناسی: امکان سنجی استخراج روابط معنایی از متون فارسی و تعیین میزان پیدایی آنها
در این مقاله ضمن تبیین فرایند مهندسی هستی شناسیها، استخراج روابط معنایی با تکیه بر روشهای مبتنی بر الگو، مطالعه شده است. نمونهای از متون تخصصی فارسی در حوزة ربط تحلیل و روابط معنایی موجود در آن استخراج و دستهبندی گردید. همچنین، تعیین میزان پیدایی روابط معنایی در نمونة مورد تحلیل، در پاسخ به دومین پرسش پژوهش انجام پذیرفت. امکان استخراج و تعیین روابط معنایی در نمونه مورد تحلیل، تأیید ش...
متن کاملاستخراج روابط هیدرولیکی سطح مقطع رودخانه با استفاده از مدلسازی معکوس
هندسه مقاطع رودخانه در تمامی مدلهای شبیهسازی هیدرولیک رودخانه اهمیت اساسی دارد، برداشت دادههای آن ملزم به انجام عملیات سخت و هزینهبر نقشهبرداری است. هدف از تحقیق حاضر شناسایی روابط هیدرولیکی مساحت سطح مقطع، پیرامون مرطوب و عرض آزاد سطح آب، مستخرج از مقاطع با استفاده از روش مسئله معکوس است. این تحقیق با در نظر گرفتن رودخانه غیرمنشوری و مقاطع نامنظم، ابتدا بازه رودخانه مورد شناسایی را با توج...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023