ساخت خودکار ابرمتن در متن های فارسی

پایان نامه
چکیده

در دسترس بودن متن های الکترونیک، کاربران را ترغیب به مطالعه ی آن ها می کند. به همین دلیل امکان دارد کاربر با نیازهای اطلاعاتی روبرو شود و به دنبال کسب اطلاعات بیشتر یا اطلاعات مرتبطی در مورد کلمه یا عبارت خاصی درون متن باشد. در این صورت نیاز به جستجوی درون متن پیدا کرده که در نتیجه ی آن امکان دارد با مشکلات مربوط به جستجو روبرو شود. ابرمتن، یک روش سریع برای بازیابی اطلاعات است. تبدیل دستی حجم زیادی از اسناد به ابرمتن زمان بر و گاهی ناممکن است. به همین دلیل در این مقاله، قصد پیاده سازی یک روش تبدیل خودکار متن ساده به ابرمتن را داریم. این فعالیت اولین پیاده سازی در مورد اسناد فارسی است. در این روش، با استفاده از شبکه ی عصبی som و دو فرآیند برچسب زنی و تحلیل آن ها، دو نوع پیوند از کلمات بیانگر موضوع اصلی و کلمات کم اهمیت تر سند ایجاد شدند. پیوندهای تک کلمات و عبارت های دو کلمه ایجاد شدند. داده های به کار گرفته شده مقاله هایی از مرکز تحقیقات علوم اسلامی بود. علاوه بر ساخت ابرمتن، روی ایجاد پیوند بین قطعات متنی هم تمرکز کردیم. این فعالیت، با پیاده سازی دو رویکرد، با استفاده از ملاک های cosine و dice انجام شد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

فعل ماضی متعدی و ساخت ارگتیو در متن فارسی میانه، سنسکریت و فارسی دادِستانِ مینوی خرد

چکیده دادستان مینوی خرد متنی به زبان فارسی میانه مشتمل بر63 فصل و در شمار اندرزنامه­هاست.در قرن14میلادی تریوسنگ آن­را به زبان سنسکریت ترجمه کرده است. ترجمۀ نریوسنگ ترجمه­ای لفظ­به­لفظ است، بدون مطالعۀ متن فارسی میانه قابل درک نیست و زبان آن ویژگی­هایی دارد که آن را از سنسکریت کلاسیک متمایز و به           زبان­های ایرانی نزدیک می­سازد. از این جهت لازم است با متن فارسی میانه مقایسه و ویژگی­های ز...

متن کامل

بررسی ساخت اطّلاع جملات پرسشی در فارسی نو با تأکید بر متن

جملات پرسشی از جمله ابزارهای زبانی هستند که با ساخت اطّلاع جمله در ارتباط هستند و یا مستقیماً علامت و سازوکاری برای تشخیص نوع اطّلاع در جمله محسوب می‌شوند. جملات پرسشی از لحاظ ساختار و نوع و حرکت پرسش‌واژه‌ها تاکنون مورد مطالعه و بررسی قرار گرفته‌اند. پژوهش حاضر به مطالعۀ تطبیقی تحوّل جملات پرسشی و نقش آنها در دورۀ فارسی نو پرداخته است. برای این منظور، متون نثر متعلّق به قرن 4 تا معاصر مورد بررسی قر...

متن کامل

تشخیص خودکار جنسیت نویسنده در متون فارسی

Gigantic amount of textual data being transfers in web everyday. like other communities,cyberspace is vulnerable to attacks, false information and deception.it becomes increasingly important to design an efficient method to trace identity in this community.to investigate the problem of gender identification,we propose 48 feature,and design three machine learning algorithms.the results of study ...

متن کامل

فعل ماضی متعدی و ساخت ارگتیو در متن فارسی میانه، سنسکریت و فارسی دادستانِ مینوی خرد

چکیده دادستان مینوی خرد متنی به زبان فارسی میانه مشتمل بر63 فصل و در شمار اندرزنامه­هاست.در قرن14میلادی تریوسنگ آن­را به زبان سنسکریت ترجمه کرده است. ترجمۀ نریوسنگ ترجمه­ای لفظ­به­لفظ است، بدون مطالعۀ متن فارسی میانه قابل درک نیست و زبان آن ویژگی­هایی دارد که آن را از سنسکریت کلاسیک متمایز و به           زبان­های ایرانی نزدیک می­سازد. از این جهت لازم است با متن فارسی میانه مقایسه و ویژگی­های زب...

متن کامل

مروری بر دشواریهای زبان فارسی در محیط دیجیتال و تاثیرات آنها بر اثر بخشی پردازش خودکار متن و بازیابی اطلاعات

هدفهای پژوهش: زبان فارسی، به سبب ویژگیهای خاصّ آن و در عین حال نهادینه نشدن سبک نگارش استاندارد، در رویارویی با محیطهای الکترونیکی، با دشواریهایی روبه‎روست که تأثیری بسزا بر اثربخشی بازیابی اطلاعات می‎گذارد. پژوهش حاضر می‎کوشد تا با بررسی متون و پیشینه‎های موجود، چالشهای نگارش فارسی، تأثیر آنها بر اثربخشی بازیابی اطلاعات، و پیشنهاد‎های ارائه شده در جهت رفع این دشواریها را مورد بحث و بررسی قرار د...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023