بررسی الگوریتم های ریشه یابی در زبان فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - پژوهشکده برق و کامپیوتر
- نویسنده سارا مسعودی
- استاد راهنما محمد هادی صدرالدینی غلام حسین دستغیبی فرد اشکان سامی
- سال انتشار 1391
چکیده
از منظر زبان شناسی , سازه ای که ضمیمه ندارد و معنی به آن وابسته است و بین تمام کلمات خویشاوند وهم زمینه مشترک است , ریشه یا بن نامیده می شود. بر این اساس فرآیند ریشه یابی ,فرآیند تعیین کننده ریشه های بدست آمده از یک لغت است به عبارت دیگر , هدف از ریشه گیری کاهش فرم های لغتی متغیر جهت دست یابی به یک ریشه تک واژه ای می باشد.ریشه جزئی از کلمه است که پس از حذف تمام عناصر الحاقی یا وندهای کلمه « پسوند , پیشوند , میانوند» بر جای می ماند. یکی از مهمترین موضوعات در پردازش زبان طبیعی (nlp) و بازیابی اطلاعات (ir) یافتن ریشه کلمات است , علاوه بر آن به منظور افزایش کارایی سیستم های بازیابی اطلاعات استفاده از روش ریشه یابی کلمات مفید است زیرا اشتقاقات مختلف یک کلمه به ریشه آن کلمه باز می گردند. در نتیجه جستجو بر اساس ریشه کلمات انجام خواهد شد و اندازه ساختار ایندکس کاهش می یابد.
منابع مشابه
مکان یابی در زبان فارسی
امکانات و روشهای مکانیابی یکی از مهمترین مباحث مطرح در حوزۀ زبانشناسی شناختی است. زبان با استفاده از منابع و امکاناتی عینی مانند اعضای بدن، اشیاء و موارد موجود در طبیعت و فرایندها به مفهومسازی جهتهای مکانی میپردازد. هر زبان با توجه به مسائل تاریخی و فرهنگی خود، از برخی یا همۀ امکانات فوق استفاده میکند. با توجه به این ملاحظات، هدف این مقاله شناسایی امکانات و منابع مکانیابی در زبان فارسی...
متن کاملبررسی ساختار مصدرها در زبان اردو و ارائهء مصدرهای جعلی با ریشه های فارسی و عربی
ساختار زبان اردو با توجه به پیشینهء تاریخی آن دارای شکل های قابل توجهی است که مطالعه، تحقیق، دقت در این اشکال، به شناخت بیشتر آن کمک می کند. از سویی، مصدر از عوامل ساختاری زبان است و از آنجا که در زبان اردو بیشتر واژگان از دیگر زبان ها اخذ شده اند، مصدرهای ساده ترکیبی و جعلی موجود در آن، با توجه به گسترش میزان پذیرش کلمات دیگر زبان ها در این زبان جنبه های متفاو تی دارند. بررسی زمینه های ساختاری...
متن کاملارائه روش هایی برای مسئله ریشه یابی در زبان فارسی
امروزه پیشرفت امکانات نرم افزاری و سخت افزاری، موجب آسانی ذخیره شدن مقادیر زیادی داده شده است. تعداد مستندات متنی روز به روز در حال افزایش است؛ نامه های الکترونیکی، صفحات وب، متون خبری و مقالات تنها بخشی از این گستره رو به افزایش هستند. بنابراین نیاز به تکنیک های متن کاوی همانند روش های خودکار برای رده بندی متون و بازیابی اطلاعات احساس می شود. در مسئله های متن کاوی ریشه یابی کلمات جزء مهم ترین ...
15 صفحه اولمقایسة تکواژ ریشه در زبان روسی و فارسی
در زبان های مختلف تکواژ ریشه هسته مرکزی واژه را تشکیل می دهد. تکواژ ریشه مانند سایر تکواژها ‘ می تواند دارای معانی دستوری یا واژه ساز ی باشد. در زبان روسی اهمیت تکواژ ریشه از لحاظ معنی دستوری به مراتب از زبان فارسی غنی تر است. در زبان فارسی‘ اهمیت تکواژ ریشه از لحاظ واژه سازی بیشتر از زبان روسی است. تکواژ از لحاظ کاربرد به دو گروه وابسته و غیر وابسته(آزاد) تقسیم می گردد. تعداد تکواژ ریشه وابسته...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - پژوهشکده برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023