مسائل زبان و خط فارسی در ذخیره سازی و بازیابی اطلاعات

نویسندگان

لیلا مرتضائی

lila mortezai عضو هیأت علمی مرکز اطلاعات و مدارک علمی ایران

چکیده

بانک های اطلاعاتی فارسی ، پیش از آن که فرهنگستان زبان معیارهای لازم را برای کاربرد اصطلاحات علمی و رسم الخط فارسی تعیین کند شکل گرفتند. مجریان بانک های اطلاعاتی و نمایه سازان ، خواسته یا ناخواسته ـ با مسائل واژه گزینی و جنبه هایی از زبانشناسی درگیر شدند. در کار واژه گزینی ، اطلاع رسانان ـ به لحاظ ماهیت حرفه خود ـ واژه های رایج در جامعه تولیدکنندگان و استفاده کنندگان از اطلاعات را مد نظردارند و خود را مجاز به واژه سازی و اعمال سلیقه نمی دانند. واژه های تازه ساخت نیز تازمانی که در جامعه مقبولیت لازم را به دست نیاورده باشند و در مدارک به کرات دیده نشوند، در نظام های ذخیره و بازیابی اطلاعات یا ظاهر نمی شوند و یا میهمان چندروزه اند. بخش قابل توجهی از مشکلات نمایه سازان از رواج و کاربرد واژه ناشی می شود.متخصصان برای یک مفهوم واحد اصطلاحات متفاوت به کار می برند. حتی متخصصانی که در یک رشته و در یک جامعه کوچک کار می کنند خود را ملزم به هماهنگی در کاربرد واژه های تخصصی نمی بینند. به علاوه برای بسیاری از اصطلاح های وارداتی معادل های متفاوت در زبان فارسی وجود دارد که در مواردی همه ، کم و بیش ، به یک اندازه کاربرد دارند. این گونه مطالب به علاوه مسائل رسم الخط فارسی ، آوانویسی اسامی عناصر وترکیبات شیمیائی ، سرواژه ها و کوته نوشته ها سبب شده است تا ذخیره اطلاعات به زبان فارسی با کندی صورت گیرد و جستجو و بازیابی کارایی مطلوب را نداشته باشد. در این مقاله سعی خواهد شد نمونه هایی از تجربه های واژه گزینی در ذخیره اطلاعات ارائه شود تا با توجه به آنها، شاهد تسریع و تسهیل ذخیره و بازیابی اطلاعات به زبان فارسی باشیم .

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی

مقدمه: ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانه‎ای پدید آورده است. رسم‌الخط فارسی نیز از یک‌سو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، به‎هنگام ذخیره، جستجو و بازیابی چالشهای متعددی را برای طراحان و نمایه‎سازان پایگاه‌ها، کاربران و پدیدآورندگان منابع به‌وجود آورده است. روش ...

متن کامل

بررسی تأثیرات ریشه‌یابی در بازیابی اطلاعات در زبان فارسی

Using the language-specific behavior in information retrieval systems can improve the quality of the retrieved results significantly. Part of the word that remains after removing its affixes is called stem. Stemming process can be used for improving the relevancy of the results in information retrieval system. Different morphological variants of words (plural, past tense…) will be mapped into t...

متن کامل

ریزش کاذب در ذخیره و بازیابی اطلاعات

مقاله حاضر تعریف، وجه تسمیه و علل ریزش کاذب، ریزش کاذب در نمایه سازی کویک، کواک و پس همارا، شیوه های جلوگیری از ریزش کاذب، بویژه استفاده از ربط و نقش، و ارتباط ریزش کاذب با جامعیت و مانعیت را بیان می دارد. در پایان نیز ریزش کاذب در بانک های اطلاعاتی مورد بحث و بررسی قرار می گیرد.

متن کامل

Degenerate Four Wave Mixing in Photonic Crystal Fibers

In this study, Four Wave Mixing (FWM) characteristics in photonic crystal fibers are investigated. The effect of channel spacing, phase mismatching, and fiber length on FWM efficiency have been studied. The variation of idler frequency which obtained by this technique with pumping and signal wavelengths has been discussed. The effect of fiber dispersion has been taken into account; we obtain th...

متن کامل

ضرورت‌های نوین بازنـگری در ذخیره و بازیابی اطلاعات

فرایند سازماندهی اطلاعات، در طول تاریخ از اهمیت ویژه‌ای برخوردار بوده و در هر زمان، بسته به نوع و ماهیت منابع اطلاعاتی و پارادایم‌ها و رویکردهای مسلط، رهیافت‌های متفاوتی برای سازماندهی اطلاعات مورد توجه قرار گرفته است. ولی امروزه همگام با توسعة جهان دانش، نیاز به بازنگری درنظام‌های سازماندهی این جهان، جدی‌ترشده. در این مقاله ابتدا ویژگی‌های نظام‌های طبقه‌بندی سنتی و سرعنوان‌های موضوعی ب...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
پژوهشنامه پردازش و مدیریت اطلاعات

جلد ۱۷، شماره ۱، صفحات ۱۹-۲۶

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023