مطالعه و بررسی روشهای بازیابی تصاویر کلمات دستنویس
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده ریاضی و کامپیوتر
- نویسنده سمانه السادات شیرازی
- استاد راهنما محمدابراهیم شیری رضا عزمی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1385
چکیده
در سالهای اخیر شناسایی نوری نویسه به عنوان یکی از حوزه های فعال در مبحث شناسایی الگو است. اگرچه تحقیقات بر روی کلمات دستنویس فارسی (عربی) در سالهای گذشته پیشرفت بسزایی کرده است، اما در مقایسه با کلمات لاتین جای پیشرفت دارد. البته کارهای انجام شده در این زمینه حاوی اطلاعات مفید برای بالا بردن ضریب اطمینان است. در این پایان نامه سعی بر این است که در حوزه شناسایی نوری نویسه و به خصوص کلمات دستنویس بتوان روشی برای بهبود دقت در شناسایی و بازیابی کلمات ارائه کرد. با توجه به این حقیقت که شناسایی یک تصویر به وسیله انسان ها بر اساس مشاهده صورت می گیرد، تمایز تصاویر گوناگون وابسته به قدرت بینایی انسان است. تحقیقات نشان داده است که درصد تشخیص و شناسایی یک شی در کامپیوتر با استفاده از تبدیل آن به فرکانس، برتر از شناسایی بر اساس ویژگی های ساختاری و ظاهری تصویر شئ می باشد. به همین منظور و در راستای شناسایی و بازیابی تصاویر دستنویس، از تبدیل موجک گسسته استفاده کرده و ویژگی های بدست آمده از این تبدیل را به عنوان معیار شناسایی و در نهایت بازیابی قرار داده ایم. سیستم شناسایی بر اساس شبکه های عصبی برنامه ریزی شده است. علت استفاده از شبکه عصبی، داشتن قابلیت دسته بندی کردن و تفکیک الگوها بر اساس ویژگی های مدنظر می باشد. مجموعه داده ها شامل 42 کلمه می باشد که توسط 100 نفر با درجه تحصیلات متفاوت جمع آوری شده است. نیمی از داده ها را به عنوان داده های آموزش و نیمی دیگر را به عنوان داده های آزمایشی در نظر گرفته ایم. سیستم شناسایی، داده های آموزشی را با دقت 95.71% و داد های آزمایشی را با دقت 72.85% شناسایی می کند. در بخش بازیابی تصاویر در مجموعه داده ها، سیستم پیشنهادی بطور متوسط برای 42 کلمه مفروض با دقت 97.80% به بازیابی می پردازد. به علت اینکه در داده های جمع آوری شده یک کلمه را به صورت پیوسته در نظر گرفته ایم و به شناسایی حروف به طور مجزا پرداخته نشده است، نتایج بدست آمده از آزمایش سیستم پیشنهادی نشان دهنده توانایی سیستم در بازیابی و همچنین شناسایی برون خط کلمات دستنویس فارسی دارد.
منابع مشابه
طراحی اولین پایگاه داده کلمات دستنویس کردی برای سیستم های تشخیص تصویری کلمات
چکیده: یکی از اجزای زیربنایی سیستم های تشخیص تصویری کلمات پایگاه داده هاست. هر سیستمی که در این زمینه طراحی گردد لاجرم می بایست از یک نوع پایگاه داده ها استفاده کند. بدیهی است چون موضوع مورد مطالعه در این سیستم ها شکل نوشتاری زبان های مختلف میباشد پس برای هر زبان مشخص پایگاه داده بخصوصی لازم است. زبانی که این مقاله بر آن متمرکز شده کردی است و در این مقاله مراحل مختلف چگونگی طراحی اولین پایگاه...
متن کاملقطعه بندی بر خط کلمات دستنویس فارسی
در این پایان نامه الگوریتمی برای قطعه بندی بر خط کلمات دستنویس فارسی ارائه می شود. منظور از قطعه بندی، یافتن قطعاتی است که بوسیله آنها بتوان کلیه کلمات را ایجاد کرد. این الگوریتم بر اساس یافتن نقاط اصلی در یک کلمه و مقایسه شیب و زوایای پاره خطهای متصل کننده این نقاط به یکدیگر، قطعه بندی را انجام می دهد. در طراحی الگوریتم از یک مجموعه تمرین با 20 کلمه و از هر کلمه 2 نمونه دستنویس افراد مختلف است...
15 صفحه اولارائه خصیصه های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیه برچسب
جستجو و بازیابی کلمات دستنویس در اسناد تصویری روشی جایگزین برای بازشناسی کاراکترهای نوری (OCR) است. این راهکار بیشتر در مواردی که بازشناسی کاراکترهای نوری دقت پایینی دارند، مانند متون دستنویس یا متون چاپی با کیفیت پایینی مطرح میگردد. امروزه یکی از روشهای کارآمد در بازیابی مبتنی بر محتوای تصویر، که برای کلمات تصویری هم توسعه داده شده است، استفاده از رده بندی مبتنی بر خصیصه (Attribute-based Cla...
متن کاملطراحی اولین پایگاه داده کلمات دستنویس کردی برای سیستم های تشخیص تصویری کلمات
چکیده: یکی از اجزای زیربنایی سیستم های تشخیص تصویری کلمات پایگاه داده هاست. هر سیستمی که در این زمینه طراحی گردد لاجرم می بایست از یک نوع پایگاه داده ها استفاده کند. بدیهی است چون موضوع مورد مطالعه در این سیستم ها شکل نوشتاری زبان های مختلف میباشد پس برای هر زبان مشخص پایگاه داده بخصوصی لازم است. زبانی که این مقاله بر آن متمرکز شده کردی است و در این مقاله مراحل مختلف چگونگی طراحی اولین پایگاه د...
متن کاملشناسایی برون خط کلمات دستنویس فارسی در یک مجموعه محدود
هدف این رساله ارائه روشهای بدون قطعه بندی برای شناسایی کلمات دستنویس فارسی در یک مجموعه محدود است . اصولا" روش های بدون قطعه بندی، براساس ویژگیهایی از تمام کلمه یا زیرکلمه عمل می کنند. در این رساله یک نمایش جدید دوبعدی برای کلمات دستنویس فارسی پیشنهاد شده است . همچنین روشی برای تعمیم الگوریتم dtw به دوبعد ارائه شده و برای مقایسه کلمات بکار رفته است . برای آزمون روشهای مختلف ، از یک مجموعه محدود...
15 صفحه اولارائه روشی جدید برای شاخصگذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشهبندی متون
Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, i...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده ریاضی و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023