تعیین و تایید هویت افراد مبتنی بر متون دستنویس فارسی

پایان نامه
چکیده

هدف این پژوهش، یافتن روشهای کارآمدتر و دقیق تر، به منظور تشخیص هویت نویسنده از روی دستنوشته های فارسی به صورت برون خط می باشد. در این تحقیق، به متن دستنوشته به چشم یک بافت نگاه می کنیم و استخراج ویژگی ها را بر اساس پردازش بافت انجام می دهیم. لذا به گونه ای اقدام به جمع آوری نمونه ها کرده ایم که برای آنالیز بافت مفید باشد. برای این منظور از تعداد 50 نفر با جنسیت و سطح سوادهای مختلف خواسته شد که هر کس یک متن دلخواه را روی یک کاغذ a5 بنویسد. با این شرط که متن نوشته شده از سه خط بیشتر باشد. سپس متن نوشته شده را روی 9 کاغذ دیگر تکرار کند. به این صورت یک پایگاه داده مستقل از متن، متشکل از 500 نمونه دستنوشته داریم. برای بررسی یک تصویر به صورت بافت، باید پیش پردازشی روی تصویر خام اولیه صورت گیرد تا آن تصویر را به صورت یک بافت منظم درآورد. دو نوع کلی از پیش پردازش هایی که انجام دادیم یکی شامل نرمال سازی یکنواخت است که در آن فاصله بین خطوط و کلمات را برای تمام متنها یکسان می کنیم. و نوع دوم که در آن، این فاصله ها را تغییر نمی دهیم و تنها به یکسان کردن طول و عرض تصاویر بسنده می کنیم. برای استخراج ویژگی، از روش srf که یک روش مبتنی بر گرادیان است استفاده می کنیم. در این روش، هم از اطلاعات دامنه و هم فاز برای استخراج ویژگی ها استفاده می شود. بعد از استفاده از روش srf که در آن از نقابهای سوبل و روبرتز بصورت جداگانه استفاده کردیم، با استفاده از کلاسه بند شبکه های عصبی و نزدیکترین همسایگی کلاسه بندی داده ها را انجام داده ایم. با توجه به اینکه در زبان فارسی تحقیقات کمی برای تعیین هویت نویسنده انجام شده است، یکی از این تحقیقات که نتایج خوبی داشته و در آن از روش فیلتر گابور برای استخراج ویژگی استفاده شده بود را پیاده سازی کرده و آن را با روش پیشنهادی تحقیق مقایسه کردیم. نتایج نشان می دهد روش srf نسبت به روش فیلترهای گابور از لحاظ نتایج کلاسه بندی، با کلاسه بند شبکه های عصبی، کارایی بهتری دارد. از لحاظ سرعت پردازش و استخراج ویژگی، با روش srf تقریبا 65 برابر سریع تر ویژگی ها استخراج می شوند. با توجه به نتایج عنوان شده برای موضوع مورد تحقیق، روش srf نسبت به روش فیلترهای گابور مناسب تر به نظر می رسد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تکنیک‌های خلاصه‌سازی چندسندی خودکار متون فارسی مبتنی بر الگوریتم‌های فرااکتشافی

هدف:ارائه الگوی خلاصه‌سازی استاندارد متون فارسی با رویکرد تبدیل مسئله خلاصه‌سازی به مسئله بهینه‌سازی توسط الگوریتم‌های فرااکتشافی سازگار. روش‌شناسی: در این پژوهش از اسناد استاندارد پیکره چندسندی «پاسخ» که شامل 50 موضوع مختلف از انواع گونه‌های خبری از خبرگزاری‌های پرببینده ایران، برای ارزیابی استفاده شده است. هر موضوع حاوی 20 سند و همچنین 5 خلاصه چکیده‌ای ...

متن کامل

تعیین مرز و نوع عبارات نحوی در متون فارسی

Text tokenization is the process of tokenizing text to meaningful tokens such as words, phrases, sentences, etc. Tokenization of syntactical phrases named as chunking is an important preprocessing needed in many applications such as machine translation information retrieval, text to speech, etc. In this paper chunking of Farsi texts is done using statistical and learning methods and the grammat...

متن کامل

آشکارسازی و تعیین مکان متون فارسی - عربی در تصاویر ویدیویی

Video text detection plays an important role in applications such as semantic-based video analysis, text information retrieval, archiving and so on. In this paper, we propose a Farsi/Arabic text detection approach. First, with an appropriate edge detector, edges are extracted and then by using edges cross ponts, artificial corners are extracted. Artificial corner histogram analysis is done for ...

متن کامل

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

تشخیص حروف دستنویس فارسی

هدف در این رساله، تجربهء امکان طراحی و پیاده سازی روندی برای تشخیص حروف و کلمات دستنویس فارسی براساس روش ساختاری تشخیص الگوها می باشد. که بدین منظور بوسیلهء شبیه سازی کامپیوتری، با وارد کردن حروف و کلمات بصورت دستی با سیاه کردن خانه های یک شبکه، متناظر با شکل حروف ، و تشخیص آنها به این مهم نائل آمده ایم . اگر فرضیات و محدودیتهایی که برای ورودیهای سیستم تشخیص در نظر گرفته شده اند، کاملا" رعایت گ...

15 صفحه اول

تأثیر تکنیک‌های خلاصه‌سازی بر دسته‌بندی متون فارسی

هدف این پژوهش، استفاده از ترکیب تکنیک های دسته بندی و خلاصه سازی و بررسی تاثیر افزایش تعداد اسناد می باشد که تأثیر پارامترهای خلاصه سازی TF وISF و چهار تکنیک دسته بندی بیزین، درخت تصمیم، قانون و بردار پشتیبان و سه معیار ارزیابی دقت، صحت و فراخوان بر روی 1000 سند متن اصلی و خلاصه محاسبه و تفاوت ها بررسی شدند. نتیجه ی این پژوهش حاکی از برتری اسناد 1000 تایی، روش خلاصه ساز ISF نسبت به TF، روش های ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023