پیش پردازش متون چاپی فارسی برای جداسازی حروف
thesis
abstract
پردازش مستندات یکی از جذاب ترین زمینه های بازشناسی الگو است و بازشناسی متون، محوری ترین بخش در پردازش مستندات است . یکی از مهمترین مراحل بازشناسی متون چاپی فارسی جداسازی حروف است . ما در این پایان نامه با اصلاح الگوریتم عزمی که مبتنی بر کانتور بالایی است ، الگوریتم جداسازی مناسبی برای متون چاپی قدیمی ارائه کرده ایم. برای حل مشکل نایکنواختی کرسی خط، روش مناسبی برای تعیین نوار زمینه پیشتهاد کرده ایم و با اصلاح روش برچسب زنی کانتور بالایی و تکمیل قواعد جداسازی، دقت الگوریتم را برای متون قدیمی افزایش داده ایم. نرخ جداسازی درست حروف با استفاده از این الگوریتم برای یک مجموعه آزمایش که از متون قدیمی برگزیده شده است ، بدون هیچ پس پردازشی 97 درصد است . برای جداسازی نقاط چسبیده به بدنه حروف نیز روشی ارائه شده است که نتایج رضایت بخشی داده است .
similar resources
پیش پردازش تصاویر متون فارسی دوربینی برای کاربردهای بازشناسی حروف
در این پایان نامه، روش هایی برای رفع اعوجاجات هندسی درتصاویر متون فارسی دوربینی ارائه می شود. روش های پیشنهادی شامل رفع انحنا، حذف کجی و پرسپکتیو در این تصاویر هستند. اساس کار در این روش ها به این صورت است که پس از مرحله پیش پردازش، ناحیه مربوط به هر خط متن تعیین و با اعمال تبدیل هندسی پرسپکتیو به روی تصویر، اعوجاجات هندسی آن حذف می شود. الگوریتم پیشنهادی اول، انحنا را برای اولین بار در تصاویر ...
15 صفحه اولالگوریتم اصلاح شده جداسازی حروف متون چاپی با برچسب زدن به کانتور بالایی کلمات
در این مقاله با اصلاح الگوریتم عزمی که مبتنی بر کانتور بالایی کلمات است، الگوریتم جداسازی مناسبی برای متون با کیفیت چاپی پایین ارائه شده است. برای حل مشکل نایکنواختی نوار زمینه خط،روش مناسبی برای تعیین نوار زمینه محلی پیشنهاد شده و با اصلاح روش بر چسب زنی کانتور بالایی وتکمیل قواعد جداسازی، دقت الگوریتم افزایش داده شده است. نرخ جداسازی درست حروف 97% است. بر اساس نتایج به دست آمده، بررسی دقیقی د...
full textجداسازی متون چاپی فارسی و لاتین در اسناد دو زبانه با استفاده از پردازش تصویر سند
امروزه حجم زیادی از اسناد کاغذی موجود، توسط جاروب گر ها یا دوربین ها به اسناد تصویری دیجیتالی تبدیل می شوند. ذخیره سازی، بازیابی و مدیریت کارآمد این شیوه های تصویری، در بسیاری از برنامه ها نظیر اتوماسیون اداری و کتابخانه های دیجیتالی اهمیت فراوانی دارند. برای تبدیل اسناد تصویری به اسناد متنی از سیستم های تشخیص اپتیکی حروف، ocr، استفاده می شود. سیستم های ocr تابع زبان متن بوده و با توجه به زبان ...
15 صفحه اولحروف فارسی و عربی در نخستین کتابهای چاپی فارسی و عربی در جهان
هدف: ارتباطات سیاسی و اقتصادی بین خاورمیانه و غرب در عصر رنسانس، سبب چاپ کتاب به الفبای عربی در اروپا شد. این مقاله به تحول حروف چاپی در نخستین کتابهای چاپ شده به زبانهای فارسی و عربی می پردازد.روش/ رویکرد پژوهش: این مقاله با استفاده از مواد کتابخانهای وآرشیوی نوشته شده است.یافتهها: پیش از شروع چاپ در اروپا با استفاده از حروف متحرک عربی، ابتدا این کتابها بهوسیله قالبهای چوبی چاپ میشد. د...
full textبازشناسی متون چاپی فارسی
برای بازشناسی کلمات سه رویکرد مبتنی بر جداسازی، مبتنی بر بازشناسی کلمه یک الگوی واحد و رویکرد ترکیبی مطرح است . در این رساله یک سیستم برای بازشناسی متون چاپی فارسی با استفاده از رویکرد ترکیبی ارائه شده است . یک الگوریتم جدید برای جداسازی حروف در کلمات چاپی بدون توجه به نوع قلم ارائه شده است . مراحل مختلف الگوریتم شامل تعیین نوار زمینه، تصحیح آن و جداسازی حروف است . در تعیین نوار زمینه روش جدیدی...
15 صفحه اولMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس
Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023