خوشه بندی سبک نگارش دست نوشته برون خط فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر
- نویسنده فاطمه ولایتی
- استاد راهنما احسان اله کبیر
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
هدف این پایان نامه، یافتن و استخراج ویژگی هایی است که بر مبنای آن بتوان دست خط فارسی را خوشه بندی کرد. در این کار، در ابتدا بر روی ویژگی های مبتنی بر بافت، تمرکز شده است. این ویژگی ها شامل دو دسته ویژگی آماری ماتریس باهم آیی و ویژگی مبتنی بر تبدیل گابور است. برای استخراج این ویژگی ها، یک بافت مناسب در ابعاد 1024×1024 مستقل از محتوای سند، از تصویر دستنوشته ایجاد می شود. از ویژگی های دیگری که در این کار از آن ها استفاده شده است، تعدادی ویژگی ساختاری مبتنی بر منحنی پیرامونی است. این ویژگی ها را از هر یک از تصاویر موجود در یک مجموعه داده از 97 دستنوشته فارسی که دارای متون متفاوتی بودند، استخراج کردیم و از الگوریتم k میانگین و شبکه عصبی نگاشت ویژگی خود سامان، برای خوشه بندی این ویژگی ها استفاده شده است. برای ارزیابی این ویژگی ها، یک روش ارزیابی بر مبنای الگوریتم خوشه بندی k میانگین، طراحی کرده ایم. در این الگوریتم از معیار مقایسه باینری ژاکارد استفاده کرده ایم، هم چنین برای محاسبه مراکز خوشه در هر دوره تکرار از الگوریتم k میانگین، از روش انتخاب داده چرخ رولت، بهره گرفته ایم. نتایج بدست آمده، نشان می دهد با ترکیب دو نوع از ویژگی های مبتنی بر منحنی پیرامونی، نرخ خوشه بندی، 75درصد است که نسبت به سایر روش های مورد استفاده در این کار، نرخ بهتری را در برداشته است. کلید واژه: سبک نگارش، خوشه بندی، بافت، فیلتر گابور، ماتریس با هم آیی، منحنی پیرامونی، ژاکارد، چرخ رولت ?
منابع مشابه
تشخیص برون خط کلمات دست نوشته فارسی به کمک بلوک بندی تطبیقی
تشخیص خودکار متن یکی از زیر مجموعه های پردازش تصویر است که به طور گسترده در کتابخانه دیجیتال، خواندن آدرس پستی نامه ها، خواندن چک های بانکی، خواندن فرم ها و پرسشنامه ها استفاده می شود. بازشناسی متون دست نوشته فارسی در دو سطح کلی برون خط و بر خط انجام می پذیرد که سیستم های برون خط خود به دو دسته تقسیم می شود: سیستم های مبتنی بر جداسازی و سیستم های کلی نگر. در سیستم های مبتنی بر جداسازی سعی می ش...
بازشناسی برون خط کلمات دست نوشته فارسی در یک مجموعه ای از لغات
در این پایان نامه بازشناسی برون خط کلمات دست نوشته فارسی در یک فرهنگ لغت محدود مورد مطالعه قرار می گیرد. برای این منظور یک روش دو مرحله ای پیشنهاد می گردد. در مرحله نخست توسط الگوریتم های خوشه بندی سلسله مراتبی وisoclus کلمات موجود در فرهنگ لغت بر اساس تشابه خوشه بندی می شوند. ویژگی های تشابهی به کار رفته در این مرحله، بردارهای پروفایل بالا، پایین، پروژکشن عمودی و تعداد گذر از سیاه به سفید برای...
15 صفحه اولبازشناسی بر خط و بدون محدودیت دست نوشته فارسی
بازشناسی برخط نوشتار یکی از دشوارترین زمینه های شناسایی الگو و هوش مصنوعی بوده و همواره مورد توجه خاص محققان قرار گرفته است. پیچیدگی این زمینه, هنگام برخورد با زبان هایی مثل فارسی و عربی که حروف آن ها باتوجه به موقعیت شان در کلمه, شکل های متفاوتی به خود می گیرند, دوچندان می شود. تحلیل دست نوشته ی فارسی یا عربی در مقایسه با زبان های لاتین، به علت حضور اجزای کوچکی ("نقطه", "دونقطه" و ...) بالا یا...
15 صفحه اولدست نوشته های اسماعیلیان بدخشان
در دور دستها ، پهلو به پهلوی چین ، باریکه سرزمینی است ، بسیار مرتفع ، با کوههای آسمان بوس و به هم فشرده ، با معبرهای تنگ دشوار گذر، با زمستانهای سرد نه ماهه ، برخوردگاه چهار تمدن بزرگ آسیا: ایران، هند، چین و آسیای مرکزی که دورترین نقطه است نسبت به همهی آنها و پناهگاهی است امن برای راندهشدگان از سراسر این سرزمینها ،نه تنها کسان که حتی باورها و اندیشههای کهن ، نه در کنارهم که آمیخ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023