نام پژوهشگر: جواد صدری

ارائه ی الگوریتم هایی برای جداسازی و تشخیص اتوماتیک مبلغ عددی و تاریخ در چک های بانکی دستنویس فارسی و مقایسه ی نتایج آن ها
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی 1390
  محمد جواد جلیلی   جواد صدری

در این پایان نامه به طور خاص به الگوریتم های گوناگون برای جداسازی و تشخیص فیلدهای مبلغ و تاریخ عددی در چک های بانکی دست نویس فارسی اشاره شده است. الگوریتم هایی نظیر بازسازی تصویر و اصلاح شیب اعداد در مرحله ی پیش پردازش استفاده گردیده که برای اولین بار روی اعداد فارسی به کار گرفته شده است. در مرحله ی استخراج ویژگی نیز الگوریتم هایی مانند استخراج chain code، outer profile، intersection و غیره تست شده و ترکیب آنها نیز برای نتایج بهتر ارائه گردیده است. در مرحله ی طبقه بندی نیز نتایج با استفاده از الگوریتم های knn، svm، nn ارائه شده که بر اساس نتایج بدست آمده در مرحله ی تشخیص با انتخاب هر ویژگی و طبقه بند، نتایج مقایسه شده و بهترین ها معرفی گردیده است. ضمناً نتایج برای اولین بار در زبان فارسی در سطح فیلدهای چک و چک کامل ارائه شده است. باید توجه داشت که قدم اول برای انجام این تحقیق، جمع آوری پایگاه داده ای از چک های دست نویس بود که پس از بررسی های انجام شده و شناسایی مشکلات موجود در ساختار چک های سنتی، طرح جدیدی برای ساختار چک ها پیشنهاد گردید که با اضافه کردن پارامترهایی، علاوه بر رفع مشکلات پردازش رایانه ای، قابلیت های جدیدی به این چک ها اضافه شد که باعث مشتری پسندی و زیبایی آنها شده است. نمونه های دست نویس این ساختار پیشنهادی چک که توسط جامعه ی آماری متوازن و حقیقی از داوطلبان مرد و زن پر شده و اسکن گردیده، به عنوان پایگاه داده ی نرم افزار استفاده شده است. همچنین سیستم نرم افزاری ارائه شده، قابلیت اضافه شدن به سخت افزارهای 24 ساعته مانند دستگاه های خودپرداز و کیوسک های اطلاع رسانی را داشته و بر روی هر سیستم عاملی به صورت میزبان، قابل اجرا می باشد.

ارائه الگوریتمی برای جداسازی، تشخیص و تصدیق اتوماتیک امضا در چک های بانکی دستنویس فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی 1390
  یونس اکبری   جواد صدری

در زمینه ی تشخیص (بازشناسی) الگو، تحقیقات بسیاری در کشور عزیزمان انجام شده است.یکی از شاخه های تشخیص الگو، تشخیص دست خط است، که در این زمینه نیز تلاش های بسیاری صورت گرفته است. در سال های اخیر به زمینه های کاربردی تشخیص دست خط توجه بسیاری شده است. در زمینه های کاربردی، سازمان های دولتی و غیر دولتی می توانند به منظور کاهش حجم قابل توجهی از اسناد دست نویس و کاهش زمان پردازش دستی اسناد از سیستم های پردازش خودکار استفاده کنند. سیستم های تشخیص نوری کاراکتر زیادی در زبا ن های لاتین، چینی، ژاپنی و دیگر زبان ها به این منظور طراحی شده اند. در این پایان نامه، سیستمی کاربردی برای پردازش خودکار چک های بانکی دست نویس فارسی ارائه شده است. بانک ها و موسسات مالی اعتباری، از سازمان هایی می باشند که روزانه اوراق بهادار دست نویس فراوانی به صورت دستی توسط نیروی انسانی متخصص در آن ها پردازش می شوند. تا کنون تحقیقات اندکی برای طراحی سیستمی به منظور پردازش خودکار چک در ایران انجام شده است ولی هیچکدام موفق به ارائه ی یک سیستم کاربردی نشده اند. در این پایان نامه، عدم موفقیت تحقیقات انجام شده بر روی پردازش چک و مشکلات خودکارسازی سیستم بانکداری کنونی ایران بررسی شده است.توجه اصلی در این پایان نامه تشخیص و بررسی صحت امضا در سیستم بانکی است و الگوریتمی بدین منظور ارائه شده است. امضا مهمترین فیلد چک است که در صورت بررسی نادرست، اطمینان مشتریان از پردازش اتوماتیک در سیستم بانکداری سلب می شود.الگوریتم ارائه شده برای کاهش خطای نیروی انسانی پیاده سازی شده است.

ارزشیابی کاربردپذیری وب سایت کتابخانه های مرکزی دانشگاه وابسته به وزارت علوم، تحقیقات و فناوری
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند 1390
  طیبه عابدینی   محسن نوکاریزی

پژوهش حاضر به روش پیمایشی، به ارزشیابی کاربردپذیری وب سایت کتابخانه های مرکزی دانشگاه های وابسته به وزارت علوم، تحقیقات و فناوری پرداخته است. هدف پژوهش، ارزشیابی کاربردپذیری وب سایت کتابخانه های مرکزی دانشگاه های وابسته به وزارت علوم، تحقیقات و فناوری از دید دانشجویان این دانشگاه ها بود. جامعه پژوهش، شامل دانشجویان 30 دانشگاه وابسته به وزارت علوم، تحقیقات و فناوری بود که دارای وب سایت صفحه مجزا و مستقل کتابخانه مرکزی در وب-سایت دانشگاه بودند. از روش نمونه گیری خوشه ای استفاده شد و پنج دانشگاه (تهران، سیستان و بلوچستان، شهید بهشتی، شهید چمران اهواز، فردوسی مشهد) به طور تصادفی انتخاب شدند و از دانشجویان این دانشگاه ها نیز نمونه گیری تصادفی به عمل آمد. ابزار گردآوری اطلاعات پرسشنامه ای بود که در پنج بعد کلی کاربردپذیری شامل «محتوا»، «سازماندهی و قابلیت خوانایی»، «مسیر یابی و قابلیت پیوند»، «طراحی رابط کاربر» و «عملکرد و اثربخشی» در قالب 32 گویه طراحی شد که پس از آزمون روایی و پایایی، دیدگاه دانشجویان مقاطع تحصیلی مختلف دانشگاه های مذکور در خصوص به کارگیری ابعاد کاربردپذیری در وب سایت کتابخانه مرکزی آن ها بررسی شد. نتایج نشان داد به طور کلی به کارگیری ابعاد کاربردپذیری در وب سایت کتابخانه های مرکزی دانشگاه های وابسته به وزارت علوم، تحقیقات و فناوری از دید کاربران در وضعیت «خوبی» (بیش از 60 تا 80) قرار داشت. تمامی ابعاد مورد بررسی، «محتوا»، «سازماندهی و قابلیت خوانایی»، «مسیریابی و قابلیت پیوند»، «طراحی رابط کاربر»، «عملکرد و اثربخشی»، در وضعیت «خوب» قرار داشت. بعد «محتوا» با میانگین نمره 42/3 (معادل 4/68 درصد) کمترین و بعد «طراحی رابط کاربر» با میانگین نمره 53/3 (معادل6/70درصد) بیشترین نمره را کسب کردند. بین میانگین نمرات قضاوت کاربران در خصوص به کارگیری ابعاد کاربردپذیری با وضعیت مطلوب (80 درصد) در وب سایت کتابخانه های مرکزی دانشگاه های وابسته به وزارت علوم، تحقیقات و فناوری تفاوت معناداری وجود داشت. از دیگر یافته های پژوهش این بود که تفاوت معناداری بین قضاوت «کاربران مقاطع مختلف تحصیلی»، «کاربران با سابقه استفاده متفاوت از رایانه و اینترنت» و «کاربران با دوره استفاده متفاوت از وب سایت کتابخانه مرکزی»، در خصوص به کارگیری ابعاد کاربردپذیری در وب سایت کتابخانه های مرکزی دانشگاه های وابسته به وزارت علوم، تحقیقات و فناوری مشاهده شد. بین قضاوت «کاربران زن و مرد» و «کاربران گروه های سنی مختلف» در خصوص به کارگیری ابعاد کاربردپذیری در وب سایت کتابخانه های مرکزی دانشگاه های وابسته به وزارت علوم، تحقیقات و فناوری تفاوتی معناداری وجود نداشت. به نظر می رسد توجه به ابعاد کاربردپذیری در طراحی وب سایت های کتابخانه ای از سوی طراحان سبب ارتباط بهتر کاربران با آن، استفاده بیش تر از خدمات کتابخانه و در نهایت افزایش کارایی خدمات کتابخانه شود.

بازشناسی مبالغ حرفی در چک های بانکی دستنویس فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند 1390
  الهام شهریارپور   جواد صدری

بازشناسی دستنوشته ها از جمله موضوعاتی است که در بسیاری از کاربردهای تجاری و اداری نقش مهمی را ایفا می کند. در کشور ما با توجه به تلاشهایی که در سالهای اخیر برای دولت الکترونیک انجام گرفته، نیاز به بازشناسی متون دستنویس، خصوصا در سازمانهای دولتی مثل بانکها، ادارات پست و... بیش از پیش احساس میشود. از جمله مسائل مهم در زمینه تشخیص دستنوشتهها، بازشناسی مبالغ حرفی میباشد که حل آن پیشنیاز پیادهسازی و ایجاد سیستمهای پردازش اتوماتیک چکهای بانکی است. چک عمومیترین و متداولترین شکل پرداخت غیر نقدی در تمام کشورها از جمله ایران است و خواندن اتوماتیک چکهای بانکی به طور قابل توجه ای هزینه های پردازش و پیگیری حقوقی چکها را کاهش میدهد و در مقابل باعث افزایش دقت و سرعت پردازش در آنها میشود. هدف از این پایان نامه ارائه راه حل موثری برای بازشناسی مبالغ حرفی دست نویس در چک های بانکی فارسی و سپس پیاده سازی و ارزیابی راه حل مذکور می باشد. روش پیشنهاد شده مبتنی بر قطعه بندی مبلغ حرفی چک به چندین زیرکلمه و سپس بازشناسی زیرکلمات با مدل مخفی مارکوف (hmm) می باشد. مدل مخفی مارکوف یکی از روش های یادگیری ماشین است که استفاده از آن برای بازشناسی دست نوشته با استقبال زیادی از سوی محققان مواجه شده است. در روش ارائه شده، بعد از اعمال الگوریتم های پیش پردازش مانند حذف نویز، زیرکلمات موجود در مبلغ حرفی با آنالیزکردن اجزا متصل شان قطعه بندی می شوند. سپس در مرحله استخراج ویژگی، از پنجره متحرک برای اسکن کردن تصاویر زیرکلمات از راست به چپ استفاده می شود. به این صورت که هر تصویر به چند فریم تقسیم شده و از هر فریم تعدادی ویژگی آماری استخراج می گردد. سپس در مرحله بازشناسی زیرکلمات، توسط طبقه بندی کننده hmm راست به چپ گسسته و کوانتیزاسیون فازی برداری، لیستی برای هر زیرکلمه ی موجود در جمله تهیه می شود. در نهایت در مرحله پس پردازش با استفاده از قوانین گرامری چک های فارسی و الگوریتم مبتنی بر ویتربی مبالغ حرفی بازشناسی می شوند. برای آموزش سیستم از پایگاه داده استانداردی متشکل از2520 زیرکلمه و برای ارزیابی آن از 145 مبلغ حرفی استفاده می شود. نتایج آزمایشگاهی نشان می دهد که سیستم مذکور قادر به تشخیص زیرکلمات با نرخ 20/75 و مبالغ حرفی چک با نرخ 79/73 می باشد که نسبت به نتایج مشابه دارای عملکرد خوبی است.

استفاده از روشهای یادگیری ماشین برای تطبیق دنباله های بیولوژیکی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند 1390
  محمد سروری   سید حمید ظهیری

یکی از مهمترین موضوعات مورد بررسی در زیست شناسی و بیواینفورماتیک، مسئله مقایسه و تطبیق دنباله های زیستی است. مدل مخفی مارکوف یکی از الگوریتم های یادگیری ماشین می باشد که در زیست شناسی محاسباتی کاربرد فراوانی دارد. در این پایان نامه، ساختار مدل مخفی مارکوف و کاربرد آن در هم ترازی و خوشه بندی دنباله های زیستی مورد بررسی قرار گرفته است. از آنجایی که مدل مخفی مارکوف یک ابزار قوی برای یافتن شباهت بین داده های ترتیبی با طول های متغیر است، برای خوشه بندی دنباله ها، از آن استفاده شده است. در روش ارائه شده، هر دنباله زیستی بوسیله یک مدل مخفی مارکوف که با الگوریتم بهینه سازی گروه ذرات بهینه شده، مدل می شود. سپس با استفاده از پارامترهای بدست آمده، خوشه بندی بر مبنای یک تعریف جدید از ماتریس فاصله، انجام می شود. بهینه سازی پارامترهای مدل مخفی مارکوف با استفاده از الگوریتم جستجوی گرانشی نیز صورت گرفته است. در نهایت هم ترازی دنباله ها، با استفاده از روش خوشه بندی پیشنهادی و پروفایل مدل مخفی مارکوف، انجام می گیرد. آزمایش های انجام شده برروی دنباله های زیستی نظیر ژن ها نشان می دهد که الگوریتم پیشنهاد شده می تواند در انجام مقایسه بین دنباله های زیستی، بصورت بسیار کارامد و موثر، بکار گرفته شود.

استنتاج مقیاس پذیر بر روی پایگاه های دانش پویای مبتنی بر rdfs/owl
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390
  مجید سازوار   محمود نقیب زاده

در طی سالیان اخیر حجم زیادی از سه گانه های rdf (در حدود چند ده میلیارد) در وب منتشر گردیده است. برای استفاده از این داده های منتشر شده باید الگوریتم استنتاجی داشته باشیم که بتواند روی این حجم عظیم از داده ها استنتاج انجام دهد و همچنین بتواند خود را با این نرخ بالای رشد ، تطبیق دهد. تاکنون راهکارهای مختلفی برای حل این مشکل ارائه گردیده است که برخی از آنها توانسته اند ، مقیاس پذیری خوبی را از خود نشان دهند. متاسفانه اکثر این روش ها برای حل مشکل مقیاس پذیری فرض کرده اند که داده ها ایستا می باشد و از روش استنتاج رو به جلو برای محاسبه بستار استفاده کرده اند. بنابراین تاکنون توجه کمی به مساله پویایی داده ها در وب معنایی شده است. در این پایان نامه ، روش ترکیبی ارائه شده است که تلاش می کند مزایای روش های استنباطی و استقرایی را یکجا جمع کرده و مشکلات آنها را از بین ببرد. در این روش ترکیبی ، از استنتاج رو به عقب برای فراهم سازی مجموعه داده آموزشی جهت یادگیری یک مدل lda استفاده شده است و سپس با استفاده از مدل یادگرفته شده ، صحت سه گانه های دیگر تخمین زده شده است. در راستای عملکرد کارآمد و مقیاس پذیر این روش یک ساختمان داده بیتی فشرده طراحی شده است که سه گانه های rdf را به طور فشرده ای درون حافظه اصلی بازنمایی می کند. نتایج بدست آمده از ارزیابی های مختلف بر روی این روش نشان از موفقیت این روش در راه رسیدن به اهداف خود دارد.

ارائه یک روش جدید بهینه سازی چندهدفه و بررسی کاربرد آن در خوشه بندی داده ها و قطعه بندی تصویر
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده برق و کامپیوتر 1391
  هامون نیکو   جواد صدری

در این پایان نامه، در ابتدا، دو الگوریتم جدید بر اساس الگوریتم های جمعیت ذرات و جستجوی هارمونی برای حل مسائل بهینه سازی چندهدفه ارائه شده است. در ادامه این پایان نامه، الگوریتم چندهدفه مبتنی بر جستجوی هارمونی، برای خوشه بندی داده ها و قطعه بندی تصاویر مورد استفاده قرار گرفته است. نتایج برای بررسی کارایی الگوریتم های چندهدفه پیشنهادی، با ارائه توابع آزمون استاندارد و توسط شاخص های استاندارد با الگوریتم های مشابه مانند nsga-ii و mopso مقایسه شده است. همچنین نتایج الگوریتم خوشه بندی پیشنهادی با چند الگوریتم خوشه بندی محبوب و قدرتمند دیگر مقایسه شده و در انتها نتایج حاصل از قطعه بندی تصاویر، به نمایش درآمده است. نتایج بدست آمده نشان می دهد که الگوریتم های پیشنهادی در این پایان نامه با الگوریتم های قدرتمند موجود، از نظر کارایی کاملا قابل مقایسه بوده و در مواردی بهتر از آنها عمل می کند.

خواندن اتوماتیک برگ رأی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی برق و کامپیوتر 1391
  مهدی صفدری   سید محمد رضوی

یکی از کاربردهای بازشناسی الگو استخراج اطلاعات از فرم های دستنویس و پردازش آنهاست. یک نمونه از این فرم ها، برگه رأی است که در آن اطلاعاتی مثل نام و نام خانوادگی و کد نامزد در آن نوشته می شود. در این رساله، کدی به هر نامزد انتخاباتی داده می شود و هر نامزد انتخاباتی از روی این کد شناسایی می شود. برای اینکه بیشترین نرخ بازشناسی را از برگه های رأی بدست آوریم، این کد را از ترکیب ارقامی که بیشترین نرخ بازشناسی را نتیجه می دهند و حذف بقیه ارقام، می سازیم. در این تحقیق از سه طبقه بند بیز، knn و کمترین فاصله و نه روش استخراج ویژگی متفاوت برای بازشناسی ارقام دستنویس فارسی استفاده شده است. روش های استخراج ویژگی بکار رفته عبارتند از، هیستوگرام های افکنش افقی و عمودی و ترکیب آنها، آنالیز اجزای اصلی(pca)، فاصله(distance)، مکان مشخصه(loci)، تبدیل موجک (dwt)، تبدیل کسینوسی-گسسته(dct) و ناحیه بندی(zoning). پایگاه داده ای که در این پایان نامه از آن استفاده شده، پایگاه داده هدی می باشد. این پایگاه داده شامل 102352 نمونه می باشد که به 60000 نمونه آموزشی، 20000 نمونه آزمایشی و22352 نمونه که بقیه اعداد پایگاه داده را تشکیل می دهند، تفکیک شده است.

ارائه رهیافتی در مدل سازی بهینه و یکپارچه سیستم بینایی سطح پایین.
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده برق و کامپیوتر 1391
  رضا رمضان زاده   ناصر مهرشاد

چکیده برای توسع? الگوریتم های پردازش و تحلیل تصویر و بینایی ماشین، کامل ترین سیستم که بتوان از آن الهام گرفت سیستم بینایی انسان است. در این تحقیق با مطالع? سیستم بینایی انسان و جانوران هم به لحاظ فیزیولوژیک و هم به لحاظ روان بینایی، سعی شده است تا نحو? استخراج عوامل موثر در بینایی سطح پایین مانند: لبه، خط، بافت، حساسیت به کنتراست و کانتور مبتنی بر اثر بازدارندگی میدان دریافت غیر مرسوم، با استفاده از روش های تحلیل سیگنال و فیلتر های مخصوص مانند فیلتر گابور مدل شود. همچنین برای بهبود کارایی بعضی از عوامل فوق روش های ابتکاری ارائه شده است. در این مورد می توان به طراحی آشکار ساز خط مبتنی بر مدل سلول های مرکز- اطراف شبکیه، طراحی آشکارساز دقیق لبه با قابلیت اصلاح مکان لبه در مقیاس های مختلف اشاره کرد. این آشکارساز لبه با استفاده از روش جدید ارائه شده تحت عنوان الگوریتم ادغام منقبض شوند? پاسخ های گرادیان، به اصلاح موقعیت لبه ها برای مقیاس های بزرگتر، می پردازد. این الگوریتم بر اساس سیر از مقیاس بزرگتر به سوی مقیاس های کوچکتر ابداع شده است. همچنین برای یکپارچه سازی سیستم بینایی سطح پایین و ارائه یک خروجی مطلوب مانند نقش? مرز اشیاء برای تصاویر طبیعی، از شبک? عصبی و رهیافت یادگیری الگوهای محلی ویژگی های تصویر استفاده شده است. تصویر خام ورودی به عوامل تصویر تجزیه می شود و این عوامل به صورت ویژگی به شبک? عصبی داده می شوند تا شبک? عصبی با ادغام این ویژگی ها، در مورد نقش? نهایی مرز اشیاء تصمیمگیری کند. آموزش این شبک? عصبی توسط تصاویر طبیعی و نقش? گراندتروث مربوطه به عنوان نقش? هدف، انجام می شود. برای تعیین وزن های این شبک? عصبی از الگوریتم بهینه سازی جمعیت ذرات استفاده شده است. نتایج حاصل شده بیانگر این است که الهام از سیستم بینایی برای ابداع الگوریتم های پردازش تصویر و بینایی ماشین، به بهبود روش های قبلی و خلق روش های جدید کمک می کند. کلید واژه ها: سیستم بینایی سطح پایین، عوامل بینایی، مدل سازی، تابع گابور، شبک? عصبی.

یک روش جدید برای مکان یابی کلمات در متون تاریخی دست نویس فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی برق و کامپیوتر 1391
  محمد علی آبادی   جواد صدری

بازشناسی متون دستنویس یکی از مسائل مهم در حوزه ی بازشناسی الگوست که اگرچه در چند دهه ی اخیر، تحقیقات وسیعی روی آن صورت گرفته اما هنوز از برخی جهات به عنوان یک مسئله ی باز مطرح است. یکی از زمینه هایی که در بازشناسی متون دستنویس فارسی خیلی کم به آن پرداخته شده و جای پژوهش بسیار دارد، مکان یابی کلمات (word spotting) ، در متون تاریخی دست نویس است. اهمیت موضوع زمانی بهتر مشخص می شود که بدانیم در کشور عزیز ما ایران، گنجینه های بسیار گران بهایی از کتب، متون و اسناد بسیار مهم تاریخی و مذهبی دست نویس وجود دارد و در کتابخانه های بزرگ به صورت آرشیو در مکانهای مخصوص نگه داری و محافظت می شود و تنها تصاویر اسکن شده آن به صورتcd یا dvd در اختیار محققان و پژوهشگران علوم انسانی- مذهبی- تاریخی- پزشکی و... قرار می گیرد. متأسفانه اکثر این متون، فاقد هرگونه واژه نامه و فهرست(index) می باشند، بنابراین پیداکردن اصطلاحات و کلمات کلیدی در این کتب به سختی و با جستجوی چشمی تمام صفحات کتاب صورت می گیرد که کاری بسیار طاقت فرسا ، وقت گیر و غیر دقیق است. هدف این پایان نامه، ارائه ی یک روش برای مکان یابی کلمات در متون تاریخی دست نویس فارسی است. در این روش ابتدا عملیات پیش پردازش برروی تصاویر اسکن شده ی متن تاریخی صورت می پذیرد و سپس از تصاویر پیش پردازش شده ، خطوط کتاب و به دنبال آن زیرکلمات هر خط جداسازی می گردد. در ادامه، از تصویر هر زیرکلمه دو دسته ویژگی مبتنی بر ستونهای تصویر و مبتنی بر ناحیه بندی تصویر استخراج می شود. معیار شباهت تصاویر زیرکلمات، ترکیبی از میزان شباهت های هریک از این دو نوع ویژگی تصاویر است که به طور جداگانه محاسبه شده اند. شباهت ویژگی های نوع اول مبتنی بر تطبیق انحراف زمانی پویا (dynamic time warping) محاسبه می شود و شباهت ویژگی دوم مبتنی بر محاسبه ی فاصله اقلیدسی بین بردار چگالی نواحی دو تصویر است. در مرحله ی بعد، زیرکلمات استخراج شده، توسط یک الگوریتم خوشه بندی در کلاسهای هم ارز طبقه بندی می شوند. درآخر هم باید یک ناظر، کلاس های ایجادشده را برچسب بزند. این فرایند، اگرچه بسیار وقت گیر است اما برای هر کتاب، تنها کافیست یکبار اجرا شود تا اطلاعات خوشه ها ذخیره گردد. بعداز انجام این کار، هرگاه یک کاربر نهایی کلمه ای را جستجو کند، سیستم آن را به زیرکلمات می شکند و براساس اطلاعات ذخیره شده ی زیرکلمات، مکان های وقوع احتمالی آن کلمه را در کتاب عرضه خواهد داشت. این فرایند، برروی یک کتاب تاریخی دست نویس فارسی که در کتابخانه ی مرکزی دانشگاه بیرجند نگه داری می شود، مورد آزمایش قرار گرفت. نتایج مراحل تطبیق و خوشه بندی، خوب و قابل قبول بود اما مشکل اصلی در مرحله ی جداسازیست؛ زیرا اولا در تعداد زیادی از خطوط کتاب، زیرکلمات به هم چسبیده اند و ثانیا در بسیاری از موارد نیز، زیرکلمات برروی هم قرار گرفته اند که کار اختصاص نقاط و سرکش ها را باخطای زیاد مواجه می نماید.

تصدیق و تشخیص امضا به صورت برون خط در چک های بانکی فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی برق و کامپیوتر 1391
  طاهره معصومی   جواد صدری

امضا یکی از شاخص های تشخیص هویت و بازشناسی امضا یکی از مسایل مهم در تشخیص الگو است. علیرغم تحقیقات فراوانی که در زمینه بازشناسی امضا صورت گرفته است، تحقیقاتی که در زمینه تشخیص امضا بر روی چک های بانکی انجام شده است در جهان و ایران محدود است. چک های بانکی دارای قسمت های مختلف هستند و پس زمینه و نویز فراوانی دارند و نیز در بانک های ایران طرح چک ثابتی موجود نمی باشد و امضاهایی که بر روی برگه چک ثبت می شود از لحاظ مکان امضا تثبیت شده نیست. در این پایان نامه تایید و تشخیص امضا به صورت برون خط در چک های بانکی فارسی انجام شده است. دیتابیس بزرگی از امضاهای فارسی بر روی فرم های مخصوص با پس زمینه سفید و چک های طراحی شده جمع آوری شد. از آنجا که مراحل پیش پردازش و سپس استخراج ویژگی، مهم ترین مراحل در بازشناسی الگو به شمار می رود، در این پایان نامه بیشتر بر این دو مرحله تاکید شده است. با بررسی تحقیقات پیشین، ویژگی های ناحیه بندی، ثابت های گشتاور، تبدیل رادون، عدد اویلر، ویژگی های هندسی از تصاویر باینری و کنتراست glcm و همبستگی glcm از تصاویر خاکستری استخراج شد. برای مرحله طبقه بندی در سیستم تایید امضا از شبکه عصبی، support vector machine (svm)، dynamic time warping (dtw) و در سیستم بازشناسی طبقه بند naivebayes(nb) به کار رفته است. نتایج مربوط به این تحقیق برای بازشناسی و تایید امضای دست نویس بر روی چک های فارسی قابل قبول می باشد.

تعیین میدان کرنش در مجاورت نوک ترک به کمک الگوریتم های پردازش تصویر
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی 1391
  هادی داستانی   جواد صدری

موضوع تعیین میدان های تغییر مکان، کرنش و تنش در مجاورت نوک ترک در مکانیک شکست از اهمیت خاصی برخوردار است. با شناخت میدان جابجایی و محاسبه کرنش در مجاورت نوک ترک می توان با استفاده از روابط تحلیلی مکانیک شکست، اطلاعاتی چون ضرایب شدت تنش در حالت های مختلف بارگذاری، چقرمگی شکست ماده و تنش در مجاورت نوک ترک را تعیین کرد. هدف از تحقیق حاضر ارائه الگوریتم هایی برای بررسی میدان تغییر مکان در نزدیکی نوک ترک و متعاقبا محاسبه میدان کرنش با استفاده از روش پردازش تصویر می باشد. پس از آماده سازی و برش اولیه نمونه های آزمایشگاهی mdcb (تیر دوسر گیردار اصلاح شده) از بدنه لوله، با استفاده از لیزر شبکه ای مرجع بر روی سطح نمونه ها ایجاد می شود. بارگذاری تحت شرایط حالت اول شکست و بصورت استاتیکی اعمال شده و در حین بارگذاری از مراحل رشد ترک در سطح نمونه فیلم برداری و عکس برداری می شود. با استفاده از الگوریتم های پردازش تصویر، موقعیت نوک ترک، زاویه گشودگی نوک ترک (ctoa) و نهایتا تغییرات پیوسته میدان تغییر مکان (دوبعدی) در سطح نمونه و در مجاورت نوک ترک، با کمک تصاویر تهیه شده در حین آزمون بررسی شده و نهایتا از این تغییرات، میدان کرنش استنتاج می شود. برای محاسبه کرنش، تغییرات شبکه مرجع بر سطح نمونه در فاصله مشخصی از نوک ترک نسبت به حالت اولیه اندازه گیری شده است. با توجه به جدید بودن نمونه آزمایشگاهی و روش محاسبه میدان های تغییر مکان نتایج حاصله می تواند مورد کاربرد محققان در آینده قرار گیرد.

تشخیص نفوذ از نوع آنومالی با استفاده از شبکه های عصبی بدون ناظر
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1391
  زهرا اخلاقی راد   مهدی رضاییان

در مباحث امنیت سیستم ها و شبکه های کامپیوتری، منظور از تشخیص نفوذ، تشخیص آن دسته از حملات و نفوذ هایی است که با استفاده از مکانیزم های معمول پیشگیرانه، ازجمله روش های هویت شناسی و اعتبارسنجی، کنترل دسترسی، حفاظ و رمزنگاری، امکان پیشگیری از بروز آن ها وجود ندارد. یکی از روش های موجود در تشخیص نفوذ، بهره گیری از شبکه های عصبی مصنوعی می باشد، که هم برای تشخیص سوءاستفاده، بر اساس الگوهای حملات از قبل شناخته شده و هم برای تشخیص ناهنجاری، بر اساس نمایه های نرمال، می تواند به کار گرفته شود. در این پایان نامه یک سیستم تشخیص نفوذ مبتنی بر شبکه های عصبی بدون ناظر معرفی می گردد. این سیستم امکان آموزش، تست، به کارگیری شبکه عصبی بدون ناظر som را در یک سیستم تشخیص نفوذ فراهم می آورد. روش محاسبه ویژگی های انتخاب شده برای شبکه عصبی som در تشخیص نفوذ محاسبه آنتروپی ویژگی ها است که کمترین مقادیر در 41 ویژگی محاسبه شده و به شبکه داده می شود. ارزیابی بر اساس مجموعه داده های kdd cup 99 انجام گرفته است.

کنترل کیفیت و دسته بندی خودکار دانه بندی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی مکانیک 1391
  سلیمان منادی زاده   جواد صدری

با پیشرفت صنعت مواد غذایی و افزایش میزان تولید، استفاده از روش های نوین برای کنترل کیفیت، محصولات کشاورزی مورد نیاز می باشد لذا بدین منظور در سال های اخیر توجه زیادی به استفاده از ماشین بینایی در اتوماسیون تولید و کنترل کیفیت محصولات غذایی معطوف شده است. استفاده از ماشین بینایی در کنترل کیفیت محصولات غذایی، به دلایلی همچون سرعت عمل بسیار بالا، عدم تماس فیزیکی با محصول، سهولت یکپارچگی با سایر اجزای اتوماسیون و سهولت مستند سازی کیفیت محصول، مورد توجه خاص قرار گرفته است. یکی از مشکلات عمده در کنترل کیفیت محصولاتی همچون دانه های غلات، بی نظمی صحنه مورد بازرسی است. دانه های مورد بازرسی در موقعیت و امتداد نامشخصی نسبت به دوربین قرار داشته و مهمتر از آن اینکه ممکن است دانه ها با یکدیگر تماس داشته باشند به گونه ای که دو یا چند دانه تشکیل یک مجموعه با شکلی واحد را بدهند. این امر موجب می گردد تا کنترل کیفیت محصول توسط سیستم بینایی بسیار مشکل گردد. تدوین الگوریتم های مناسبی که بتواند در وهله ی اول جداسازی دانه ها را انجام دهد یک ضرورت به نظر می رسد. علاوه بر آن در حین کنترل کیفیت لازم است وجود موادی همچون ناخالصی ها، دانه های شکسته و یا معیوب نیز تشخیص داده شوند. پژوهش حاضر به بررسی دو نوع از دانه های غلات پر مصرف یعنی گندم و برنج پرداخته است و الگوریتم های مختلفی بدین منظور تدوین گردیده اند تا برای هر یک از این دو محصول ابتدا جداسازی دانه ها به صورت خودکار انجام گیرد. این الگوریتم ها بسیار موفق عمل نموده به گونه ای که جداسازی دانه ها به میزان 98% با موفقیت انجام می شود، سپس با استفاده از ویژگی های به دست آمده از تصویر دانه های جداسازی شده، دانه ها بر اساس دانه های سالم و شکسته دسته بندی می گردند. این پژوهش نشان می دهد که با اصلاح الگوریتم های موجود می توان با خطای کمتری به جای استفاده از اپراتور و سیستم های مکانیکی از الگوریتم های پردازش تصویر و ماشین بینایی به منظور جداسازی، کنترل کیفیت و دسته بندی دانه ها استفاده نمود.

طراحی برنامه ای برای ترجمه ماشینی جملات مرکب و پیچیده از زبان انگلیسی به فارسی بر مبنای دستور واژی-نقشی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده ادبیات و علوم انسانی 1391
  زهرا داوریان   جواد صدری

امروزه پروژه های ترجمه ماشینی با سرعت و دقت خاصی در سرتاسر جهان و به ویژه در کشورهای توسعه-یافته ی غربی و شرقی پی گیری می شوند اما متأسفانه کشور ما هنوز به طور جدی وارد این حیطه ی مهم تحقیقاتی نشده است. از میان پروژه های موجود پدیده، پارس و گوگل تجاری ترین و عملیاتی ترین پروژه ها هستند. گرچه این سیستم ها دارای عملکرد و کیفیت قابل قبولی اند اما بیشتر برای ترجمه ی جملات ساده ی انگلیسی طراحی شده اند و قادر به ترجمه ی ساختارهای مرکب و پیچیده نیستند. پروژه ی حاضر درصدد است راهکارهایی برای ترجمه ی ماشینی ساختارهای مرکب و پیچیده انگلیسی به فارسی بر مبنای دستور واژی-نقشی ارائه دهد. این دستور از آن جهت به عنوان مبنای نظری این کار برای تجزیه و تحلیل جملات انگلیسی و نیز جایگزینی و تولید جملات فارسی در نظر گرفته شده است که انگاره ای بسیار دقیق و ریاضی گونه از ساخت جمله و نحوه ی تجمع اطلاعات واژگانی در گروه ها وجمله به دست می دهد و بنابراین می تواند انگاره-ای مطلوب در پردازش رایانه ای زبان های طبیعی و طراحی ماشین های ترجمه باشد. این دستور قابلیت خود را ترجمه ی ماشینی جملات ساده در پروژه های مختلف به اثبات رسانیده است و ما نیز معتقدیم می توانیم قابلیت آن را در ترجمه ماشینی ساختارهای مرکب و پیچیده نیز نشان دهیم.

هم ترازی چندگانه توالی های پروتئینی بر اساس ساختار خانواده پروتئین
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1392
  محمود نقیب زاده

هم ترازی چندگانه توالی های پروتئینی تکنیکی جهت نمایش رابطه میان اسیدهای آمینه چندین توالی پروتئینی می باشد. بدین معنا که چندین توالی پروتئینی با یکدیگر به گونه ای هم تراز شوند که بیش ترین مشابهت را با هم پیدا کنند. این مسئله یکی از اساسی ترین مسائل در حوزه بیوانفورماتیک می باشد. اهمیت آن به دلیل کاربردش در تخمین درخت تکاملی، پیش بینی عملکرد و ساختار دوم و سوم پروتئین ها و نیز یافتن موتیف میان توالی های پروتئینی می باشد. یافتن هم ترازی چندگانه بهینه، مسئله ای است رام نشدنی و سه دهه می باشد که محققین در تلاش برای بهبود زمان و دقت حل این مسئله هستند. در این پایان نامه، روشی پیش رونده مبتنی بر ساختار دوم پروتئین ها جهت هم ترازی چندگانه آن ها ارائه شده است. در روش پیش رونده، ترتیب هم ترازی توالی ها در دقت نتیجه به دست آمده تأثیرگذار می باشد. از این رو در روش پیشنهادی از شباهت ساختار دوم توالی های پروتئینی جهت تعیین ترتیب هم ترازی توالی ها استفاده شده است. در ابتدا توالی ها بر اساس شباهت ساختار دوم آن ها به گروه هایی تقسیم شده، سپس توالی های موجود در هر گروه با یکدیگر هم تراز می شوند. این هم ترازی به صورت موازی با استفاده از تکنیک برنامه نویسی چند نخی در گروه های تفکیک شده، صورت می پذیرد. در انتها نتایج هم ترازی تمامی گروه ها با یکدیگر هم تراز می گردند. نتایج به دست آمده از آزمایشات انجام شده، نشان می دهد که استفاده از این روش سبب بهبود کیفیت و سرعت هم ترازی می شود.

ارائه الگویی برای ترجمه انگلیسی به فارسی واژگان چند معنایی بر اساس روش بافت محور از طریق روش معنایی توزیعی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده ادبیات و علوم انسانی 1392
  سمانه ستوده چافی   جواد صدری

در این بررسی الگویی ارائه شده است که ابهام کلمات چندمعنایی را رفع می کند. این الگو سیستم را به کلمات مجاور در بافت حساس می کند و بنابراین جستجوی جمله جدید، نشانه هایی را برای انتخاب یک معادل خوب برای کلمه چندمعنایی در اختیار سیستم قرار می دهد. نتایج مثبت روش معنایی توزیعی و شبکه عصبی ما را بر آن داشت تا از آنها در ابهام زدایی دو کلمه چندمعنایی conclusion و canal استفاده کنیم. این دو کلمه نماینده طبقه اسم هستند که به طور تصادفی انتخاب شده اند. ویژگی که نقطه قوت این تحقیق به شمار می رود روش یادگیری افزایشی است که توسعه و افزایش داده جدید را بدون فراموشی داده های پیشین ممکن می سازد. نتایج بدست آمده از روش توزیعی معنایی چندان رضایت بخش نبود و حتی نتایج نادرستی بدست آمد. خروجی های شبکه عصبی حاکی از کارایی این روش است و بیانگر پتانسیل اعمال این روش در ابهام زدایی معنایی است.

استخراج متن از تصاویر تابلوهای تجاری فارسی به کمک تکنیک های پردازش تصویر
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی برق و کامپیوتر 1392
  حسین محمدی   جواد صدری

کاراکترهای متن موجود در تصاویر و دنباله های ویدئویی، یک منبع غنی از اطلاعات را برای کاربردهای مختلف اعم از شاخص گذاری و بازیابی بر پایه ی محتوای آن ها فراهم می کنند. با این حال، به علت مشکلات متعددی ازقبیل تنوع سایز، فونت، رنگ، سطح روشنایی، جهت، زمینه ی پیچیده و...، تشخیص و استخراج متون از تصاویر همچنان به صورت یک مسأله کاملاً حل نشده، باقی مانده است. اگرچه در این زمینه برای برخی از زبان ها تحقیقات متعددی صورت گرفته و نتایج نسبتاً خوبی حاصل شده است، اما علیرغم محبوبیت فراوان زبان فارسی، مورد غفلت محققان این زبان واقع شده و خلأ عظیمی از این لحاظ احساس می شود. در این پایان نامه یک سیستم استخراج متن از تصاویر تابلوهای تجاری فارسی ارائه شده است که مبتنی بر تشخیص لبه های حروف و عملیات مورفولوژیکی در تصاویر می باشد. اطلاعات لبه بدست آمده از سه جزء تشکیل دهنده ی رنگ در فضای rgb، با هم ادغام می شود و با بهره گیری از عملگرهای مورفولوژیکی و عناصر ساختاری در جهت عمودی و افقی گسترش می یابد. در مرحله ی بعد با استفاده از ویژگی های ذاتی متون و محدودیت های هندسی، اجزاء متصل کاندیدای متن انتخاب شده و پس از پر کردن حفره های موجود در تصویر، اجزاء متصل غیر بسته و نویزی تصویر با بکارگیری عملگرهای مورفولوژی حذف می شوند. سپس با توجه به پیوستگی فاصله ای اجزاءمتصل متنی، نواحی کاندید متن به هم اتصال یافته و نواحی غیر متن با تحلیل منحنی افکنش تصویر حذف می گردند. به عنوان آخرین مرحله، برای شفاف سازی متون و مهیا کردن آن ها برای ارائه به یک سیستم بازشناسی متن (ocr)، می بایست نواحی متن انتخابی را به طور محلی پس پردازش کرد و پس زمینه محاط بر حروف را از نواحی متن باقیمانده حذف نمود که درنهایت یک تصویر باینری از نواحی متنی با پیکسل های سیاه برای متن و پیکسل های سفید برای پس زمینه ی آن خواهیم داشت. با توجه به نتایج آزمایشی بدست آمده( دقت 87.8% و فراخوانی 69.9%)عملکرد خوب سیستم پیشنهادی و برتری آن بر برخی روش های موجود غیر قابل انکار است.

بررسی مشخصه های آکوستیکی واج های فارسی و شبیه سازی سیستم تشخیص واج و گوینده بر اساس ویژگی های آکوستیک
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - پژوهشکده ادبیات 1392
  اسما کریمی مقدم آرانی   جواد صدری

هدف پروژه ی حاضر استخراج و استفاده از ویژگی های آکوستیکی موج صدا برای شناسایی سخنگو و واج های زبان فارسی است. این ویژگی ها از روی طیف نگاشت موج صوتی آوا ها در این پروژه معرفی و تحلیل شده اند. این ویژگی ها برای تظاهر آکوستیکی هر واج و همین طور گفتار هر گوینده، منحصر به فرد هستند بطوریکه می توان از آنها به عنوان کلید های شناسایی گفتار و گوینده استفاده کرد. نتایج بدست آمده در بخش عملی پروژه، این ادعا را ثابت می کند. در بخش عملی، داده ها شامل تظاهر آکوستیکی تمام واج های زبان فارسی (22 صامت و 6 مصوت) از 52 سخنور فارسی معیار (26 زن و 26 مرد) در محیط آکوستیکی به صورتstereo و با نرخ نمونه برداری 44100 هرتز وdepth 16 bit در محیط نرم افزار پرت ضبط شد. هر آزمودنی، 28 آوا را 5 بار تکرار کرد و در مجموع پایگاه داده شامل 7280 آوا است ( از هر آوای منفرد 260 تکرار). واج ها بر اساس شیوه تولید در 6 گروه دسته بندی شد. پایگاه داده ی سخنگویان شامل 20 سخنگوی فارسی معیار (10 زن و 10 مرد) است که 6 مصوت زبان فارسی را 5 بار تکرار کرده اند (600 آوا). برای استخراج کلید های آکوستیکی، بعد از تفکیک آوا ها و حذف سکوت و خشه در فضای نرم افزار پرت، از پنجره همینگ استفاده شد. مدل لگاریتمی که برای این کار در نظر گرفته شد، fourier و صافی ها با پهنای باریک بوده است. در مرحله بعدی این کلید ها به عنوان ضرایب کپسترال در مقیاس مل ( mfcc) برای 25 میلی ثانیه از بازه زمانی سیگنال صدا، کمّی شد. در نهایت ماشین را با استفاده از الگوریتم هارمونی سرچ (hdhsa ) برای بازشناسی واج و گوینده فارسی آموزش دادیم. نرخ بازشناسی سخنگو در این پروژه 90%، و نرخ بازشناسی تظاهر آکوستیکی واج های فارسی در تمام دسته های آوایی به جز سایشی که 99.51% گزارش شد، 100% بود. تحلیل های آکوستیکی روی زبان فارسی می تواند اطلاعات مفیدی از ویژگی های آوایی آوا های فارسی برای ارائه ی تعریف کامل و جامعی از آوا ها جهت مقایسه با زبان های دیگر و دسته بندی آوایی صدا های زبان فارسی در اختیار محققین زبانشناسی قرار دهد. به علاوه، در کشف دلایل و ریشه های مشکلات گفتاری در حوزه گفتار-درمانی، به عنوان مثال بازشناسی آوا های تولید شده توسط بیماران مبتلا به اختلالات زبانی، نیز کاربرد دارد. از طرف دیگر، با توجه به اینکه سیستم شناسایی آوا و گفتار به ویژگی های آکوستیکی کلام نیاز دارد، این تحقیقات می تواند در ارتقای کیفیت عملکرد این سیستم ها و کاهش ضریب خطا در مراحل طراحی و ساخت موثر باشد.

بازشناسی و مکان یابی اشیا در صحنه های پیچیده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق و کامپیوتر 1392
  عباس زهره وند   علیرضا احمدی فرد

در این پایان¬نامه روشی برای بازشناسی و مکان¬یابی اشیا در صحنه¬های پیچیده(شلوغ) ارائه شد. یکی از مهمترین و ابتدایی ترین مراحل در بینایی ماشین ، بازشناسی اشیا می¬باشد. اگر این فرآیند به درستی و با قابلیت اطمینان انجام نشود مراحل بعدی به درستی صورت نمی¬گیرد. روش پیشنهاد شده در نهایت ترکیبی از دو روش موجود می¬باشد. هر دو روش موجود از یک فرآیند آرام¬سازی احتمالاتی برای تطبیق استفاده می¬کنند. این دو روش ابتدا با استفاده از توصیفگر sift نقاط کلیدی را برای صحنه و مدل بدست آورده و سپس با استفاده از تعریف همسایگی، از نقاط بدست آمده یک گراف می¬سازند. هر نود در گراف ساخته یکی از همان نقاط کلیدی است. این گراف سپس با استفاده از دو ویژگی توصیف می¬شود. ویژگی یکانی که برای توصیف هر نود به تنهایی استفاده شده و همان بردار 128 تاییsift می¬باشد. ویژگی باینری برای توصیف همسایگی دو نود استفاده می¬شود. برای ویژگی باینری از ویژگی-های مقیاس و جهت استخراج شده توسطsift استفاده می¬شود. برای بررسی تحمل دو روش تطبیق از یک سو و همچنین تعیین دقیق پارامترهای مسئله تطبیق، یک محیط شبیه سازی ساخته شد. در ادامه اتفاقات متداول دنیای واقعی در این محیط شبیه سازی شد. سپس تحمل دو روش تطبیق در این محیط شبیه سازی مورد ارزیابی قرار گرفت. حاصل این ارزیابی نشان¬داد که روش اول با استراتژی نود ساختگی پوچ عملکرد بهتری نسبت به روش دوم داشت. از طرفی وقتی نویز به صحنه وارد می¬شد روش دوم عملکردی بهتری داشت. هردو روش زمانیکه قدرت نویز از یک آستانه فراتر می¬رفت دچار یک آشوب می¬شوند لذا نرخ بازشناسی خوبی بالایی نداشتند. در این حالت روش اول از آنجا که به دلیل وجود نویز هیچ مشاهده قابل اعتمادی وجود نداشت تمامی نودها را به سمت نود پوچ میل می¬داد. در نهایت چندین سناریوی واقعی ترتیب داده شد و دو روش تطبیق در این سناریوها مورد ارزیابی قرار گرفت. همانظور که انتظار می¬رفت روش اول قابلت اطمینان(منظور از قابلیت اطمینان تعداد تطبیق¬های اشتباه کمتر می¬باشد) بیشتری نسبت به روش اول داشت. اما روش دوم تعداد تطبیق¬های درست بیشتری را پیدا می¬کرد. برای استفاده از ویژگی¬های مناسب دو روش، یعنی قابلیت اطمینان بالا در کنار نرخ بازشناسی بالا ترکیب دو روش پیشنهاد شد. روش پیشنهادی نه تنها قابلیت اطمینان بالاتری نسبت به دو روش اول و دوم داشت، بلکه نسبت به هردو روش نرخ باز شناسی بالاتری داشت.

بهبود بازشناسی ارقام دستنویس فارسی به کمک خوشه بندی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی 1390
  اسماعیل میری   محمد رضوی

بازشناسی ارقام دستنویس فارسی یکی از شاخه های حوزه بازشناسی الگو است. تحقیقات در این زمینه چندین دهه است که آغاز شده و هنوز هم در حال تحول می باشد. این تحقیق به بهبود نرخ بازشناسی ارقام دستنویس فارسی با استفاده از خوشه بندی پرداخته است. در این پایان نامه از سه طبقه بندی کننده فازی، شبکه عصبی چند لایه ی پرسپترون و شبکه عصبی احتمالاتی برای بازشناسی ارقام دستنویس فارسی استفاده شده است. در یک روش داده های آموزش بطور کلی خوشه بندی و در هر خوشه نسبت به آموزش طبقه بندی کننده فازی با قوانین دهگانه اقدام شده است، بازشناسی داده های آزمایش ابتدا نزدیک ترین خوشه به داده آزمایش ورودی مشخص شده و سپس در خوشه مزبور طبقه بندی کننده فازی بازشناسی را انجام می دهد. در روش دوم در هر کلاس، داده های آموزشی خوشه بندی می شوند. در این حالت تعداد کلاس ها برابر مجموع تعداد خوشه های کلاس های داده های آموزشی خواهد شد. در روش سوم از خوشه بندی فازی و شبکه عصبی استفاده شده است، بدین ترتیب که هر کلاس از داده های آموزشی مانند روش دوم خوشه بندی می شود و شبکه با این کلاس های جدید آموزش می بیند. در روش پایانی از شبکه عصبی احتمالی با خوشه بندی داده های آموزش مانند روش دوم و آموزش شبکه با مراکز خوشه ها استفاده شده که منجر به حل مشکل نیاز به حافظه بالا، سرعت و در عین حال نرخ طبقه بندی بالا در این شبکه های عصبی می شود. در روش اول تعداد خوشه های بهینه با افزایش تعداد خوشه ها تا حصول بالاترین نرخ بازشناسی بدست می آید. در سه روش دیگر برای تعیین تعداد خوشه های بهینه الگوریتم بهینه سازی جمعیت ذرات با ذره بردار 10 حاوی تعداد خوشه های بهینه کلاس های دهگانه و تابع سازگاری نرخ بازشناسی داده های تصدیق استفاده شده است. برای بازشناسی ارقام دستنویس ویژگر های زونینگ، مکان مشخصه وگشتاورهای زرنیکی استفاده شده و تکنیک های خوشه بندی k-means و fcm بکار گرفته شده است. پایگاه داده ی مورد استفاده در این پایان نامه پایگاه داده هدی است. این پایگاه داده شامل 102352 نمونه است که از 60.000 نمونه برای آموزش و تصدیق طبقه بندی کننده و 20.000 نمونه جهت آزمایش استفاده شده است. نتایج مربوط به این پایان نامه که در فصل چهارم گزارش شده نشان دهنده تاثیر چشمگیر خوشه بندی در افزایش نرخ بازشناسی ارقام دستنویس فارسی است.

بررسی تجربی تاًثیر پارامترهای ماشینکاری آلیاژ اینکونل 718 بر تنش پسماند و صافی سطح و بهینه سازی فرآیند
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی مکانیک 1393
  فرشید جعفریان   حسین امیرابادی

یکپارچکی سطح قطعهی ماشینکاری شده به عنوان یکی از مهمترین و ضروریترین معیارها جهت ارزیابی کیفیت و عمر کاری محصول نهایی همواره مورد توجه مهندسین و صنایع پیشرفته بوده است. سوپرآلیاژ اینکونل 718 به عنوان یک ماده سخت دارای خواص منحصر بفردی است که سبب کاربرد گسترده آن در صنایع هوایی شده است . بنابراین بررسی یکپارچگی سطح در فرآیند ماشینکاری نهایی این سوپرآلیاژ بسیار حائز اهمیت میباشد و نقش بسیار مهمی در کارایی قطعات تولید شده ایفا مینماید. از این رو در بخش نخست این تحقیق با استفاده از مطالعات تجربی و سیستم های هوشمند شاخصه های مهم یکنواختی سطح شامل تنش های پسماند سطحی و زبری سطح قطعه کار در فرآیند ماشینکاری نهایی سوپر آلیاژ اینکونل 718 مورد بررسی قرار گرفت. نتایج حاکی از آن بود که با استفاده از سیستمهای هوشمند پارامترهای ماشینکاری بگونهای تعیین گردید که شرایط بهینهی تنش پسماند و زبری سطح در وضعیتهای مختلف بدست آمد. از طرفی دیگر شبیه سازی اجزای محدود فرآیند ماشینکاری که در سالهای اخیر به شدت مورد توجه محققین قرار گرفته است، به عنوان ابزاری کارآمد جهت فهم بیشتری از فرآیند براده برداری بکار گرفته میشود. مهمترین مسئله در این راستا دقت نتایج مدل اجزای محدود و قابلیت شبیه سازی خروجیهای حائز اهمیتی همچون شاخصههای یکپارچگی سطح میباشد. از اینرو قسمت دوم از این رساله به شبیه سازی اجزای محدود براده برداری سوپر آلیاژ اینکونل 718 و بررسی موارد مذکور اختصاص یافت. در ابتدا راهکارهای موثری جهت بهبود دقت نتایج شبیه سازی ارائه گردید، سپس با استفاده از مکانیزم تبلور مجدد مکانیکی تغییرات میکروساختاری به عنوان یکی از شاخصههای مهم یکپارچگی سطح در ماشینکاری اینکونل 718 شبیه سازی شد. نتایج حاکی از آن است که استراتژیهای بکار گرفته شده در این تحقیق میتواند به عنوان گامی موثر جهت بهبود دقت نتایج شبیه سازی ماشینکاری مواد سخت استفاده گردد.

بهبود سیستم تشخیص کاربران بدرفتار وب از طریق کاوش در logهای وب سرور
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی ارومیه 1392
  محمدرضا یگانه زاد   جواد صدری

ربات های وب به عنوان کاربران وب سایت ها و سرویس دهنده های وب سرتاسر شبکه ی جهانی وب را جهت اهداف گوناگونی پیمایش می کنند. این کاربران غیر از عملیات مفید مانند اندیس گذاری و راحت تر کردن عملیات جستجو، می توانند آزاردهنده و تهدیدکننده نیز باشند. تهدیداتی مانند جعل کلیک، استخراج آدرس های پست الکترونیک از وب سایت جهت ارسال نامه های هرز و حملات توزیع شده ی محروم سازی از سرویس، نمونه های شناخته شده ی فعالیت های مخرب از این کاربران وب سایت ها به عنوان ربات¬های بدرفتار می¬باشد که اخیراً مشاهده شده است. جهت ارزیابی تاثیر الگوریتم¬های مختلف در تشخیص نشست¬های ربات¬¬های بدرفتار با سرویس¬دهنده¬ی وب در این پژوهش یک فرآیند یادگیری با ناظر پیشنهاد شده¬است. در این فرآیند یادگیری پس از اعمال یک مکانیزم برچسب گذاری نوین بر اساس ip، مجموعه ی نشست¬های استخراجی از فایل لاگ سرویس-دهنده¬ی وب را به 3 دسته ی نشست های اعتبارسنجی، نشست های آموزش و نشست های آزمون تقسیم می¬کنیم. پس از استخراج هوشمند ویژگی های مناسب، رفتار کاربران را بر اساس نشست-هایشان که نمایانگر چگونگی پیمایش آنها در وب¬سایت است مدل سازی می¬کنیم. مدل آموزش دیده شده با مجموعه داده¬ی آموزشی را با مجموعه داده ی آزمون از طریق یک استراتژی 2 مرحله ای آبشاری به عنوان الگویی جدید از دسته بندی، آزمایش می کنیم. بر اساس این استراتژی، نشست آزمون می تواند مورد پذیرش یا عدم پذیرش واقع شود. موارد پذیرش شده را با معیارهایی مانند دقت، یادآوری و f score ارزیابی می کنیم. تصمیم گیری در رابطه با مواردی که رد شده اند بر عهده ی مدیر سرویس دهنده یا وب سایت است.

ترجمه ماشینی گروه اسمی از انگلیسی به فارسی بر اساس روش ترکیبی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده ادبیات و علوم انسانی 1393
  فهیمه خامسی   جواد صدری

امروزه، پیشرفت روز افزونی در کیفیت ترجمه ماشینی در سرتاسر دنیا صورت گرفته است، اما متاسفانه در کشور ما محققین به طور جدی وارد این حوزه تحقیقاتی مهم نشده اند و هنوز، پتانسیل قابل توجه ای برای بهبود کیفیت ماشین ترجمه در زبان فارسی وجود دارد. وجود رویکردهای مختلفی برای ترجمه ماشینی از جمله روشهای قاعده محور، آماری، ترکیبی و ... باعث شده است که رغبت فراوانی، جهت یافتن بهترین ترجمه با ترکیب خروجی یک سیستم با سیستم دیگر ایجاد گردد. پروژه حاضر در صدد است سیستمی ترکیبی برای ترجمه ماشینی گروه اسمی از انگلیسی به فارسی با ترکیب روشهای قاعده محور و آماری ارائه دهد. نتایج مثبت روشهای ترکیبی در زبانهای دیگر، ما را بر آن داشت تا از روش پس-ویرایشگر اتوماتیک برای ویرایش ترجمه خروجی ماشین قاعده محور، استفاده کنیم. برای دستیابی به این هدف، ماشین قاعده محور، جهت ترجمه گروه اسمی، طراحی شد و ماشین پس_ویرایشگر اتوماتیک نیز در سطح آزمایشگاهی طراحی و اجرا گردید. نتایج حاصله از این بررسی نشان داد که کیفیت خروجی ماشین ترجمه، در سطح گروه اسمی بهبود یافته است و انتظار می رود که این سیستم بتواند در سطح جملات ساده و یا پیچیده نیز، نتایج قابل قبولی را ارائه نماید.

شناسایی حروف و علائم متون فارسی با کمک منطق فازی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد 1376
  جواد صدری   محمود نقیب زاده

در این پایان نامه روش جدیدی برای بازشناسی حروف مجزا، ارقام و علائم متنی فارسی ارائه شده است . لذا این پایان نامه در هفت فصل به شرح زیر تنظیم شده است : فصل اول : این فصل به مقدمه و آشنایی کلی با روشهای ocr و کاربردهای آن اختصاص دارد. فصل دوم : اصول تشخیص الگو و مراحل آن به صورت کلی مورد بحث قرار می گیرد و دو روش تشخیص الگو بیان شده و با هم مقایسه می شوند. فصل سوم : این فصل به بیان ویژگیهای خط و نوشتار لاتین و فارسی و مقایسه آنها از دیدگاه ocr می پردازد. فصل چهارم: این فصل به بررسی مقالات ، روشها و کارهای انجام شده در مورد ocr فارسی و عربی و ارزیابی پیشرفتهای انجام شده می پردازد. فصل پنجم : این فصل به ارائه روش و سیستم جدید معرفی شده در این پایان نامه می پردازد. فصل ششم : این فصل به طراحی و پیاده سازی سیستم ارائه شده در فصل پنجم می پردازد و قسمتهای مختلف آن را از دیدگاه پیاده سازی بررسی می کند. فصل هفتم: به بررسی نتایج حاصل از آزمایش سیستم و نتیجه گیری کلی اختصاص دارد.