نام پژوهشگر: محسن فتحیان

بازیابی محتوایی تصاویر بر مبنای یادگیری ماشین از طریق تعامل با کاربر
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده فنی و مهندسی 1390
  محسن فتحیان   فردین اخلاقیان طاب

با رشد سریع دستگاههای تصویربرداری، حجم تصاویر دیجیتال و پایگاه دادههای تصویری به سرعت رو به افزایش است، و از طرفی دسترسی کاربران به این تصاویر به سهولت صورت میگیرد. در نتیجه نیاز به سیستمهای بازیابی تصویر که بتواند به صورت موثر بازیابی تصویر را انجام دهد بیشتر شده است. در این پایان نامه، ساختاری برای پیاده سازی یک سیستم بازیابی تصاویر ارائه شده است که می تواند بر اساس محتویات بصری تصاویر و با استفاده از یادگیری نظرات کاربران عمل بازیابی را انجام دهد. برای توصیف شباهت تصاویر در این پایان نامه از دو ویژگی رنگ و بافت تصاویر استفاده گردیده است. برای توصیف ویژگی رنگ از دو روش هیستوگرام سراسری رنگ و اتوکرلوگرام رنگ تصویر ناحیه بندی شده استفاده شده است. محاسبه اتوکرلوگرام رنگ در روش پیشنهادی باعث موثرتر شدن و مقاوم شدن این توصیفگر نسبت به دوران و انتقال تصاویر میشود. اتوکرلوگرام ذاتاً یک روش توصیف محلی است؛ محاسبه اتوکرلوگرام رنگ در تصویر ناحیه بندی شده محلی بودن این اطلاعات را افزایش می دهد. برای اضافه نمودن اطلاعات سراسری رنگ، از هیستوگرام رنگ که یک توصیفگر کاملاً سراسری است در ترکیب با اتوکرلوگرام استفاده گردیده است. نتیجه این ترکیب، یک توصیفگر رنگ موثر است که می تواند بخوبی برای بازیابی تصاویر مورد استفاده قرار گیرد. مشکل عمده همه سیستم های مبتنی بر رنگ، ضعف در بازیابی تصاویر با محتوای مشابه و رنگ های متفاوت است. به منظور رفع این مسأله و بهبود روش مبتنی بر رنگ بیان شده از موجک گابور به عنوان ویژگی بافت در ترکیب با ویژگی های رنگ استفاده شد. برای ترکیب این سه ویژگی و محاسبه فاصله نهایی هر دو تصویر موجود، از یک سیستم مبتنی بر قواعد فازی استفاده شده است، که می تواند ترکیب بسیار موثرتری را ارئه نماید، و به تبع آن دقت نتایج نهایی بازیابی شده را نیز بهبود بخشد. تمامی مراحل ذکر شده به صورت برون خطی و تنها یکبار صورت می گیرند. در مرحله بازیابی تصاویر، سیستم با استفاده از بازخورد کاربران در پاسخ به تصاویر بازیابی شده برای پرس وجوی انجام شده، عمل یادگیری و بهبود نتایج را با استفاده از اتوماتای یادگیر توزیع شده، انجام می دهد. پایگاه داده مورد استفاده، مشتق شده از پایگاه داده corel می باشد، که تصاویر آن بر اساس شباهت مفهومی در 10 رده طبقه بندی شده اند. نتایج بدست آمده از روش های معرفی شده در این پایان نامه بسیار خوب و موثر است، و این روش ها میتوانند به عنوان یک روش عملی در بسیاری از کاربردها از جمله بازیابی تصاویر موجود در وب مورد استفاده قرار گیرند.