نام پژوهشگر: ناصر فرج زاده
عزیز کرمیانی عسگرعلی بویر
چکیده بینایی ماشین یکی از فیلدهای هوش مصنوعی است که با ترکیب علوم مختلف مانند ریاضیات، فیزیک، علوم مهندسی، کامپیوتر، فیزیولوژی و غیره سعی در درک هوشمند معنا از تصاویر محیط اطراف توسط کامپیوتر یا ماشین دارد. ردیابی اشیاء متحرک یکی از کاربردهای مهم بینایی ماشین است که نقشی اساسی را برای سیستم های سطح بالاتر بینایی مانند کنترل ترافیک، سیستم های نظارتی، تعامل انسان با کامپیوتر، ناوبری خودکار و بازشناسی بر اساس اطلاعات حرکت بازی می کند. در این پایان نامه دو روش را برای ردیابی اشیاء متحرک در حالت دوربین متحرک ارائه می کنیم. در هر دو روش و با توجه به اینکه حرکت دوربین یک چالش بزرگ در ردیابی اشیاء متحرک تلقی می شود، این حرکت را تشخیص داده و تاثیر آن را خنثی می کنیم. در روش پیشنهادی اول که به ردیابی چندین شی متحرک بصورت همزمان می پردازد ابتدا حرکت دوربین را با استفاده از اطلاعات اندازه و جهت حرکت نقاط ویژگی klt تشخیص داده و از میان نقاط متناظر، نقاط ویژگی که حرکتی مشابه به حرکت دوربین داشته باشند را از مجموعه نقاط ویژگی حذف کرده و بر این اساس نقاط ویژگی برای اشیاء متحرک بدست خواهند آمد. سپس با اجرای یک مرحله بهینه سازی و با استفاده از ویژگی شدت روشنایی یک مجموعه از نقاط ویژگی بهینه (ofpt) برای ردیابی را استخراج کرده که از این مجموعه نقاط ویژگی بهینه برای ردیابی اشیاء متحرک موجود در حوزه دید دوربین متحرک با استفاده از خوشه بندی k-means و بردار ویژگی شامل موقعیت، اندازه حرکت و جهت حرکت استفاده کردیم. در روش پیشنهادی دوم و برای ردیابی یک شی خاص در دنباله فریم های ویدئویی، ابتدا ناحیه شی مورد علاقه بصورت دستی در فریم اول انتخاب شده و ویژگی های بافت آن استخراج می شود. سپس ماتریس حرکت دوربین را با استفاده از خوشه بندی نقاط ویژگی klt به دو خوشه اشیاء متحرک و پس زمینه تشخیص داده و با استفاده از این ماتریس تاثیر منفی حرکت دوربین را خنثی می کنیم. در ادامه و با الگوریتم تفاضل فریم و با در نظر گرفتن یک حد آستانه پویا، نواحی مرتبط به اشیاء متحرک موجود در حوزه دید دوربین متحرک کشف می شوند. در نهایت با استفاده از الگوریتم خوشه بندی dbscan اشیاء متحرک را کشف کرده و از میان این اشیاء کاندید بهترین انطباق را بعنوان ناحیه شی بر اساس ویژگی های بافت استخراجی در گام نخست بدست می آوریم. نتایج آزمایشات نشان می دهد که هر دو روش پیشنهادی در این پایان نامه حرکت دوربین را بخوبی تشخیص داده و و با حذف حرکت دوربین اشیاء متحرک را بشکل مطلوبی ردیابی می کنند. از آنجایی که در هر دو روش از ویژگی های گوشه برای ردیابی استفاده می کنیم در نتیجه در حالت تغییرات روشنایی محیط نیز روش های پیشنهادی عمل ردیابی را بدرستی انجام می دهند. از نظر زمان پردازش نیز روش های پیشنهادی توانایی کار روی سیستم های نظارتی و زمان واقعی را دارند. کلمات کلیدی: ردیابی، دوربین متحرک، اشیاء متحرک، خوشه بندی k-means، خوشه بندی dbscan.
امیرحسین شهسواری شهرام حسین زاده
پیشرفت های اخیر در فناوری اطلاعات و رسانه های ذخیره سازی دیجیتال، نگه داری حجم عظیمی از داده ها را با هزینه ی اندک امکان پذیر نموده است. بسیاری از صاحبان داده ها از این فرصت استفاده می کنند و به دلایل مختلفی (نظیر همکاری یک سازمان با سازمان های دیگر)، دست به انتشار داده های دیجیتال خود می زنند. از سوی دیگر، استفاده ی سودجویانه ی افراد و یا سازمان های رقیب از ابزارهای داده کاوی جهت استخراج دانش حساس از پایگاه داده ی منتشر شده می تواند منافع و حریم خصوصی صاحبان داده ها را با خطر مواجه سازد. به این ترتیب، فیلد تحقیقاتی جدیدی تحت عنوان حفظ حریم خصوصی در داده کاوی از اهمیت خاصی برخوردار شده است. در این پایان نامه روی پنهان سازی قواعد وابستگی به عنوان یکی از مهم ترین بخش های تحقیقاتی حفظ حریم خصوصی در داده کاوی تمرکز شده است و دو روش مبتنی بر تحریف به نام های fmarh و wmarh برای پنهان سازی قواعد وابستگی حساس در پایگاه داده های متمرکز ارائه شده است. در این روش ها برای اولین بار از مرحله ی استخراج قواعد وابستگی برای مقداردهی برخی از متغیرهای مورد نیاز در بخش پنهان سازی کمک گرفته شده است تا زمان اجرای الگوریتم ها کاهش یابد. در روش اول، تراکنش های حساسی برای ایمن سازی انتخاب می شوند که طول کوتاه تری دارند. برای انتخاب آیتم قربانی در این روش از سه پارامتر برای کاهش میزان قواعد گم شده استفاده می شود. در روش دوم که از جمله روش های پنهان سازی چند قانونی به شمار می رود، برای انتخاب تراکنش ها علاوه بر در نظر گرفتن طول، میزان حساسیت آن ها نیز مورد توجه قرار می گیرد و آیتم قربانی با بهره گیری از پنج پارامتر به نحوی انتخاب می شود که ضمن پنهان سازیِ هم زمان قوانین مختلف، تأثیر کمتری روی قواعد غیرحساس بگذارد و از آشکار شدن مجدد قوانین حساسی که در مراحل گذشته پنهان شده بودند نیز جلوگیری به عمل آید. نتایج آزمایشات نشان می دهد ضمن آن که روش های fmarh و wmarh از سرعت بالایی برخوردار هستند از لحاظ اثرات جانبی نیز کارایی مناسبی در برابر روش های شناخته شده ی algo 2b، mdsrrc و sif-idf دارند.
عطاء دلخون حسینی محسن حیدریان
تقسیم بندی معنایی تصویر یکی از مهمترین فعالیتهای بینایی ماشین است. این ماشین یادگیر دارای دو بخش مهم استخراج ویژگی و ماشین طبقه بند می باشد. ویژگی های تصویر با رویکرد ویژگی سراسری با الهام از ویژگی محلی، توسط یک فیلتر گابور با مقیاس های مختلف در جهات متفاوت، بروی بلوک هایی از یک تصویر اعمال می شود. برای حفظ پایداری ویژگی تصویر نسبت به تغییر زاویه و مقیاس، میانگین مقادیر به عنوان ویژگی تصویر معرفی می شود. سپس با کمک کدینگ اسپارس کتاب کد ایجادد گردید و پس از خوشه بندی پایه هایی به عنوان مراکز تصویر های آموزشی معرفی شد و با کد کردن تصاویر براساس این مراکز خوشه، توسط کلاسبند خطی برچسب گذاری می شود. یکی از مسائل دقت و هزینه زمانی در این فیلد می باشد و حجم بالای ویژگی ها بدست آمده بود یکی از اصلی ترین مسایل درایجاد کتاب کد است. نتایج این روش بروی پایگاه داده های caltech101و caltech 256 و 15-sense و graz-02 نشان میدهد که علاوه بر حفظ دقت طبقه بندی، سرعت آن به شکل قابل قبولی افزایش یافته است.
پگاه معتمدوزیری محسن حیدریان
ارزیابی کیفیت تصویر یکی از مهمترین فعالیتهای بینایی ماشین است که در حیطه های مختلفی نظیر نظارت، محک و بهینه سازی کاربرد دارد. در این پایان نامه یک روش جدید ارزیابی کیفیت تصویر بدون مرجع ارائه شده است. روش پیشنهادی از دو بخش استخراج ویژگی و رگرسیون تشکیل شده است. در بخش استخراج ویژگی از ویژگی هایی نظیر میانگین و انحراف معیار انتروپی تصویر، میانگین تجانس فازی و استاتیک های حاشیه ای هیستوگرام دامنه گرادیان و تفاضل گاوسی استفاده شده است. برای نگاشت از فضای ویژگی ها به فضای مقدار از دو روش رگرسیون بردار پشتیبان و شبکه عصبی استفاده شده است. آزمایشات روی پایگاه داده های live و tid2008 نشان می دهد که نتایج روش پیشنهادی بسیار به امتیازات افراد نظاره گر نزدیک است و دقت پیش بینی آن حدود 93% است. همچنین دقت و پیچیدگی زمانی آن از بسیاری از روشهای معروف موجود بهتر است.