نام پژوهشگر: عبدالرضا میرزایی
اعظم عموزادی عبدالرضا میرزایی
هدف از این تحقیق، معرفی سیستم های رده بندی مبتنی بر قانون فازی توسط الگوریتم های تکاملی است. یکی از روش های رایج بیان دانش رده بندی در کاربرد های داده کاوی، استفاده از قوانین اگر- آنگاه می باشد، چنین قوانینی قادر به بیان دانش ضمنی موجود در مجموعه داده به فرمی قابل درک برای انسان هستند. قوانین اگر- آنگاه در سراسر فرایند تصمیم گیری به فرد خبره کمک نموده تا قوانین حاصل از سیستم را با دانش خود ترکیب و تصمیمات آگاهانه تری اتخاذ نماید. با توجه به این که منطق فازی قادر به توصیف روابط غیرخطی بین ورودی و خروجی، مدل سازی ابهام و عدم قطعیت بوده و توانایی استدلال دانش نادقیق و مبهم را دارا می باشد، به نظر می رسد ترکیب آن با قوانین اگر-آنگاه، منجر به استخراج قوانینی مشابه عملکرد انسان شود. به طور کلی سیستم های مبتنی بر قانون از نظر فرایند استنتاج به دو دسته سیستم های مدل ممدانی و تاکاگی سوگنو تقسیم می شوند. استفاده از سیستم های ممدانی و سوگنو به ترتیب منجر به تولید سیستم هایی با قابلیت تفسیر بالا و سیستم هایی با دقت بالا می شود که این دو معیار در ارزیابی سیستم های رده بندی مبتنی بر قانون حائز اهمیت هستند. با توجه به این که حالت ایده آل، تولید قانون های قابل تفسیر با دقت بالا است، در این تحقیق سعی شده که با ارائه ی یک ساختار جدید، دقت حاصل از سیستم های مدل ممدانی تا حد امکان افزایش داده شود. در تمامی روش های بیان شده جهت استخراج قوانین رده بندی فازی، تولید قوانین از طریق داده های ورودی، شامل دو فاز اصلی تقسیم بندی فضای الگو به زیر فضاهای فازی و تعیین قوانین فازی مرتبط با زیر فضاهای موجود است. کارایی سیستم رده بندی فازی وابستگی شدیدی به نحوه ی تقسیم بندی فضای الگو داشته و تقسیم بندی نامناسب منجر به ایجاد قوانین نامناسب خواهد شد. بنابراین در این تحقیق با پیشنهاد یک ساختار سلسله مراتبی جدید، سعی بر این شده است تقسیم بندی به گونه ای انجام شود که زیرفضاهای ریز و درشت به طور همزمان پوشش داده شوند. در این پایان نامه به منظور افزایش دقت قانون های حاصل از سیستم-های مدل ممدانی، دو روش جدید مبتنی بر الگوریتم ژنتیک پیشنهاد شده است. روش پیشنهادی اول با استفاده از الگوریتم ژنتیک مبتنی بر رویه ی میشیگان، به کارگیری روش adaboostو اعمال ساختار سلسله مراتبی پیشنهاد شده، به معرفی یک رده بند مبتنی بر قانون فازی سلسله مراتبی جدید می پردازد. رده بند پیشنهادی دوم نیز با بهره گیری از الگوریتم ژنتیک مبتنی بر رویه ی پیتسبرگ و اعمال ساختار سلسله مراتبی پیشنهاد شده، قوانین فازی تولید می کند. الگوریتم های پیشنهادی بر روی تعدادی از مجموعه داده های معروف رده بندی آزمایش شده و مقایسه ای بین الگوریتم پیشنهادی و برخی از رده بندهای فازی و غیر فازی صورت گرفته است. نتایج حاصل در اغلب موارد برتری روش های پیشنهادی را نشان می دهد.
الهه راشدی عبدالرضا میرزایی
ایده اصلی یادگیری تجمعی به منظور ترکیب پیش بینی یادگیرنده های چندگانه مطرح شده است. روش های یادگیری تجمعی در زمینه ی الگوریتم های یادگیری با ناظر و بدون ناظر، معمولاً نتایج بهتری در مقایسه با روش های واحد ایجاد می کنند. روش های طبقه بندی چندگانه، طبقه بندها را برای رسیدن به طبقه بندی با دقت پیش بینی بالاتر با یکدیگر ترکیب می کنند. به طور مشابه، روش های خوشه بندی چندگانه با ترکیب خوشه بندها، خوشه بندی هایی با کیفیت بالاتر ایجاد می کنند. رایج ترین روش های تجمعی قدرتمند اخیر روش بگینگ و روش تقویت هستند. روش تقویت یک مسأله عمومی در یادگیری ماشین است که یک الگوریتم یادگیری ضعیف را به الگوریتم قدرتمندتری با دقت بالاتر تبدیل می کند. الگوریتم های موفق بسیاری در زمینه سیستم های طبقه بند چندگانه بر مبنای روش بگینگ و روش تقویت ارائه شده اند، همچنین تعدادی الگوریتم خوشه بند چندگانه بر مبنای بگینگ و روش تقویت بر روی خوشه بندی های مسطح طراحی شده اند که در مقایسه با خوشه بندهای واحد دارای کیفیت بالاتری هستند. بر این اساس می توان انتظار داشت با استفاده از تجمع خوشه بندها در زمینه ی خوشه بندی ای سلسله مراتبی نیز بتوان به کیفیت بالاتری در ایجاد خوشه بندی های سلسله مراتبی دست یافت. بر اساس آخرین مطالعات انجام شده، مسأله تجمع خوشه بندهای سلسله مراتبی تاکنون چندان مورد توجه قرار نگرفته است. در این پایان نامه، دو راهکار چندگانه ارائه شده است که تجمعی از خوشه بندی های سلسله مراتبی را تولید و با یکدیگر ترکیب می کند. در راهکار اول یک روش میانگین گیری وزندار برای ترکیب خوشه بندی های موجود در تجمع پیشنهاد شده است که در آن وزن های ترکیب بر اساس الگوریتم وراثتی تعیین می گردند. در این الگوریتم، ابتدا دندروگرام های خوشه بندی های پایه ی موجود در تجمع به ماتریس توصیف عدم شباهت تبدیل شده و توسط الگوریتم وراثتی وزن دهی می شوند. سپس ماتریس های توصیف توسط عملگر جمع ماتریس ها به صورت وزن دار با یکدیگر ترکیب شده و ماتریس تجمیع نهایی را ایجاد می کنند. خوشه بندی نهایی به صورت دندروگرام حاصل از این ماتریس تجمیع خواهد بود. این الگوریتم می تواند دارای ورودی هایی از چند نوع خوشه بند اولیه متفاوت باشد. تحلیل نتایج تجربی بیانگر برتری کیفیت خوشه بندی ایجاد شده توسط روش پیشنهادی در مقایسه با الگوریتم های خوشه بندی عمومی است. در راهکار دوم، یک روش جدید خوشه بندی تجمعی بر مبنای تئوری تقویت به منظور افزایش دقت خوشه بندی معرفی شده است. الگوریتم پیشنهادی شامل چندین حلقه ی تکراری تقویت است که در هر حلقه ی تکرار یک زیر مجموعه الگوی آموزشی توسط نمونه برداری وزندار تصادفی از میان مجموعه داده ها انتخاب می شود و سپس یک خوشه بندی سلسله مراتبی بر روی این زیرمجموعه الگوها ایجاد می گردد. خوشه بندی تجمیعی نهایی به صورت ترکیب خوشه بندی های ایجاد شده در هر حلقه ی تکرار خواهد بود. در این الگوریتم عملیات ترکیب بر روی ماتریس های توصیف دندروگرام مرتبط با خوشه بندی سلسله مراتبی انجام می گیرد، به این صورت که ابتدا برای هر خوشه بندی سلسله مراتبی یک ماتریس توصیف استخراج می شود، سپس با تجمیع ماتریس های توصیف خوشه بندی های پایه با یکدیگر یک ماتریس تجمیعی به دست می آید که خوشه بندی نهایی از روی آن بازیابی می شود. تحلیل نتایج آزمایشهای انجام شده بر روی مجموعه داده های شناخته شده و همچنین نمایش بصری اعمال الگوریتم بر روی مجموعه داده های دو بعدی بصری برتری خوشه بندی های حاصل از این روش را بر روشهای خوشه بندی عمومی نشان می دهد.
امیرحسین حاجی عبدالحمیدی عبدالرضا میرزایی
امروزه امنیت در ارسال اطلاعات از جایگاه ویژه ای برخوردار است. از گذشته های دور بشر به دنبال راهی بوده است که بتواند اطلاعات خود را با امنیت برای طرف مقابل بفرستد و در مقابل، از اسرار و اطلاعات دشمن خود آگاه شود. یکی از این روش هایی که برای این منظور استفاده می شد، رمزنگاری نام داشت. در این روش، از مباحث قوی در ریاضیات برای تبدیل یک متن ساده به یک متن کد شده و ارسال آن از طریق یک کانال به گیرنده استفاده می شود. اما روش دیگری نیز وجود دارد که در آن وجود داده مخفی می شود. این روش پنهان نگاری نام دارد. پنهان نگاری دانش انتقال داده در رسانه هایی مانند تصویر، صوت و ویدئو است که در بین آنها، استفاده از تصویر و به خصوص تصویر jpeg از محبوبیت خاصی برخوردار است. در سال های اخیر بسیاری از کارشناسان و متخصصان علوم کامپیوتر با ورود به این زمینه، به تو سعه روش ها و الگوریتم های بسیاری در جهت افزایش امنیت در ارسال اطلاعات و هم چنین آشکارسازی اطلاعات پنهان در ارتباطات پرداخته اند. موازی با توسعه پنهان سازی اطلاعات، تلاش برای آگاهی از این اطلاعات پنهان شده نیز افزایش یافته است. همگام با رشد سریع روش های پنهان نگاری، نیاز به ارائه روش های قوی برای آگاهی از این اطلاعات احساس می شود. از این رو محققان بسیاری به توسعه و بهبود روش های پنهان شکنی پرداخته اند. در پنهان شکنی دو سناریو مطرح می شود. اگر الگوریتم پنهان نگاری شناخته شده باشد، می توان با مطالعه آن، راهی برای آشکارسازی پیام پنهان شده، یافت. به این روش، پنهان شکنی خاص می گویند که در عمل بسیار مشکل است. چرا که معمولا روش های پنهان نگاری محرمانه باقی می مانند. حتی اگر این روش ها در دسترس نیز باشند، تشخیص اینکه از کدام روش استفاده شده است برای پنهان شکن، کاری پیچیده و مشکل است. در مقابل، از روشی استفاده می شود که بدون تشخیص روش پنهان نگاری بتوان وجود یا عدم وجود پیام در رسانه انتقالی را آشکار کرد. به این روش، پنهان شکنی کور می گویند. در این روش، ابتدا ویژگی هایی از تصویر استخراج می شوند که در هنگام جاسازی داده در آن، دستخوش تغییر می شوند. سپس این ویژگی ها به یک دسته بندی کننده داده می شود. این دسته بندی کننده، با ویژگی های تصاویر پنهان نگاری شده و نیز تصاویر پاک که در آنها داده ی مخفی وجود ندارد، آموزش می بیند. پس از انجام این مرحله، دسته بندی کننده می تواند بین تصاویر پنهان نگاری شده و تصاویر پاک تمایز قائل شود. بنابراین برای بهبود این روش باید توجه خود را روی استخراج ویژگی های بهتر یا طراحی دسته بندی کننده های قوی تر معطوف نمود. در این پایان نامه روشی ارائه شده است که در آن با اهمیت دادن به محتوای تصاویر و خوشه بندی آنها بر این اساس، حجم بالای تصاویری که دسته بندی کننده با آنها مواجه می شود، کاهش میابد. همچنین از میان روش های گوناگون برای استخراج ویژگی های پنهان شکن، یک یا چند دسته ویژگی که نتیجه مطلوب تری در پنهان شکنی ایجاد می کنند، انتخاب می شود. بر این اساس دو روش پیشنهاد شده است. در اولین روش، ترکیب دسته بندی کننده ها در خوشه های مختلف، برای کاهش خطای تشخیص، مورد توجه قرار گرفته است. برای افزایش نرخ تشخیص تصاویر پنهان نگاری شده، روش دیگری نیز پیشنهاد شده است که در آن با توجه به خوشه بندی تصاویر، دسته بندی کننده ای انتخاب می شود که در تصمیم گیری از دسته بندی کننده های دیگر، بهتر عمل می کند. برای ارزیابی عملکرد روش های پیشنهادی، روش های موجود پیاده سازی شده و نرخ تشخیص آنها با روش های پیشنهادی مقایسه شده است. همچنین برای ارزیابی اختلاف معنی دار بین دقت روش های موجود با روش های پیشنهادی از تحلیل های آماری مناسبی نیز استفاده شده است.
بهزاد مرادی عبدالرضا میرزایی
در طول چند دهه اخیر شاهد پیشرفت چشمگیری در زمینه الکترونیک بوده ایم. پیشرفت تکنولوژی سعی در تولید مدارات الکترونیکی دارد که در آن توان مصرفی و حجم مدار کمینه شود. در طول چند سال اخیر اصطلاح "یک سیستم روی یک تراشه" در مدارات مجتمع اهمیت ویژه ای پیدا کرده است. توسعه مدارات الکترونیکی موجب تولید تراشه های شامل مدارات دیجیتال و آنالوگ شده است. این توسعه همچنین باعث افزایش تعداد قطعات روی یک تراشه شده است. سطح طراحی خودکار مدارات دیجیتال به علت ماهیت ساخت یافتگی و همچنین سطح بالای تجرید پیشرفت نموده است. اما طراحی خودکار مدارات آنالوگ همچنان در سطح پایینی قرار دارد. طراحی مدارات آنالوگ از سطح پایین تجرید و طراحی خودکار رنج می برد و این به یک گلوگاه برای طراحی مدارات ترکیبی تبدیل شده است. در این پایان نامه مشکلات مربوط به طراحی سنتی و همچنین طراحی خودکار مدارات مجتمع آنالوگ بررسی شده است. به ویژه مشکلات طراحی مدارات الکترونیکی در سطح سلول مورد بحث قرار گرفته است. سپس سه روش کارا برای طراحی خودکار مدارات الکترونیکی پیشنهاد شده است. روش های پیشنهادی در دسته راهکارهای بر اساس شبیه سازی قرار دارند. در این روش ها برای تجزیه و تحلیل مدار از محیط شبیه ساز مدار spice استفاده شده است. به منظور حصول دقت کافی در طراحی مدارات، مدل سطح بالای bsimv3v ترانزیستور cmos در محیط شبیه ساز مدار بکار گرفته شده است. در روش اول از یک الگوریتم استراتژی تکاملی بهبود یافته برای طراحی مدار استفاده شده است. در این روش، مسئله طراحی مدار به یک مسئله تک هدفه تبدیل شده و سپس حل شده است. در روش دوم نیز مسئله طراحی مدار به صورت تک هدفه حل شده است اما در این روش از مفاهیم یادگیری ماشین و مدل تکامل یادگیر استفاده شده است. در روش سوم مدل تکامل یادگیر با یک روش حل مسائل چند هدفه به کمک مفهوم مجموعه بهینه پارتو ترکیب شده و طراحی مدار به صورت یک مسئله ی چند هدفه حل شده است. برای تایید کارایی روش های پیشنهادی و همچنین مقایسه این روش ها، سه تقویت کننده عملیاتی آنالوگ با استفاده از این روش ها طراحی شده است. نتایج حاصل از آزمایشات، کارایی روش های پیشنهادی در طراحی مدارات مجتمع آنالوگ در سطح سلول را نشان می دهد. طراحی هر یک از این تقویت کننده ها فقط چند دقیقه طول می کشد. با استفاده از این روش ها می توان زمان طراحی سنتی را از روز ها و هفته ها به چند ساعت کاهش داد و در کنار آن مدار طراحی شده نیز از کارایی بهتری برخوردار باشد.
حسین ملک حسینی عبدالرضا میرزایی
شبکه های حسگر بی سیم، نسل جدیدی از شبکه ها هستند که به طور معمول، از تعداد زیادی گره تشکیل شد ه اند، به طوری که هر گره با همسایه هایش به صورت بی سیم در ارتباط است. هدف اصلی در این گونه شبکه ها، جمع آوری اطلاعاتی در مورد محیط پیرامون حسگر های شبکه است. در شبکه های حسگر بی سیم، کاهش مصرف انرژی حسگر ها، به عنوان یکی از مباحث بسیار مهم مطرح است و توجه بسیاری از محققان را به خود جلب کرده است. این پایان نامه، روشی مبتنی بر سیستم های ایمنی مصنوعی را جهت کاهش مصرف انرژی در شبکه های حسگر بی سیم، پیشنهاد می کند. یکی از مزایای استفاده از الگوریتم های مبتنی بر الگوی سیستم ایمنی مصنوعی در شبکه های حسگر بی سیم؛ بهره گیری از سلول های حافظه است. این سلول ها، پس از شناسایی مسیر هایی با بیشترین تداخل، نسبت به حفظ و تولید آنتی ژن مناسب مبادرت می نمایند. از سلول های خاطره، به منظور انتخاب گره حسگر برای ارسال استفاده می گردد. بنابراین، فرآیند شناسایی گرهی با بیشترین انرژی سریعتر انجام می گیرد. همچنین، از تئوری خطر برای ارسال سیگنال استرس هنگام رسیدن به درصد پایین همسایگی بهره گرفته شده است. به ازای هر بارشناسایی مسیر هایی با تداخل و انرژی مصرفی بیشتر با استفاده از عملگر تقاطع، نسل جدیدی ایجاد می شود که به مجموعه سلول-های خاطره اضافه می کنیم. در واقع مسیر هایی با حداکثر انرژی مصرفی را کشف میکنیم که این رویکرد دقت شبکه را بالا می برد. نتایج نشان می دهد که روش پیشنهادی ما در مقایسه با برخی پروتکل های مسیریابی کلاسیک مانند سیل آسا و gear، نتایج بهتری را ارائه می دهد. به عبارت دیگر، الگوریتم ما، کمترین تداخل و همچنین بیشترین طول عمر شبکه را در مقایسه با دیگر روش ها دارد.
نازنین اسدی عبدالرضا میرزایی
خروجی فرآیندهای دنیای واقعی عموما می توانند به صورت سیگنال در نظر گرفته شوند. توصیف کردن این سیگنال های واقعی در قالب مدل های سیگنال یا سری زمانی مسئله ای است که اخیرا به صورت گسترده ای مورد توجه قرار گرفته است. در این موارد منظور از سری زمانی دنباله ای از داده ها است که در بازه های زمانی یکنواخت به دنبال هم اندازه گیری شده باشد. مدل سازی سری زمانی به دلایل متعدد از اهمیت ویژه ای برخوردار است. از جمله این دلایل می توان به شبیه سازی منبع تولید سیگنال و ایجاد پایه تئوری برای سیستم پردازش سیگنال اشاره کرد. مدل استفاده شده برای این اعمال می تواند از دسته ی مدل های قطعی یا مدل های آماری باشد. در این پایان نامه به منظور مدل سازی و طبقه بندی سری های زمانی از مدل مخفی مارکوف که یک مدل آماری محسوب می شود استفاده شده است. وجود ساختار ریاضی قوی که پایه تئوری بسیاری از کاربردها را فراهم می کند و استفاده ی فراوان آن ها در کاربردهای مهم و گوناگون به خصوص تشخیص صدا از دلایل انتخاب این مدل بوده است. از طرفی ترکیب چند طبقه بند با یکدگیر به عنوان روشی برای بهبود کارایی در مسائل سخت مدتی است که ابداع شده است. در این روش ها چندین طبقه بند ضعیف به منظور ساخت یک طبقه بند قوی با یکدگیر ترکیب می شوند. با وجود اینکه ترکیب طبقه بندها با یکدیگر تاکنون بسیار مورد بررسی قرار گرفته است ترکیب طبقه بندهای مربوط به سری های زمانی به گونه ای که ساختار درونی طبقه بند نهایی ترکیبی از ساختار درونی طبقه بندهای منفرد تشکیل دهنده آن و مختص سری زمانی باشد تا به حال کمتر مورد توجه قرار گرفته است. خوشه بندی نیز نوعی طبقه بندی محسوب می شود که در آن داده ها برچسب ندارند و هدف شناسایی و دسته بندی داده های مشابه با یکدیگر می باشد. به دلیل برچسب دار نبودن داده ها امر خوشه بندی از طبقه بندی دشوارتر خواهد بود. در این پایان نامه ابتدا هدف ساخت مدلی مطلوب برای سری های زمانی با استفاده از مدل مخفی مارکوف بوده است که بتواند داده های مورد نظر را به خوبی توصیف کند و با توجه به معیارهای درنظر گرفته شده نسبت به روش های قبلی بهبود قابل توجهی داشته باشد. در مرحله بعد این شیوه مدل سازی برای طبقه بندی سری های زمانی مورد استفاده قرار گرفته است و با در نظر گرفتن ماهیت مسئله و جداسازی داده های مربوط به دسته های مختلف تا حد ممکن، روشی برای طبقه بندی سری های زمانی با استفاده از مدل مخفی مارکوف ارائه شده است. در مرحله سوم مسئله در نظر گرفته شده خوشه بندی سری های زمانی بوده است. در این مورد با استفاده از مدل مخفی مارکوف و در نظر گرفتن معیارهایی که در تحقیقات قبل برای خوشه بندی سری های زمانی، فارغ از مدل سازی آن ها با مدل مخفی مارکوف، ارائه شده بود روشی جدید برای خوشه بندی سری های زمانی ارائه شده است.
فایقه جوادی عبدالرضا میرزایی
یکی از مهم ترین روش های بررسی کیفیت نرم افزار، تست نرم افزار است. برای بدست آوردن اطمینان از درستی عملکرد نرم افزار در محیط اجرایی مشخص شده، تست نرم افزار ضروری است. تست نرم افزار یکی از فرآیندهای پرهزینه و زمان بر است و پژوهش-های زیادی با هدف تسهیل این عملیات و انجام آن به صورت خودکار صورت گرفته است. یکی از روش های تست نرم افزار تولید داده تست است. تولید داده تست در فرآیند تست برنامه عبارت است از مشخص کردن مجموعه ای از داده های تست که معیار تست را برآورده می کند. برای حل مسئله تولید داده تست، آن را به مسئله بهینه سازی تبدیل می کنند بدین ترتیب می توان از روش های بهینه سازی برای حل این مسئله بهره برد. روش های جستجوی فرامکاشفه ای از رویکردهای موفق در این میان بوده اند که در سال-های اخیر بیش از پیش مورد استفاده قرار گرفته است که به کارگیری ابزارهای مختلف از جمله روش های هوش مصنوعی منجر به پیشرفت در راستای تست خودکار نرم افزار شده اند. روش های جستجوی فرامکاشفه ای با استفاده از مکاشفه به جستجوی راه حل برای مسائل ترکیبی با هزینه محاسباتی معقول می پردازد. الگوریتم های تکاملی یکی از پرکاربردترین روش های جستجوی فرامکاشفه ای می باشند و امروزه در بسیاری از مسائل دنیای واقعی کاربرد دارند. یکی از کاربردهای الگوریتم های تکاملی تولید خودکار داده تست است. در این پایان نامه هدف تولید داده تست با استفاده از الگوریتم های تکاملی با در نظر گرفتن معیار کیفیت پوشش شاخه می باشد. روش جستجویی که در این تحقیق مورد استفاده قرار گرفته است مدل تکاملی یادگیر (lem) می باشد. این روش ترکیبی از الگوریتم های تکاملی و روشهای یادگیری ماشین است. از روش های یادگیری برای بدست آوردن دلیل خوب بودن افراد بهره می گیرد. این دلایل به صورت فرض های استقرایی بیان شده و از آن ها برای تولید جمعیت نسل بعدی فاز تکاملی استفاده می گردد. همین خاصیت باعث شده است که مدل تکاملی یادگیر نسبت به بسیاری از روش های تکاملی مانند الگوریتم ژنتیک کارایی بالاتری داشته باشد. به علاوه این پژوهش از دانش بدست آمده از مراحل پیشین به منظور افزایش سرعت مسئله بهره گرفته است. بنابراین از lem استفاده شده تا بتوان از دانش در قالب فرضیه بهره برد. به بیان دیگر ایده مورد نظر بدین صورت است که فضای اولیه جستجو کاهش می یابد تا جستجو سریعتر انجام گردد. همان طور که گفته شد، مسئله تولید داده تست یک مسئله بهینه سازی تبدیل است. پیش از حل کردن مسئله بهینه سازی، هیچ اطلاعی در مورد نحوه قرار گیری نقاط بهینه سراسری در دسترس نیست. در صورتی که جمعیت اولیه به صورت یکنواخت در تمامی فضای جستجو پخش شوند،کل فضای جستجو به طور مساوی بررسی می شود و نقاط مناسبی برای ادامه جستجو انتخاب می گردند. بنابراین در روش پیشنهادی از آرایه های متعامد برای تولید جمعیت استفاده شده است تا حدالامکان از قرار گرفتن در بهینه محلی جلوگیری گردد. برای بررسی کارایی روش پیشنهادی تعدادی از توابع تست که در پژوهش های مشابه وجود داشته است انتخاب شده اند. روش پیشنهادی به منظور تولید داده تست کمتر و پوشش حداکثر شاخه های برنامه ارائه شده است که آزمایش انجام شده گویای این مطلب است. برای بررسی عملکرد روش پیشنهادی نتایج بدست آمده با سایر روش ها مقایسه شده است که نشان می دهد روش پیشنهادی عملکرد بهتری نسبت به سایر روش-ها دارد.
محمود اشرفی محمدتقی جهاندیده
در این تحقیق، مقایسه ای بین کاربرد بهینه سازی تجمع ذرات(pso)والگوریتم های ژنتیک (ga) برای مدیریت سبد سرمایه، در یک مساله ی بهینه سازی سبدسرمایه مقید شده که فروش کوتاه مجاز نیست نشان داده شده است. تابع هدف مینیمم شده ارزش در معرض ریسک محاسبه شده با استفاده از شبیه سازی تاریخی می باشد. نتایج آزمایشات انجام شده نشان می دهد که به طور کلی، این روش ها قادرهستند به طور سازگار راه حل(جواب)های مناسب که کاملا نزدیک به بهترین جواب یافته شده هستند، را در یک مدت زمان معقول بیابند. به علاوه، ازنظرآماری نشان داده شده که این الگوریتم ها، بطورمیانگین همگی منجربه یافتن بهترین راه حل(جواب) یکسان نمی شوند. pso به نظر می رسد سریعتراز ga باشد، هم ازنظرتعداد تکرار و هم ازنظرکل زمان اجرا. بااین حال، pso به نظر می رسد نسبت به موقعیت اولیه ذرات، حساس تر از ga باشد. برخی تست ها نیز باتوجه به تعداد ذرات مورد نیاز برای حل این مسأله پیشنهاد شده است، و به نظر می رسد 50 ذره/کروموزوم برای مسأله های تا حد 20 دارایی کافی باشد.
عبدالرضا میرزایی محمد رحمتی
روشهای خوشه بندی روشهای یادگیری بدون ناظر هستند که برای کاوش و شناسایی ساختار داده ها به کار می روند. هدف الگوریتم های خوشه بندی تقسیم بندی الگوهای ورودی است، به نحوی که الگوهایی درون یک خوشه با یکدیگر شبیه و با اعضای خوشه های دیگر متفاوت باشند. به عبارت دیگر خوشه بندی مطلوب آن است که واریانس درونی خوشه ها حداقل و واریانس بین خوشه ها حداکثر باشد. در بسیاری از کاربردها خوشه بندی هایی که یک توصیف سلسله مراتبی از داده ها را ارایه دهند مطلوب تر می باشند. خوشه بندی های سلسله مراتبی به جای ارایه مجموعه ای از خوشه های مجزا یک سلسله مراتب از آنها ارایه می دهند. برای نمایش خوشه های ایجاد شده از الگوریتم های خوشه بندی سلسله مراتبی از یک ساختار درختی به نام دندروگرام استفاده می شود که نحوه تقسیم شدن الگوها در خوشه ها را نشان می دهد. به طور کلی روشهای خوشه بندی سلسله مراتبی هنگامی نسبت به روشهای غیر سلسله مراتبی ترجیح داده می شوند که تعداد خوشه مطلوب داده ها معین نباشد و یا به دست آوردن رابطه بین خوشه ها موردنظر باشد. در روشهای با نظارت در شناسایی الگو ترکیب تصمیم یک راهکار کارا برای حل مسایل پیچیده به شمار می آید. اخیراً ترکیب خوشه بندی ها نیز به منظور بهبود کارایی و مقاومت خوشه بندی به کار گرفته شده است. تا کنون روشهای ترکیب خوشه بندی به ترکیب خوشه بندی های مسطح محدود شده و بر روی ترکیب خوشه بندی های سلسله مراتبی تحقیقی انجام نشده است. آنچه که تا کنون برای ترکیب خوشه بندیهای سلسله مراتبی ارایه شده آن است که ابتدا باید آنها را به خوشه بندیهای مسطح تبدیل کرده و سپس الگوریتم های ترکیب مسطح را بر روی آنها اعمال نمود. در این تبدیل از هر خوشه بندی سلسله مراتبی فقط یک سطح که یک خوشه بندی مسطح از داده ها است حفظ می شود و اطلاعات بقیه سطوح از دست می رود. بنابراین الگوریتم ترکیب از همه اطلاعات موجود در خوشه بندیهای سلسله مراتبی ورودی استفاده نمی کند و بدین دلیل این الگوریتم بهینه نخواهد بود. در این رساله مفهوم ترکیب خوشه بندی های سلسله مراتبی معرفی شده و یک چارچوب کلی برای ارایه الگوریتم در این زمینه پیشنهاد شده است. در این چارچوب ابتدا برای هر خوشه بندی سلسله مراتبی یک ماتریس توصیف استخراج می شود. سپس با تجمیع ماتریس های توصیف خوشه بندیهای پایه با یکدیگر یک ماتریس تجمیعی به دست می آید که خوشه بندی نهایی از روی آن ایجاد می شود. عملگر تجمیع باید ویژگیهای ساختاری دندروگرام های پایه را حفظ کند. هر دندروگرام را می توان به صورت یک ماتریس توصیف نشان داد، اما متناظر با هر ماتریس دلخواه یک دندروگرام وجود ندارد. در این رساله دو راهکار برای تجمیع ماتریس های توصیف ارایه شده است. در راهکار اول مجموعه ای از عملگرهای تجمیع بر اساس معیارهای حداقل مربع خطا، تباین رنی و تباین ینسن- شانون برای تجمیع ماتریس های توصیف به کار رفته است. نتایج آزمایشهای انجام شده نشان داد که روشهای ترکیب ارایه شده بر اساس این عملگرها خوشه بندی های مناسب تری نسبت به الگوریتم های استاندارد ایجاد می کنند. گرچه روشهای ترکیب ارایه شده بر اساس راهکار اول نتایج مطلوبی در ترکیب خو شه بندی ها ایجاد کرده است، اما در این روشها نیاز به تنظیم پارامترهای زیادی به صورت آزمون وخطا می باشد. به علاوه، در روشهای ارایه شده بر اساس راهکار اول مرحله ای با نام بازیابی دندروگرام وجود دارد که تاثیر زیادی بر کیفیت دندروگرام نهایی دارد. بنابراین در راهکار دوم روشی ارایه شده است که به مرحله بازیابی دندروگرام نیاز ندارد. در این روش الگوریتم بستار حداقل- تعدی به گونه ای تغییر داده شده است که از یک مجموعه ماتریس توصیف یک ماتریس توصیف متعدی ایجاد کند. در این روش برای توصیف دندروگرام های پایه از ماتریس های توصیف شباهت استفاده شده است. نتایج آزمایشهای انجام شده بر روی داده های شناخته شده برتری خوشه بندی های حاصل از این روش را بر روشهای خوشه بندی عمومی نشان می دهد. در نهایت دو کاربرد از روشهای ترکیب درخت ارایه شده است. در اولین کاربرد نشان داده شده است که ترکیب خوشه بندیهای سلسله مراتبی می تواند به عنوان راهکاری برای خوشه بندی سلسله مراتبی داده های ناقص (و بدون تخصیص مقدار به داده های ناقص) به کار رود و در دومین کاربرد ترکیب درختها در بازنمایی و تطبیق چندمقیاسی شکل اشیاء ارایه گردید. نتایج آزمایشهای انجام شده برای ارزیابی روشهای پیشنهادی کارایی مناسب آنها را در این دو کاربرد نشان می دهد.
عبدالرضا میرزایی مرتضی آنالویی
در این پروژه روش های تشخیص نفوذ به سیستم های کامپیوتری بررسی شده و دو راهکار در این زمینه ارایه شده است. هر دو روش ارایه شده از جمله روش های تشخیص ناهنجاری هستند روش های تشخیص ناهنجاری این مزیت را نسبت به روش های تشخیص امضا دارند که با تغییر الگوی حملات که بسادگی امکان پ1ذیر است. دچار خطا در تشخیص نمی شوند. راهکار اول تکنیکی بر پایه قوانین فازی برای تشخیص نفوذ ارایه می دهد این راهکار از مزایای الگوریتم های ژنتیکی در مرحله تولید قوانین استفاده می کند در این راه حل قوانین بر اساس نمونه های آموزش ایجاد می شوند و الگوریتم ژنتیکی بر روی قوانین و بهبود آن ها کار می کند این پروسه مجموعه ای از قوانین بهبود یافته را تولید می کند. قوانین به صورت فازی بیان شده اند زیرا مرز بین فعالیت نرمال و غیر نرمال را نمی توان به خوبی بیان کرد که این باعث آلارم غلط در بسیاری از سیستم های تشخیص ناهنجاری می شود. به هر حال با استفاده از منطق فازی نرخ آلارم غلط در تشخیص نفوذ کاهش می یابد به علاوه استفاده از متودهای فازی باعث ایجاد قابلیت تفسیر قوانین به کمک مفاهیم زبانی می شود. از طرف دیگر می توان نظرات افراد خبره را به راه حل وارد کرد. در این راهکار با وارد شدن نمونه جدید تهاجم لازم نیست مرحله آموزش از ابتدا شرع شود بلکه می توان از قوانین قبلی در نسل اولیه الگوریتم ژنتیکی استفاده کرد که سرعت همگرایی را افزایش می دهد. راهکار دوم ارایه شده یک روش آماری بر پایه تکنیک نزدیکترین همسایه است این روش از تعداد کمی ویژگی متعامد که در مرحله پیش پردازش به دست آمده اند برای تشخیص نفوذ استفاده میکند تعدا کم ویژکی باعث سرعت بیشتر این روش نسبت به روش های مشابه می شود به علاوه با استفاده از مجموعه ای از بهترین ویژگی های به یک سیستم کلاس بندی قوی می رسیم. زمان آموزش این روش نیز در مقایسه با روش هایی مانند شبکه عصبی فوق العاده کوتاه است. سیستم های تشخیص یا بر اساس اطلاعات ذخیره شده فعالیت ها در سیستم نهایی یا ترافیک شبکه کار می کنند. در این تحقیق ما از اطلاعات خام tcp/ip مربوط به داده های تشخیص نفوذ darpa استفاده می کنیم. در داده ها 41 ویژگی برای هر نمونه وجود دارد و یک مساله دو کلاسی یا (5 کلاسی) است. با استفاده از این دو راهکار سیستم های کلاس بندی مناسبی ایجاد شده است که بسته به نوع کاربرد می توان هر یک را به کار برد.
محمدتقی معین الغربایی عبدالرضا میرزایی
یادگیری ماشین یکی از شاخه های هوش مصنوعی می باشد که دامنهی تحقیقاتی وسیعی دارد. در مقالات مربوط به الگوریتم های تکاملی و روش های یادگیری ماشین، برخی از الگوریتم های تکاملی به عنوان نوعی از روشهای یادگیری ماشین استفاده شده است. با توجه به اینکه همواره الگوریتم های تکاملی به عنوان یادگیری ماشین به کار رفته است، ما در این پایان نامه به استفاده از روشهای یادگیری ماشین در بهبود الگوریتمهای تکاملی پرداختهایم. ایده اصلی در بهبود الگوریتم های تکاملی با استفاده از یادگیری ماشین این است که الگوریتم های تکاملی در حین جستجو اطلاعاتی دربارهی فضای جستجو و ویژگی های مسئله و جمعیت ذخیره میکنند. سپس یادگیری ماشین جهت تحلیل این داد ه ها استفاده میشود که موجب بهبود کارایی جستجو خواهد شد. در این راستا اطلاعات مفید میتواند برای فهم نحوهی جستجو و کمک به جستجوهای آینده جهت یافتن بهینه سراسری، استخراج شود. در بسیاری از کاربرد ها ثابت شده است، الگوریتم های تکاملی ای که روش های یادگیری ماشین را به کار میبرند، در سرعت همگرایی و کیفیت جواب(راه حل) موثر هستند. الگوریتم cma-es یکی از الگوریتم های تکاملی است که با نمونه گیری از یک توزیع نرمال، جمعیت جدید را به وجود می آورد. یکی از پارامترهای توزیع نرمال، ماتریس کوواریانس میباشد که در هر نسل به روز رسانی میشود و در کیفیت جمعیت جدید این الگوریتم و در نتیجه، هدایت تکامل نقش مهمی دارد. بنابراین چگونگی به روز رسانی این ماتریس حائز اهمیت می باشد. از طرف دیگر، مدل dcc-garch نیز یکی از روش های یادگیری ماشین است که در مدل های اقتصادی کابردهای فراوانی دارد. این مدل برای پیش بینی سری های زمانی چند متغیرهای استفاده میشود که هر یک ازجملات آن، از یک توزیع نرمال با میانگین صفر و کوواریانس h_t نمونه گیری شده باشد. این مدل برای پیش بینی جملهی بعدی سری زمانی، ماتریس کوواریانس آن را پیش بینی میکند، به طوریکه نمونه گیری از آن به احتمال زیاد منجر به ایجاد جملهی بعدی سری زمانی مورد نظر میشود. در این پایان نامه میخواهیم از مدل dcc-garch برای بهبود الگوریتم cma-es استفاده نماییم. به اینصورت که بهترین گام در هر نسل، معادل یک جمله از سری زمانی در نظر گرفته میشود و مدلdcc-garch از طریق این سری زمانی، ماتریس کوواریانس بهترین گام نسل آینده را پیش بینی میکند. سپس این ماتریس کوواریانس به صورت مستقیم و غیر مستقیم در به روز رسانی ماتریس کوواریانس الگوریتم cma-es استفاده میشود که نتایج و آزمایشات، بهبود قابل قبولی را نشان میدهند. کلمات کلیدی: 1- الگوریتم های تکاملی 2- یادگیری ماشین 3- الگوریتم cma-es 4- مدل dcc-garch
محمد ایمانیان بیدگلی عبدالرضا میرزایی
با روند رو به رشد استفاده از شبکه های کامپیوتری به خصوص اینترنت و مهارت رو به رشد کاربران و مهاجمان این شبکه ها و وجود نقاط آسیب پذیری مختلف در نرم افزارها، ایمن سازی سیستم ها و شبکه های کامپیوتری ، نسبت به گذشته از اهمیت بیشتری بر خوردار شده است. یکی از ابزارهای مهم در تشخیص حملات، سیستم های تشخیص نفوذ هستند. در حال حاضر مهمترین چالش در استفاده از این ابزار، حجم بالای هشدارهای تولیدی توسط آن هاست که عملاً امکان رسیدگی به هشدارها را از بین می برد. به همین منظور تحقیقات گسترده ای در زمینه ی گام های پس پردازش و همبسته سازی هشدارهای تشخیص نفوذ صورت گرفته است. به طور کلی روش های همبسته سازی هشدار به دو دسته روش های مبتنی بر دانش و روش های استنتاجی تقسیم می شوند. روش های استنتاجی دسته روش هایی هستند که از تحلیل های آماری و تکنیک های هوش مصنوعی برای همبسته سازی هشدارها، بهره می برند. پژوهش پیش رو تلاشی است برای ارائه یک راهکار کارآمد و موثر، مبتنی بر تکنیک های داده کاوی و تحلیل های آماری در راستای همبسته سازی هشدارهای تشخیص نفوذ. در این تحقیق سعی شده با مطالعه ی میدانی هشدارهای تشخیص نفوذ نیازمندی های اصلی یک سیستم همبسته ساز، شناسایی و با کمک الگوریتم های کارآمد پیاده سازی شود. روش ارائه شده سعی دارد تا الگوهای رخداد هشدارها را کشف کند و آنها را در قالب قوانین همبسته سازی در اختیار مدیر سیستم بگذارد. در این روش با محاسبه میزان رخداد الگوهای مختلف هر جفت هشدار و همچنین با اعمال مشخصه های تشابه دو هشدار، اقدام به محاسبه ی میزان همبستگی هر جفت هشدار می کنیم. با اعمال مشخصه های تشابه از همبسته شدن الگوهای تصادفی جلوگیری می شود. بعد از محاسبه میزان هر جفت هشدار، در یک ساختار گام به گام عمل همبسته سازی هشدارها را انجام می دهیم. هر جفت هشدار همبسته شده در قالب یک هشدار جدید شناخته شده و در گام های بعدی الگوریتم، همبستگی این هشدارهای جدید با سایر هشدارها کشف می شود. این کار به صورت بازگشتی تا استخراج تمامی گام های حمله ادامه پیدا می کند. از جمله ویژگیهای این روش می توان به استفاده ی همزمان از پایگاه دانش زمینه ای و دانش مستخرج از هم رخدادی هشدارها، عدم استفاده از پنجره زمانی و در نتیجه امکان تشخیص حملات آهسته، عدم نیاز به آموزش، تشخیص انواع حملات یک به چند و چند به یک و امکان کشف الگوهای منظم تولید شده توسط بدافزارها اشاره کرد. برای سنجش کارایی این الگوریتم از مجموعه داده ی دارپا 2000 استفاده شده است و این روش با دو روش مرجع مشابه، مقایسه شده است. نتایج آزمایشات انجام شده، گواهی بر این مدعا است که روش مذکور توانایی رقابت با بهترین پژوهش های صورت گرفته در این زمینه، حتی روش های دانش پایه را دارا است.
پیروز شمسی نژاد محمدحسین سرایی
در بسیاری از کاربردهای داده کاوی هدف نهایی، خود دانش نمی باشد بلکه استفاده از آن می باشد. مدلها و الگوهایی که توسط روشهای داده کاوی استخراج می¬شوند اغلب نیاز به میزان زیادی پس پردازش دارند تا قابل استفاده توسط کاربر نهایی شوند. به عنوان مثال در مسئله تشخیص ترک یک شرکت، داده¬کاوی ممکن است مدلی ارائه دهد که پیش¬بینی کند کدام مشتریان احتمالاً قرارداد خود را فسخ خواهند کرد. اما شرکتها تنها علاقه ندارند که بدانند چه کسی شرکت آنها را ترک می¬کند بلکه نیاز دارند بدانند که چگونه می توانند مانع انجام این کار توسط مشتری شوند. بنابراین مدلها و الگوها بایستی به سمت دانش کنشمند بروند. منظور از دانش کنش¬مند، دانشی است که از قابلیت اعمال بالایی در دامنه مربوطه برخوردار می¬باشد. کنش¬کاوی یکی از زیرشاخه¬های حوزه کاوش دانش کنش¬مند می¬باشد که می¬تواند داده کاوی را وارد یک مرحله جدید از حیات خود کند و آن، ورود هرچه بیشترداده-کاوی در کاربردهای عملی می¬باشد. در حال حاضر روشهای معدودی برای کنش کاوی پیشنهاد شده است که همگی مبتنی بر مدلهای پیشگو در داده¬کاوی هستند که از درون داده¬ها یادگرفته می¬شوند و سپس با استفاده از آنها اثر کنشهای مختلف تخمین زده شده و در نهایت کنشهای با اثر مطلوب پیشنهاد می¬شوند. یک مشکل عمده این رویکرد این می باشد که مدلها یپیشگو الزاماً روابط علّی و معلولی بین ورودیها و خروجیهای خود را نشان نمی¬دهند در حالیکه برای ایجاد تغییر در مقدار یک خصیصه باید از طریق علل آن خصیصه، تغییر را ایجاد کرد.این مسئله می¬تواندکنشهای کشف شده توسط روشهای موجود کنش¬کاوی را غیرکاربردی کند. در این رساله، ما ایده کنش کاوی مبتنی بر روابط علّی و معلولی را ارائه کرده ایم. برای این منظور ابتدا روش cream معرفی شده است که سعی می¬کند از درون شبکه علّی حاکم بر متغیرهای سیستم، موثرترین کنش را برای هر نمونه دلخواه استخراج کند. درون cream از مفاهیم مربوط به حساب مداخلات در شبکه¬های علّی سود برده ایم که کمک می کنند اثر یک کنش را بدون اعمال آن در دنیای واقعی تخمین بزنیم. از آنجا که در کاربردهای عملی همیشه شبکه عّلی در دست نمی¬باشد ما یک روش دیگر به نام ice-cream ارائه کرده¬ایم که تنها به داده¬های صرفاً مشاهده شده که در سیستمهای متداول در اختیارمی¬باشند نیاز دارد. این روش ابتدا شبکه علّی حاکم بر سیستم را از درون داده¬ها استخراج کرده و سپس از شبکه یادگرفته شده که تخمینی از شبکه علّی حقیقی حاکم بر سیستم می¬باشد برای کشف کنش¬ها استفاده می¬کند. ما همچنین یک نسخه از ice-cream با عنوان mc ice-cream را نیز پیاده سازی کرده¬ایم که از روش مونت کارلو برای تخمین اثر کنشها از روی شبکه علّی استفاده می¬کند. همینطور در این¬جا یک روش جدید برای کشف قوانین کنشی با استفاده از شبکه های علّی ارائه کرده ایم. روش ارائه شده care در مقایسه با روشهای مشابه موجود که از مدلهای پیشگو برای استخراج قوانین کنشی استفاده می¬کنند از شبکه علّی استفاده می¬کند؛ از این رو قوانینی که با استفاده از این روش بدست می¬آیند از قابلیت اعمال بالایی در کاربرد مورد نظر برخوردار خواهند بود. پس از پیاده سازی روشهای ارائه شده، آنها را بر روی داده¬های بدست آمده از سه نوع شبکه علّی آزمایش کرده¬ایم: شبکه¬های علّی حقیقی، مصنوعی و تصادفی. نتایج بدست آمده نشان می¬دهندکنشهایی که توسط روشهایice-cream و mc ice-cream تولیدمی شوند نسبت به روشهای موجود با احتمال بیشتری خصیصه هدف را تغییر خواهند داد.همچنین نتایج تاییدمی¬کنند در مواردی که شبکه علّی در دسترس نمی¬باشد روش ice-cream می¬تواند با دقت بالایی روش cream را تخمین بزند. کلمات کلیدی:کنش¬کاوی، قوانین کنشی، قوانین علّی، شبکه های علّی
وحید فرمانی مهران صفایانی
تشخیص حالت چهره می تواند به بهبود ارتباط دو سویه ی بین انسان و ماشین کمک کند، به این صورت که ماشین می تواند با توجه به احساس انسان رفتار مناسبتری را انجام دهد. در این تحقیق به منظور تشخیص حالت چهره از ترکیب قوانین اگر-آنگاه و منطق فازی نوع دوم استفاده شده است. قوانین اگر-آنگاه به ماشین کمک می کند تا فرایند تشخیص حالت چهره را به فرمی مشابه عملکرد انسان انجام دهد. چهره ی انسان می تواند در یک زمان ترکیبی از چند حالت چهره را دارا باشد. به دلیل این عدم قطعیت و توانایی منطق فازی برای استدلال دانش نادقیق از منطق فازی استفاده می کنیم. در فرایند تشخیص حالت چهره با دو عدم قطعیت درون-فردی و بین-فردی نیز مواجه هستیم. عدم قطعیت درون-فردی به این معناست که اگر یک شخص، یک حالت چهره را چندین بار تکرار کند، ویژگی های به دست آمده از چهره ی او در هر بار یکسان نخواهد بود. همچنین ویژگی های به دست آمده از چهره برای افراد مختلفی که یک حالت چهره را نمایش می دهند نیز متفاوت خواهد بود. به این عدم قطعیت بین-فردی می گوییم. به نظر می رسد استفاده از مجموعه های فازی نوع دوم بتواند به مدل سازی این دو عدم قطعیت کمک کند و موجب افزایش دقت در تشخیص حالت چهره شود. در این پایان نامه دو مدل برای تشخیص حالت چهره ارائه شده است. مدل اول یک سیستم استنتاج فازی از نوع ممدانی است که توابع عضویت آن از نوع فازی فاصله ای نوع دوم هستند. در این مرحله ابتدا یک سیستم استنتاج فازی نوع اول از نوع ممدانی طراحی و سپس توابع عضویت این سیستم را به مجموعه های فازی فاصله ای نوع دوم تبدیل کردیم تا سیستم استنتاج فازی نوع دوم متناظر با آن حاصل شود. قوانین به کار رفته در این دو سیستم با هم یکسان هستند. برای بهینه سازی پارامترهای توابع عضویت این دو سیستم از الگوریتم ژنتیک استفاده شده است. دومین مدل پیشنهادی یک سیستم استنتاج فازی سوگنو می باشد که توابع عضویت برای ورودی های این سیستم مجموعه های فازی فاصله ای نوع دوم هستند. سیستم فازی نوع اول متناظر با این سیستم را نیز طراحی و در آن از قوانین یکسان با سیستم سوگنوی نوع دوم استفاده کردیم. در دو سیستم سوگنو برای بهینه سازی پارامترهای توابع عضویت ورودی از الگوریتم بهینه سازی پس انتشار خطا استفاده شده است. کلیه قوانین فازی در این دو مدل بر اساس مقادیر ویژگی به دست آمده از پایگاه های داده استخراج شده اند. در نهایت بین این دو مدل و سیستم های فازی نوع اول متناظر با هر کدام مقایسه ای صورت گرفته است. برای مدل اول آزمایش های خود را بر روی دو پایگاه داده cohn-kanade و jaffe و برای مدل دوم بر روی پایگاه داده jaffe انجام دادیم. نتایج به دست آمده برای هر دو مدل نشان داد که سیستم های استنتاج فازی نوع دوم در تشخیص حالت چهره نسبت به سیستم های استنتاج فازی نوع اول متناظر با خود دقت بیشتری دارند.
فاطمه موسوی مهران صفایانی
بازنماییهای مبتنیبر گراف به دلیل نمایش همزمان خصوصیات موجودیتها و روابط دوتایی، استفادهی کاربردی و گستردهای در زمینهی تشخیص الگو دارند. با این حال مشکل اصلی گرافها فقدان عملیات ریاضی پایهای مورد نیاز بسیاری از الگوریتمهای تشخیص الگو است. بهمنظور غلبه بر این محدودیت، جاسازی گراف در فضای برداری با فراهم آوردن یک نمایش بردار ویژگی برای هر گراف باعث توانمندی در بهکارگیری ابزارهای یادگیری آماری برای الگوهای ورودی به شکل گراف میشود. با اینحال یافتن نمایشهای برداری مناسب برای گرافها با پیچیدگیهایی همراه است. با وجود روشهای مختلف جاسازی گراف مشتمل بر سه خانوادهی بزرگ کاوش گراف، طیف گراف و عدم شباهت، دو مسئلهی متقابل در رابطه با استفاده از آنها وجود دارد، از یک طرف روالهای جاسازی نباید شامل عملیات هزینهبر باشند و از طرف دیگر ویژگیهای استخراجشده از گراف میبایست تا جای ممکن اطلاعات گراف بهویژه اطلاعات ساختاری را حفظ کنند. این پایاننامه، با ارائهی دو چارچوب به برقرای اعتدالی میان زمان جاسازی و حفظ اطلاعات در روند جاسازی میپردازد. ایدهی اصلی، بهرهمندی از مزایای معماری سلسلهمراتبی در حوزهی گراف است. چارچوب اول با معرفی یک الگوریتم خلاصهسازی، هرمی از سطوح دقت مختلف گراف ورودی ایجاد میکند. جاسازی سطوح مختلف این هرم در فضای برداری، ویژگیهای سراسری از کل گراف را در کنار ویژگیهای محلی آن فراهم میآورد. این امر باعث تکمیل ویژگیهای ازدسترفتهی گراف در فرایند جاسازی میشود. علاوهبراین، جاسازی سطوح دقت پایین گراف، زمان جاسازی گراف را کاهش میدهد. چارچوب دوم برای تحلیل بهتر اجزای سازندهی گراف، به تفکیک گراف ورودی میپردازد. برای این منظور اطلاعات ازدسترفتهی گراف در طی خلاصهسازی در قالب دو گراف جزئیات نگهداری میشود. این رویه بهگونهای انجام میشود که بتوان گراف اصلی را با استفاده از گراف خلاصه و گرافهای جزئیات متناظر با آن بازسازی کرد. سپس جاسازی با استخراج ویژگی از هر یک از سطوح دقت و جزئیات صورت میگیرد. همچنین بهمنظورکاهش زمان اجرای جاسازی و براساس ایدهی تقسیم و غلبه، درخت تفکیک معرفی میشود. ارزیابیهای انجامشده به بررسی روش انتخابشده از هر یک از خانوادهها برای جاسازی سطوح مختلف گراف تحت چارچوبهای سلسلهمراتبی پیشنهادی میپردازند. اصلیترین دستاورد ارزیابیهای انجامشده این است که این چارچوبها مستقل از روش انتخابشده، قابلیت زیادی در بهبود دقت و زمان ردهبندی دارند.
همایون افرابندپی مهران صفایانی
از زمان ساخت اولین رایانه ها، همواره تلاش متخصصان این حوزه بر این موضوع معطوف بوده است که چگونه می توان با استفاده از الگوریتم های مختلف، کارایی رایانه ها را در پردازش حجم وسیع داده ها افزایش داد به گونه ای که با صرف زمان و منابع کمتر، بتوان داده ها را با دقت مناسبی پردازش کرد. با افزایش روز افزون حجم داده ها و نیز حجم نویز موجود در آن ها، متخصصان به این نتیجه رسیدند که لازم است داده ها نیز برای ورود به الگوریتم ها پردازش شوند. این مرحله را پیش پردازش داده ها می نامند. یکی از مهم ترین پیش پردازش هایی که امروزه در حوزه های مختلف علوم مورد استفاده قرار می گیرد، کاهش ابعاد داده ها است. استخراج ویژگی یکی از روش های کاهش ابعاد داده است و به مجموعه روش هایی اطلاق می شود که با انتخاب ترکیبی از ویژگی های موثر در داده ها، سعی در کاهش تعداد آن ها و در نتیجه کاهش پیچیدگی داده ها دارند. به منظور استخراج ویژگی از داده ها، روش های متنوعی وجود دارد که به دو دسته کلی روش های آماری و روش های مبتنی بر احتمالات طبقه بندی می شوند. در روش های آماری تنها از معادلات جبری برای به دست آوردن یک فضای جدید استفاده می شود که حجم داده ها با نگاشت به این فضای جدید کاهش می یابد. روش های مبتنی بر احتمال با اضافه کردن نویز به مدل و با در نظر گرفتن توزیع های احتمال برای پارامترها، سعی می کنند تا فضای جدید را به دست آورند. یکی از روش های استخراج ویژگی آماری پرکاربرد روش تحلیل همبستگی های پایه است. در این تحقیق به بررسی روش های استخراج ویژگی و به خصوص روش تحلیل همبستگی های پایه و نسخه های مختلف آن شامل تحلیل همبستگی های پایه مبتنی بر احتمال و تحلیل همبستگی های پایه دو بعدی پرداخته می شود و یک نسخه مبتنی بر احتمال به همراه مدل ترکیبی آن برای روش تحلیل همبستگی های پایه دو بعدی ارائه می شود. با مقایسه روش استخراج ویژگی ارائه شده با روش های مورد بررسی در این پایان نامه در کاربرد شناسایی چهره، دقت کاربرد با استفاده از روش پیشنهادی افزایش یافته است.
آریا مظاهری علی جان نثاری
با افزایش روز افزون نیاز پردازشی برنامه ها و استفاده از سیستم های چند پردازنده ای، به کارگیری حداکثری توانایی این پردازنده ها بسیار حیاتی به نظر می رسد. بدین منظور لازم است اطلاعاتی در مورد ساختار برنامه موازی و گلوگاه های راندمان کارکرد آن بدست آورده شود. خوشبختانه این گلوگاه ها و همچنین بقیه پارامترهای موثر در راندمان برنامه را می توان توسط الگوهای پردازشی و ارتباطی موجود در بطن برنامه موازی تحت بررسی و تشخیص داد. در حال حاضر تلاش های متعددی برای تشخیص الگو و ساختار ارتباطی برنامه های موازی صورت گرفته است. شبیه سازی اجرا، پایش کد و تحلیل شمارنده های سخت افزاری از جمله روش های متداول برای تشخیص این الگوها می باشند. با این حال، اکثر این روش ها بر روی برنامه های علمی محاسباتی با ساختار حافظه توزیعی متمرکز شده اند. همچنین، این روش ها به ویژگی های بنیادی ارتباطی برنامه های حافظه مشترک توجّهی نمی کنند و به همین دلیل کاربردی در سیستم های حافظه مشترک ندارند. سربار زیاد زمانی و حافظه ای به همراه دقّت تشخیص پایین، از دیگر مشکلات روش های پیشین است. هدف این پایان نامه ارائه روشی موثر برای تشخیص خودکار الگوهای پردازشی در درون برنامه های حافظه مشترک است. در مرحله اول، وابستگی بین نخ های برنامه توسط بسته ی پایش کد llvm بدست می آید. به منظور کسب این اطلاعات با بهترین کارایی، یک ساختمان داده جدید به نام «امضای حافظه نامتقارن» ارائه شده است که حتّی با کمتر از 200 مگابایت حافظه می تواند وابستگی بین نخ های برنامه را بدست آورد. امکان تخمین حداکثر میزان مصرفی حافظه و همچنین سرعت بالای تشخیص وابستگی بین نخ های برنامه از جمله مزایای منحصر به فرد این روش است. علاوه بر این با تشخیص حلقه های داخل منبع برنامه در حین اجرا و ایجاد یک ماتریس ارتباطی چند لایه از الگوی ارتباطی برنامه، الگوهای موازی متعدد درون برنامه قابل شناسایی شدند. سپس با اعمال روش دسته بندی یادگیری با نظارت و آموزش آن با مجموعه داده معتبر آموزشی به دقت بیش از 97? در پیش بینی الگوهای موازی رسیدیم. در نهایت دو الگوریتم جدید برای تشخیص الگوهای ساختاری ارائه گردیده است. توسط الگوریتم ارائه شده نه تنها می توان به طور کامل حضور الگوی خط لوله منحصر به برنامه های حافظه مشترک را تشخیص داد بلکه می توان پارامترهای اجرایی آن را همراه با معیارهای کمّی توصیف کیفیت تعیین نمود.
قاسم علی خواجه عبدالرضا میرزایی
جعل کپی-انتقال رایج ترین و ساده ترین روش دستکاری تصاویر است. در این نوع جعل یک ناحیه از تصویر کپی شده، سپس پس پردازش هایی از جمله چرخش و مقیاس روی آن انجام شده و در نهایت در مقصد قرار داده می شود. هدف از جعل کپی-انتقال پنهان کردن یا تکثیر یک یا چندین شی در تصویر است. روش های تشخیص جعل کپی-انتقال شامل 5 مرحله اصلی هستند: پیش پردازش، استخراج ویژگی، تطبیق، تخمین تبدیل و پس پردازش که دو مرحله تطبیق و تخمین تبدیل نقش مهمی در تشخیص دارند. در بعضی مراحل به دلیل وجود نویز ممکن است خطا رخ دهد. روش های موجود این مراحل را به صورت مستقل از هم انجام می دهند و در صورت وجود خطا در یک مرحله، آن خطا به سایر مراحل بعدی منتشر می شود و نتیجه تشخیص را تحت تاثیر قرار می دهد. در این پایان نامه، جهت رفع این مشکل مراحل مهم سیستم تشخیص با هم در تعامل هستند و در صورتی که خطایی در یک مرحله اتفاق افتد در مراحل بعدی تشخیص داده شده و اصلاح می شود. ما این تعامل را با تعریف یک تابع هزینه و بهینه سازی آن فرموله بندی کرده ایم که این تابع مراحل تطبیق و تخمین تبدیل را شامل می شود. سپس در یک روال تکراری مراحل اجرا می شوند و در صورت تشخیص خطا، آن خطا اصلاح می شود. کارایی روش پیشنهادی بر اسا دقت سطح تصویر و پیکسل ، مقاومت در برابر چرخش و مقیاس و دقت ماتریس تبدیل تخمین زده شده بررسی شده است. در آزمایشات دو مجموعه داده تصاویر جعل ساده و حرفه ای به کار رفته است. نتایج، کارایی بهتر روش پیشنهادی را نشان می دهد.
زینب رحمانی منفرد عبدالرضا میرزایی
شبکه های اجتماعی مجموعه ای از افراد یا گروه ها و فعل و انفعالات بین آن ها هستند. این فعل و انفعالات می توانند فعالیت های دوستی و یا روابط تجاری باشند. شبکه های اجتماعی نقش مهمی را در انتشار اطلاعات و حداکثرسازی نفوذ روی کاربران ایفا می کنند. مسأله حداکثرسازی نفوذ، پیدا کردن زیرمجموعه ای از گره هاست که بتوانند انتشار در شبکه را بیشینه کنند. بنابراین انتخاب مجموعه اولیه از کاربران برای حداکثرسازی فرآیند انتشار دارای اهمیت بسیار زیادی است و هدف مورد نظر ما است. در این مسأله انتشار اطلاعات در گراف شبکه¬های اجتماعی تحت یک مدل انتشار، رخ می دهد که بر روی یال های ارتباطی میزان تاثیر و نفوذ بر روی یکدیگر در نظر گرفته می شود. در حالیکه در دنیای واقعی گراف اجتماعی افراد فاقد وزن و یا احتمال تاثیر بر روی یال ارتباطی خود می باشد. ایده اصلی این پایان¬نامه، تخمین احتمال نفوذ بین اعضای شبکه از روی داده واقعی به منظور حداکثر کردن میزان انتشار در شبکه می باشد. در این پایاننامه برای بدست آوردن میزان نفوذ از معیار تعریف شده در تئوری اطلاعات تحت عنوان انتقال اطلاعات و یا آنتروپی انتقال استفاده شده است. این معیار از طریق محاسبه میزان علّیت بین سری های زمانی گره¬های موجود در شبکه،که از طریق زمان فعالیت آن ها در شبکه حاصل می شود، احتمال نفوذ را تخمین می زند. نتایج آزمایشات نشان می دهد، میزان انتشار در کل شبکه و همچنین مجموعه گره های تاثیرگذار بدست آمده از روش پیشنهادی در مقایسه با سایر روش¬ها متفاوت است و اشتراکی ندارد. علاوه بر این، همانطور که در واقعیت و در شبکه های اجتماعی دیده می¬شود، ارسال پیام و دریافت پاسخ با یک تاخیر انجام میگیرد. به همین منظور از معیار آنتروپی انتقال تاخیردار جهت تخمین تاخیر در انتقال اطلاعات استفاده کرده ایم. با انجام آزمایشاتی بر روی داده های واقعی و ساختگی اعتبار روش پیشنهادی در مسأله انتشار در شبکه ارزیابی شده است. نتایج نشان می دهد روش پیشنهاد شده نسبت به سایر روش ها قابلیت بیشتری در یادگیری احتمالات نفوذ و همچنین رتبه¬بندی گره های تاثیرگذار را دارد.
الهام هاتفی عبدالرضا میرزایی
داده کاوی با حفظ محرمانگی داده ها زمینه تحقیقاتی جدیدی در دو دهه اخیر می باشد. در حقیقت هدف اصلی الگوریتم های داده کاوی با حفظ محرمانگی تغییر داده های پایگاه داده ورودی به گونه ای است که داده های خصوصی و همچنین دانش های محرمانه، حتی پس از عملیات داده کاوی محرمانه بمانند. کاوش قوانین وابستگی با حفظ محرمانگی یکی از تکنیک های اصلی داده کاوی با حفظ محرمانگی به شمار می آید و هدف آن جلوگیری از استخراج برخی از قوانینی می باشد که به عنوان قوانین حساس شناخته می شوند. اکثر روش های مربوط به پنهان سازی قوانین وابستگی محدود به پایگاه داده های باینری می باشند در صورتی که پایگاه داده ها محدود به داده های باینری نبوده و دامنه این پایگاه داده ها اعداد حقیقی را نیز شامل می شود. در این پایان نامه یک روش جدید به منظور پنهان سازی قوانین وابستگی فازی از طریق فرموله کردن آن به صورت یک مساله بهینه سازی محدب، ارائه شده است.
مصطفی سپه وند عبدالرضا میرزایی
داده کاوی به هدف کشف اطلاعات معتبر و قابل فهم از پایگاه داده های بزرگ و استفاده از این اطلاعات برای کمک به تصمیم گیری، انجام می شود. شیوه های نمایش دانش در داده کاوی توصیفی هستند که باعث می شود نتایج داده کاوی مستقیم به یک دانش عملی برای تصمیم گیری منجر نشود و اغلب برای استخراج دانش عملی نیاز به پس پردازش باشد. از جمله روش هایی که به جای توصیف داده به ارائه یک راهکار عملی می پردازند می توان کاوش کنش را نام برد. کنش نوعی از دانش است که برای کاربر مشخص می سازد چه عملی انجام دهد تا به سود منجر شود که به عنوان هدف این پایان نامه درنظر گرفته شده است.
سید فخرالدین نوربهبهانی علی فانیان
در این رساله یک روش دسته بندی جدید نیمه نظارتیِ جویبار داده های نامتعادل برای تشخیص نفوذ ارائه شده قابلیت دسته بندی و به روزرسانی توسط نمونه های محدود برچسب خورده بصورت افزایشی را است که دارا است. در این روش نمونه های ورودی بصورت افزایشی خوشه بندی و سپس با استفاده از یادگیری نمونه مبنا و نمونه های محدود ذخیره شده، دسته بندی می گردند. برای دسته بندی جویبار داده ها، روشی جدید برای یادگیری فعال پیشنهاد شده است که با استفاده از آن نمونه هایی که دارای ارزش اطلاعاتی زیاد هستند تشخیص داده شده و پس از بدست آوردن برچسب ها، از آن ها برای یادگیری نیمه نظارتی استفاده می شود. علاوه بر این، روش پیشنهادی دسته بندی از رانش مفهوم و تکامل مفهوم پشتیبانی می کند.