نام پژوهشگر: پرهام مرادی
فاطمه دانش فر حسن بیورانی
امروزه کنترل فرکانس-بار در سیستمهای قدرت بخصوص در شبکه¬های قدرت به هم پیوسته که از توربینهای بادی استفاده می¬کنند، به یک موضوع مهم تبدیل شده است. درعمل سیستمهای کنترل فرکانس-بار از کنترلرهای انتگرال¬گیر تناسبی استفاده می¬کنند. اما این کنترلرها براساس یک مدل خطی طراحی شده¬اند، مشخصات غیرخطی سیستم را در نظر نمی-گیرند و قادر به تولید بهره دینامیکی بالا برای بخش وسیعی از شرایط کاری در سیستمهای قدرت چندناحیه¬ای نیستند. همچنین نوسانات ناشی از توان تولیدیِ باد که تاثیر منفی در ایجاد عدم تعادل توان و تغییرات فرکانس دارد، کنترل فرکانس-بار را با کنترلرهای انتگرال¬گیر تناسبی دشوارتر می¬سازد. این تغییرات قابل¬توجه فرکانس باعث جداسازی برخی بارها و ژنراتورها می¬شود که در شرایط نامطلوب، منجر به گسیختگیهای پی¬درپی و ازکارافتادن کل سیستم می¬شود. با توجه به گستردگی سیستمهای تولید چندناحیه¬ای، استفاده از روشهای مبتنی برعاملهای هوشمند می¬تواند راه¬حل مناسبی برای حل این مساله باشد. این روشها به دانشی از سیستم نیازی ندارند و انعطاف¬¬پذیری بسیاری در تعیین اهداف کنترلی دارند. بعلاوه استفاده از سیستمهای چندعامله باعث ایجاد قابلیت محاسبات موازی می¬شود و باعث افزایش مقیاس-پذیری سیستم می¬شود. در این پایان¬نامه سه روش کنترلی هوشمند برای کنترل فرکانس¬-بار ارائه می¬¬شود: کنترل با استفاده از یادگیری تقویتی سیستمهای چندعامله، کنترل براساس شبکه¬های بیزین در سیستمهای چندعامله و بهینه¬سازی چندمنظوره براساس الگوریتمهای ژنتیک برای تنظیم پارامترهای کنترلر انتگرالگیر-تناسبی. برای ارائه و تحلیل توانایی ساختارهای کنترلی پیشنهادی، یک سیستم قدرت سه ناحیه¬ای با دو سناریو و یک شبیه¬سازی غیرخطی در حوزه زمان روی سیستم قدرت 39 باسه، استفاده شده است.
مجید همتی فردین احمدی زر
دسته بندی متن نقش مهمی را در مدیریت اطلاعات ایفا می کند. به دلیل افزایش حجم اطلاعات موجود در اینترنت، دسته بندی خودکار متن ها بسیار مورد توجه قرار گرفته شده است. یکی از مشکلات دسته بندی متن، ابعاد بالای فضای ویژگی است. اغلب ویژگی ها نامربوط و زائد هستند و بر کارایی دسته بندی کننده تاثیر منفی می گذارند. ازاینرو، انتخاب ویژگی برای کاهش فضای ویژگی و افزایش کارایی دسته بندی متنبه کار می رود. در این پژوهش یک روش سه مرحله ای برای انتخاب ویژگیدر دسته بندی متن ارائه شده است. در ابتدا یک روش فیلترینگ با استفاده از معیار آنتروپی فازی یا بهره اطلاعاتاعمال می شود و ویژگی ها بر مبنای مقداریکه دارند، رتبه بندی می شوند.اگر در گام اول روش آنتروپی فازی استفاده شود، ویژگی هایی که بیشترین مقدارو هرگاه روش بهره اطلاعات بکار رود، ویژگی هایی که کمترین مقدار را دارند از مجموعه ویژگی ها حذف می شوند. سپس در گام دوم، الگوریتم بهینه سازی کلونی مورچه ها برای انتخاب ویژگی هایی که در گام اول حذف نشده اند، اعمال می شود. در گام آخر الگوریتم ژنتیک برای کاهش ابعاد ویژگی هایی که توسط الگوریتم بهینه سازی کلونی مورچه ها بدست آمده است،مورد استفاده قرار می گیرد. در این پژوهش از یک دسته بندی کننده نزدیکترین همسایگی برای دسته بندی 10 کلاس برتر رویترز 21578 استفاده شده است و نتایج بدست آمده نشان دهنده کارایی روش ارائه شده می باشد.
ابراهیم حبیبی پرهام مرادی
یادگیری تقویتی با مسئله یادگیری عامل هوشمند برای انتخاب اعمال به منظور بیشینه کردن کارایی عامل سروکار دارد. استفاده از مهارت ها در یادگیری تقویتی، سبب سرعت بخشیدن به کارکرد عامل می شود. یافتن اهداف میانی و ایجاد مهارت برای دست یابی به آنها، مسئله ای کلیدی در کشف خودکار مهارت می باشد. با کشف اهداف میانی و تعیین تابع سیاست دست یابی به آنها، عامل قادر به اکتشاف موثرتر ویادگیری سریع تر در کارهای دیگر در محیط های یکسان یا مشابه است. در این پژوهش، از رویکرد مبتنی بر گراف برای کشف اهداف میانی استفاده شده است. دو مدل آماری برای خوشه بندی گراف ارائه گشته است. مهارت ها به صورت زیر سیاست هایی تعریف می شوند که انتقال موثر از یک خوشه به خوشه دیگر را برای عامل فراهم می سازند. مجموعه داده های شناخته شده در خوشه بندی گراف و مثال اتاق ها در یادگیری تقویتی مورد استفاده قرار گرفته اند و نتایج بدست آمده نشان دهنده کارایی روش ارائه شده می باشد.
قاسم الیاسی پرهام مرادی
در سالهای اخیر توجه زیادی به سمت کشف خوشه ها در خصوصیات شبکه های مختلف معطوف شده است. شبکه هایی نظیر اینترنت، وب گسترده جهانی، شبکه حمل و نقل، شبکه های ایمیل، شبکه-های اجتماعی و زیستی و... مثال هایی از این نوع شبکه ها هستند. به فرآیند گروه بندی کردن راس های گراف به داخل خوشه ها بطوری که در داخل هر خوشه تراکم یال ها زیاد و بین خوشه ها تراکم نسبتا کم باشد خوشه بندی کردن گراف گفته می شود. در سال های اخیر الگوریتم های زیادی برای شناسایی این ساختارها توسعه داده شده اند. از آنجایی که در کاربردهای واقعی اندازه داده ها با سرعت زیادی افزایش می یابد، کارایی الگـوریتم های کلاسیک برای گراف های بزرگ کاهش پیدا می کند. درچنین وضعیتی الگوریتم های خوشه بندی مبتنی بر مدل، یک جایگزین مناسب برای نوع های کلاسیک هستند. کارایی الگوریتم های خوشه بندی گراف مبتنی بر مدل به مقداردهی اولیه صحیح پارامترهای آن وابسته است. به همین منظور، در این پایان نامه یک الگوریتم تکاملی به منظور پیدا کردن مقادیر مناسب برای الگوریتم های خوشه بندی گراف مبتنی بر مدل ارائه شده است. روش ارائه شده هم بر روی داده-های شبیه سازی شده و هم بر روی داده های واقعی مورد آزمایش قرار گرفته است و نتایج بدست آمده نشان دهنده افزایش کارایی روش پیشنهادی در مقایسه با مقداردهی تصادفی پارامترها است
احسان بجنوردی پرهام مرادی
با توجه به رشد روز افزون دادهها و اطلاعات در دنیای امروز، نیاز به فیلترکردن اطلاعات برای استفاده مطلوب از آنها بیش از پیش احساس میشود و بدون راهنمایی و هدایت درست، ممکن است انتخاب هایی غلط و یا غیر بهینه از میان آن ها داشته باشیم. در این میان سیستم های توصیه گر تأثیر بسزایی در راهنمایی و هدایت کاربران در میان حجم عظیمی از انتخاب های ممکن، برای رسیدن به گزینه مفید و مورد علاقه آنها را دارند. سیستمهای توصیهگر را زیرمجموعه ای از سیستمهای پشتیبان تصمیم می دانند و از آنها به عنوان سیستم های اطلاعاتی یاد می کنند که توانایی تحلیل رفتارهای گذشته و ارائه توصیه هایی برای مسائل جاری را دارا هستند. به زبان ساده تر در سیستم های توصیه گر تلاش بر این است تا با حدس زدن شیوه تفکر کاربر به کمک اطلاعاتی که از نحوه رفتار وی یا کاربران مشابه وی و نظرات آن ها موجود است، مناسب ترین و نزدیک ترین کالا به سلیقه او شناسایی و پیشنهاد شود. سیستمهای پالایش گروهی به عنوان برجستهترین و پرکاربردترین نوع سیستمهای توصیهگر بخش عمدهای از تحقیقات در این زمینه را به خود اختصاص داده است. در سیستمهای توصیهگر تنها تعداد کمی از آیتمها توسط هر کاربر رتبهدهی میشود لذا متدهای پالایش گروهی با یک ماتریس خلوت سر و کار دارند. این مسئله منجر به کاهش دقت در ارائه پیشنهادات این سیستمها میشود. یکی از راهکارها برای غلبه بر این مشکل، استفاده از تکنیک های کامل سازی ماتریس است. در این تکنیک، ماتریس رتبه، به دو یا چند ماتریس شکسته شده و با حاصلضرب آنها ماتریس رتبه دوباره بازسازی شده و در نتیجه منجر به مشخص شدن عناصر نامشخص ماتریس رتبه می شود. در این پایاننامه، یک روش ترکیبی مبتنی بر تکنیک کاملسازی ماتریس برای بهبود نتایج سیستمهای توصیهگر ارائه شده است. در روش پیشنهادی این پایاننامه، تکنیک کاملسازی ماتریس با استفاده از بهینهسازی محدب هر بار با یکی از سه معیار برجسته انتخاب همسایگی همچون متد همبستگی پیرسن، متد تحلیل معنایی نهان مبتنی بر احتمال و متد جکارد از طریق میانگین مجذور فاصلهها ادغام شده است.
کیوان قادری ورجی فردین اخلاقیان
الگوریتم های نشانه گذاری زیادی در سال های اخیر برای استفاده در نشانه گذاری تصاویر رقمی ارائه شده اند، اما چون این الگوریتم ها قادر به ارضاء کامل معیارها و نیازمندی های متناقض یک سیستم نشانه گذاری بویژه شفافیت و مقاومت نبوده، لذا در عمل به یک مصالحه یا توازن مابین معیارهای مورد نیاز اکتفا می نمایند. هدف ما در این پایان نامه ارتقاء میزان معیارهای مذکور در توازن ایجاد شده بوسیله روش های نشانه گذاری می باشد. ایده اصلی برای این منظور ارائه الگوریتم هایی است که در آن بتوان به جای ذخیره سازی مستقیم نشانه، مفهوم و یا نوعی رمزگذاری دارای خاصیت تکرار از آن را ذخیره نماییم. در بخش دیگری از پایان نامه با مروری بر سیستم های نشانه گذاری تصاویر رقمی که از تبدیل تجزیه مقادیر منفرد استفاده کرده اند، به دنبال تشریح و اثبات ایرادی هستیم که در این دسته از سیستم های نشانه گذاری با ذخیره سازی ناقص اطلاعات نشانه، وجود دارد. سعی می شود با آوردن مثال هایی ثابت شود که ادعاهای این دسته از الگوریتم ها مبنی بر کور و یا نیمه کور بودن و ظرفیت جاسازی بالای روش پیشنهادی شان کاملا نادرست بوده و در صورت استفاده ی این دسته از سیستم های نشانه گذاری در اثبات مالکیت تصاویر رقمی ، نتیجه بدست آمده می تواند منجر به اثبات مالکیت نادرست شود. در ادامه یک الگوریتم نشانه گذاری کور که از تبدیل تجزیه مقادیر منفرد استفاده می کند ارائه شده و از جنبه های مختلف با الگوریتم هایی که مشکل مورد نظر را دارند، مقایسه می شوند.
فرشته کیاست پرهام مرادی
کاربرد عمومی از وب به عنوان یک سیستم اطلاعات جهانی موجب شده تا کاربران با حجم عظیمی از اطلاعات و دادهها سروکار داشته باشند. کاربران در مواجهه با این حجم عظیم اطلاعات از دهها هزار منبع، دچار سردرگمی در انتخاب اطلاعات موردنظر خود میشوند. ابزاهایی جهت کنترل و سازماندهی این اطلاعات ارائه شدهاند. سیستمهای توصیهگر، نمونهایی از موفقترین ابزارهای شخصیسازی وب هستند. مهمترین وظیفه یک سیستم توصیهگر، کشف آیتمهای مورد علاقه کاربر در یک فضای بسیار بزرگ از آیتمهای قابل انتخاب است. بنابراین سیستم توصیهگر میتواند کاربر را در انتخاب از میان انبوه اطلاعات یاری رساند. یکی از معروفترین راهکارهای ارائه شده برای سیستم توصیهگر، صافیسازی تجمعی است. برای یک کاربر خاص، در این راهکار با استفاده از رتبههای داده شده به آیتم ها توسط کاربران مشابه، به پیشبینی و پیشنهاد آیتمهای جدید به این کاربر خاص پرداخته میشود. در این راهکار، جهت شناسایی کاربران مشابه با کاربر خاص، از معیارهای شباهتی استفاده میشود که به عنوان یک فاکتور مهم در افزایش کارایی سیستمهای توصیهگر عمل می نمایند. معیارهای شباهت ارائه شده در سیستم صافیسازی تجمعی بر اساس اطلاعات ماتریس کاربر-آیتم ( که شامل رتبههای کاربران به آیتمهاست) به اندازهگیری شباهت کاربران میپردازند. این معیارها با چالشهایی از جمله شروع سرد ( کاربر تازه وارد به سیستم که تعداد کمی از آیتم ها را رتبه بندی کرده است) ، رتبه هموار (کاربرانی که به آیتم های مختلف، رتبه های مشابهی داده اند )، تعداد آیتم مشترک (تعداد آیتم های مشترک رتبه داده شده بین دو کاربر کم است) و تنکی ماتریس کاربر-آیتم ( تعداد آیتم های رتبه داده نشده زیاد است) مواجهه هستند. در این پایاننامه، معیارهای شباهت جدیدی جهت رفع این مشکلات ارائه شدهاند. یکی از این معیارهای ارائه شده، معیار شباهت مبتنی بر رتبه است که چالشهای تعداد رتبه مشترک و رتبه هموار را برطرف نموده است. معیار شباهت ارائه شده دیگر، با استفاده از پروفایل کاربران، مشکل تنکی ماتریس کاربر-آیتم را برطرف نموده است. همچنین در این پایان نامه، چارچوبهایی از این معیارها جهت بهبود عملکرد معیارهای مبتنی بر ماتریس کاربر-آیتم ارائه شدهاند. علاوه بر این، معیارهایی بر اساس تحلیل سلسلهمراتبی جهت افزایش دقت اندازهگیری شباهت کاربران و رفع مشکل کاربر غیرمعمول برای سیستمهای توصیهگر صافیسازی تجمعی ارائه شدهاند.
داریوش زندی ناوگران پرهام مرادی
اینترنت به عنوان ابزاری در دسترس همگان، حجم فراوانی از داده ها را به عنوان فرصتی مناسب پیش روی کاربران خود قرار داده است. به طوری که امروزه با توجه به حجم روزافزون داده و اطلاعات، نیاز به سیستم هایی که توانایی هدایت کاربران به سمت کالا و سرویس مورد نظر را داشته باشند بیش از پیش احساس می شود. سیستم های توصیه گر از طریق تحلیل این داده ها به کاربران، کالا یا خدماتی را توصیه (پیش بینی) می کنند. این داده ها می تواند شامل رفتار مشتریان در خرید های قبلی، علایق و سلایق و حتی موقعیت جغرافیایی، اولویتها و تعداد مراجعات او در هر بار ورود به فروشگاه مجازی، سن، شغل و مواردی از این قبیل می باشد. نمونه ای از سیستم های توصیه گر در دنیای واقعی، سایت آمازون می باشد، که به هر کاربری با توجه به سابقه ای که دارد به او کالا یا خدماتی را پیشنهاد می دهد. سیستم های توصیه گر به دو دسته کلی سیستم های توصیه گر مبتنی بر محتوا و سیستم های توصیه گر پالایش گروهی تقسیم می گردند. سیستم های پالایش گروهی به دلیل اینکه فقط به رتبه کاربران به آیتم هایی که قبلا خریده اند، نیاز دارند و به هیچ گونه اطلاعات اضافه ی دیگری مثل مشخصات کاربران یا اطلاعات کالا احتیاجی ندارند، بسیار مورد توجه سرمایه گذاران تجاری می باشد. سیستم های توصیه گر پالایش گروهی دارای روش های متعددی است، که یکی از معروفترین و پر کاربردترین آن روش های فاکتورسازی ماتریس است. به صورت کلی خروجی نهایی فاکتورسازی ماتریس در سیستم های توصیه گر، ماتریس تقریبی کامل شده ای می باشد که سطرهای آن کاربران و ستون های آن آیتم ها می باشند. درایه های این ماتریس بیانگر رتبه ای است که کاربری به آیتمی خاص داده است. واضح است که این ماتریس در ابتدا بسیار خالی می باشد. در این پایان نامه سیستم های توصیه گر مبتنی بر پالایش گروهی مورد توجه قرار گرفته اند. اولین کار جدیدی که انجام شده است وارد کردن مباحث تکاملی در فاکتورسازی ماتریس می باشد. که در اینجا فقط الگوریتم ژنتیک مورد بررسی و تحلیل قرار گرفته است. ماتریس رتبه بسیار خالی می باشد، راه کاری برای این کار استفاده از روش های پیش پردازش می باشد، که اخیرا معرفی شده است. در فاکتورسازی ماتریس، کامل سازی ماتریس و فرایند یادگیری زمانبر می باشد و نمی تواند به صورت آنلاین انجام شود. حال اگر کاربری رتبه جدیدی به آیتمی دهد، همه محاسبات باید از اول صورت گیرد. برای حل این مشکل نیز اخیرا راه کار افزایشی معرفی شده است. در این پایان نامه تلاش شده است که این دو مشکل با هم به صورت همزمان حل شوند.
محسن رمضانی پرهام مرادی
سیستم های توصیه گر، سیستم هایی هستند که برای پیشنهاد کردن آیتم هایی بکار برده می شوند که انتظار می رود این آیتم ها مورد علاقه کاربر قرار گیرند. در سیستم های توصیه گر یک تکنیک پر کاربرد به نام سیستم های پالایش گروهی وجود دارد. این سیستم ها بر این فرضیه استوارند که می-توان اولویت های تعریف شده برای آیتم ها از سوی تعدادی از کاربران را برای سایر کاربران هم به اشتراک گذاشت. بنابراین، در این سیستم ها، هدف اصلی، یافتن یک گروه از شبیه ترین کاربران به کاربر فعال است. معیارهای شباهت، یکی از رایج ترین روش ها برای یافتن کاربران مشابه به کاربر فعال است. با استفاده از این روش، میزان شباهت کاربران نسبت به هم اندازه گیری شده و نهایتاً بر اساس این معیار ها، شبیه ترین کاربران به کاربر فعال به عنوان کاربران همسایه انتخاب می شوند. در این روش ها، برای انتخاب کاربران همسایه، محاسبات بر اساس ماتریس امتیازات کاربران به آیتم ها انجام می شود. اما این روش با چالش هایی مانند خلوت بودن ماتریس امتیازات، محاسبات اضافه و همچنین مشخص نبودن تعداد بهینه کاربران همسایه روبرو است. بعلاوه، در توصیه کردن آیتم ها روش هایی وجود دارند که خیلی از اطلاعات آماری امتیازات استفاده نمی کنند. یک راهکار دیگر برای یافتن کاربران مشابه به کاربر فعال، استفاده از روش های خوشه بندی است. از روش های خوشه بندی برای دسته بندی کردن کاربران در قالب خوشه هایی استفاده می شود که کاربران یک خوشه دارای بیشترین شباهت به هم هستند. در این پایان نامه دو راهکار مبتنی بر خوشه بندی، برای یافتن کاربران شبیه به هم در سیستم های پالایش گروهی پیشنهاد شده است. در راهکار اول، سعی شده است که با استفاده از روش های پیش پردازش مانند انتخاب ویژگی، تعدادی از آیتم های غیر موثر از مجموعه آیتم ها قبل از اعمال روش های خوشه بندی جهت یافتن کاربران همسایه، حذف شوند. نتایج آزمایشات نشان دهنده بهبود کارایی این روش است. در راهکار پیشنهادی دوم، یک روش جدید برای یافتن کاربران ارائه شده است که در این روش نیاز به مشخص نمودن تعداد خوشه ها برای خوشه بندی نیست. در این روش با استفاده از زیر مجموعه ای از آیتم های مورد علاقه کاربران که توسط چند کاربر امتیاز بالایی دریافت کرده اند، کاربران شبیه بدون در نظر گرفتن اینکه دارای امتیازات داده شده به آیتم های مشترکی باشند، در یک درخت همسایگی جای می گیرند. نتایج آزمایشات نشان می دهد که این روش بدون داشتن پارامتر نامشخصی مانند تعداد خوشه توانسته است که به بهترین نتایج روش خوشه بندی قبل به ازای تعداد خوشه های مختلف و حتی نتایجی بهتر از آنها دست یابد.
محمدحسین دشتبان پرهام مرادی
با پیشرفت روزافزون تکنولوژی در زمینه داده کاوی در حوزه های علمی مختلف، مجموعه داده های با ابعاد بسیار بالا در حال افزایش است که منجر به کاهش کارایی الگوریتمهای دسته بندی می شود. لذا نیاز به کاهش حجم این مجموعه داده ها امری ضروری است. در مجموعه داده ها با ابعادبالا، تعداد زیادی ویژگی برای هرنمونه وجود دارد که بسیاری از آنها نامرتبط و زاید می باشند. در این پایان نامه برروی انتخاب ویژگی بر روی مجموعه داده های ابعادبالای دو حوزه مختلف علم، بیوانفورماتیک و متن، کارشده است. برای هریک از این حوزه ها راهکارهای انتخاب ویژگی متفاوتی توسط محققان ارایه شده است که این راهکارها وابسته به ماهیت ویژگی های حوزه مورد نظر می باشد. مثلا ویژگی های داده های میکروآرایه مقدار "بیان ژن ها" می باشند که عددی حقیقی می باشد در حالی که در متن، ویژگی ها واژه ها بوده که الگوریتمهای ارائه شده در این حوزه بر روی خصوصیت آماری آنها که ماهیتی گسسته دارد تمرکز دارد. راهکارهای ارائه شده برای انتخاب ویژگی به دو دسته کلی باناظر و بی ناظر تقسیم بندی می شوند. راهکارهای باناظر از برچسب کلاس ها در انتخاب ویژگی کمک می گیرند، در حالی که در حالت بی ناظر تنها از مقادیر ویژگی ها استفاده می شود. تحلیل واریانس از راهکارهای بی ناظر می باشد که از دیرباز مورد توجه محققان بوده است. در قسمت اول این پایان نامه، روش های انتخاب ویژگی بی ناظر و با ناظر با تکیه بر استخراج ویژگی، تحلیل واریانس و خوشه بندی پیشنهاد شده است. روش ارایه شده بر روی شش مجموعه داده بزرگ بیوانفورماتیک که ویژگی های آن ژن ها می باشند، اعمال شده است. آزمایشات و بررسی های مختلف انجام گرفته نشان می دهند که روش بی ناظر و باناظر پیشنهادی در مجموعه داده های مختلف کارایی قابل قبولی را کسب نموده است. در راهکار پیشنهادی دوم پایان نامه، روش انتخاب ویژگی مبتنی بر فیلتر با تکیه بر عامل های احتمالاتی تاثیرگذار در دسته بندی متن که در روش های انتخاب ویژگی احتمالاتی پرکاربرد به کار رفته، ارایه می شود. روش ارایه شده از جنبه های مختلف مورد تحلیل قرارگرفته و کارایی ویژگی های انتخابی آن در دسته بندی متن با روش های دیگر انتخاب ویژگی مبتنی بر فیلتر مقایسه شده است. آزمایشات متعدد، روش های فیلتر را از جنبه های مختلف همانند: میزان اشتراک ویژگی های برتر انتخاب شده، بررسی واریانس ویژگی ها، کارایی ویژگی های انتخاب شده بر اساس معیارهای مختلف، رفتار کارایی آنها با افزایش تعداد ویژگی ها و میزان دقت و بازیابی روش ها نسبت به یکدیگر، به طور عملی مورد مطالعه قرار می دهند. سه مجموعه داده استاندارد: reuter-r8، 20newsgroup و webkb دراین مطالعه استفاده شده است. آزمایشات مختلف نشان دهنده این است که روش پیشنهادی در هر سه مجموعه داده توانایی رقابت با روش های موفق انتخاب ویژگی مبتنی بر فیلتر را داراست به طوریکه در برخی موارد اختلاف قابل توجهی را ایجاد نموده است.
سینا طباخی پرهام مرادی
امروزه کاربردهای واقعی طبقه بندی که مجموعه های داده ای با حجم زیاد تولید می کنند به سرعت در حال افزایش هستند. بسیاری از این مجموعه های داده ای دارای تعداد زیادی ویژگی به نسبت تعداد کم الگوها هستند. بسیاری از این ویژگی ها، اغلب نامناسب و دارای افزونگی می باشند. این ویژگی ها می توانند تاثیر منفی بر روی عملکرد سیستم طبقه بندی داشته باشند. یک تکنیک مهم برای غلبه بر این مشکل، انتخاب ویژگی است. هدف انتخاب ویژگی، انتخاب زیرمجموعه ای از ویژگی های مناسب از بین مجموعه ویژگی های اولیه، برای بهبود دقت طبقه بندی است. معمولاً جستجوی جامع برای پیدا کردن زیرمجموعه ویژگی بهینه به لحاظ هزینه محاسباتی غیر ممکن است. بنابراین انتخاب ویژگی تبدیل به یک چالش عمده در شناسایی الگو و یادگیری ماشین شده است. در این پایان نامه، چهار روش انتخاب ویژگی جدید مبتنی بر راهکار فیلتر ارائه می شود. در روش اول، فضای جستجو به صورت گراف بازنمایی شده و سپس با استفاده از الگوریتم بهینه سازی کلونی مورچه ها مناسب بودن هر ویژگی تعیین خواهد شد. مزیت عمده روش پیشنهادی، استفاده از الگوریتم مبتنی بر هوش جمعی در راهکار فیلتر است که از هیچ طبقه بندی کننده ای در فرآیند انتخاب ویژگی استفاده نمی کند. همچنین شباهت مابین ویژگی ها در تعیین مناسب بودن آنها درنظر گرفته می شود که منجر به کاهش افزونگی خواهد شد. روش های پیشنهادی دیگر بر اساس روش پیشنهادی اول ارائه شده است. در روش پیشنهادی دوم، مناسب بودن هر ویژگی به تنهایی محاسبه شده و در فرآیند انتخاب ویژگی در نظر گرفته می شود. در روش پیشنهادی سوم، انتخاب ویژگی افزایشی معرفی می شود که در آن شباهت ویژگی جدید با زیرمجموعه ویژگی های انتخاب شده قبلی محاسبه می شود. در نهایت، مفهوم سرد شدن تدریجی برای کنترل تصادفی بودن الگوریتم بهینه سازی کلونی مورچه ها در روش پیشنهادی چهارم بکار برده شده است. عملکرد روش های پیشنهادی با 11 روش انتخاب ویژگی شناخته شده تک متغیره و چند متغیره، با استفاده از طبقه بندی کننده های مختلف مقایسه شده است. نتایج آزمایشات کارایی روش های پیشنهادی و بهبود روش های انتخاب ویژگی قبلی را نشان می دهد. همچنین روش های پیشنهادی زیرمجموعه ویژگی های کوچکتری را نسبت به روش های دیگر پیدا می کنند.
منیژه رنجبر پرهام مرادی
باتوجه به گسترش سریع و مداوم اینترنت، ضرورت وجود یک سیستم توصیه گر موثر، برای پالایش حجم عظیم اطلاعات، تا حد زیادی افزایش یافته است. یک سیستم توصیه گر، از داده های ورودی برای پیش بینی علایق کاربران استفاده می کند. هدف سیستم های توصیه گر ارائه لیستی از آیتم های مورد علاقه کاربر به اوست. به طورکلی راهکارهای ارائه شده برای سیستم های توصیه گر ، به سه دسته کلی محتوا محور (cb)، پالایش گروهی( cf ) و ترکیبی تقسیم می شوند. در راهکار محتوا محور، آیتم های پیشنهادی، از نظر محتوا، مشابه آیتم های قبلی مورد علاقه ی کاربرِ هدف می باشند. درحالی که در راهکار پالایش گروهی، آیتم های توصیه شده، بر اساس ارزیابی های گذشته ی گروه زیادی از کاربران انتخاب می شوند. پالایش گروهی در مقایسه با راهکارهای دیگر، به دلیل سادگی و کارایی بالا بسیار مورد توجه قرار گرفته است. یکی از کاراترین روش های مورد استفاده در پالایش گروهی برای تخمین رتبه های نامشخص کاربر، فاکتورسازی ماتریس است. دراین پایان نامه، الگوریتم های جدیدی مبتنی بر فاکتورسازی ماتریس جهت رفع چالش های موجود و افزایش دقت، ارائه شده است. بیشتر روش های مبتنی بر فاکتورسازی ماتریس، تنها از رتبه های شناخته شده برای آموزش استفاده می نمایند و قادر به کاهش تأثیر مشکل تُنکی داده نیستند، بااین حال، در کاربردهای واقعی، ماتریس رتبه ها، تُنک می باشد. کارایی روش های فاکتورسازی ماتریس، به چگونگی مدل سازی سیستم، برای کاهش تُنکی داده بستگی دارد. بدین منظور، در این پایان نامه، یک الگوریتم جدید به نام pmult برای افزایش کارایی سیستم و از بین بردن چالش تُنکی ماتریس، با به کارگیری رتبه های پیش تخمین از درآیه های نامشخص، ارائه شده است. بسیاری از سیستم های توصیه گر مبتنی بر فاکتورسازی ماتریس، به صورت زنجیره ای، عمل نموده و به همین دلیل سرعت اجرای آن ها برای ماتریس های بزرگ بسیار کم خواهد بود. لذا یک راهکار برای افزایش سرعت، موازی سازی روش های فاکتورسازی ماتریس است. در این پایان نامه، باهدف موازی سازی توصیه گر پالایش گروهی برمبنای فاکتورسازی ماتریس، چهار الگوریتم موازی مبتنی بر فاکتورسازی ماتریس (c-mult، s-mult، c-pmult و s-pmult) برای کاهش هزینه محاسباتی و غلبه بر چالش مقیاس پذیری، ارائه شده است. علاوه بر این، سیستم های توصیه گر مبتنی بر فاکتورسازی ماتریس، از نوع مدل های دسته ای هستند و قادر به به روزرسانی افزایشی نمی باشند. ازطرفی، با کوچکترین تغییری در ماتریس رتبه ها، محاسبات باید از ابتدا تکرار شود که به دلیل پویا بودن محیط سیستم های توصیه گر این امر غیرممکن خواهد بود. لذا در این پایان نامه جهت رفع این مشکل، دو الگوریتم فاکتورسازی ماتریس افزایشی با نام های i-mult و i-pmult ارائه شده است، که این روش ها قادر هستند با داده های جدید، مدل سیستم را به صورت افزایشی آموزش دهند.
رحیم شیخی فردین احمدی زر
یکی از مشکلات داده¬های با ابعاد زیاد این¬ست که در بیشتر مواقع تمام ویژگی¬های داده¬ها برای یافتن دانشی که در داده¬ها نهفته است مهم و حیاتی نیستند. به همین دلیل در بسیاری از زمینه¬ها کاهش ابعاد داده یکی از مباحث قابل توجه باقی مانده است. از این¬رو، انتخاب ویژگی برای کاهش فضای ویژگی و افزایش کارایی دسته¬بندی متن به کار می¬رود. در این پژوهش یک روش دو مرحله-ای برای انتخاب ویژگی در دسته¬بندی متن ارائه شده است. در ابتدا یک روش فیلترینگ با استفاده از معیار "انتخاب¬کننده ویژگی مجزا" اعمال می¬شود و ویژگی¬هایی که بیشترین مقدار را دارند انتخاب می¬شوند.
جلیل بیات فردین اخلاقیان طاب
در یادگیری ماشین، داده های آموزشی نقش مهمی را در تعیین کارایی الگوریتم یادگیری ایفا می کنند. تعداد این داده های آموزشی در طول زمان افزایش می یابد وداده های جدیدی از راه می رسد. این داده های جدید، ممکن است دید جدیدی از داده های قبلی را ارائه دهند یا توزیع آماری داده ها را تغییر دهند. از این رو، فهمیدن اهمیت داده های جدید و اجازه به این داده ها، برای نقش داشتن در آموزش، به منظور افزایش کارایی سیستم یادگیر، کاری بس زیرکانه است. آموزش دوباره ی سیستم یادگیر با همه ی داده ها، و کنار گذاشتن همه ی تجربه ی یادگیری گذشته، یکی از راه حل ها برای این مسئله است ولی این روش دارای نقص هایی می باشد ازجمله اینکه این روش نا کارآمد است و همچنین، این روش قادر به نگه داری دانش قبلی نمی باشد. در این پایان نامه، ما چهار روش ارائه نمودیم. در روش اول، ما سیستم یادگیری افزایشی برای دسته بندی متن ارائه نمودیم، که در این سیستم، برای هر دسته ی آموزشی از یک دسته بند ماشین بردار پشتیبان برای یادگیری آن استفاده نمودیم و سپس، برای دسته بند بعدی علاوه بر دسته ی آموزشی آن دسته، از بردارهای پشتیبان دسته های آموزشی قبلی به اضافه ی داده های غلط دسته بندی شده ی مجموعه های تصدیق دسته های آموزشی قبلی استفاده نمودیم. در روش دوم برای اینکه بتوانیم میزان معیارهای ارزیابی کارایی را افزایش و خطای دسته بندی را کاهش دهیم به جای استفاده از تنها یک دسته بند برای هر دسته ی آموزشی، از چند دسته بند برای هر دسته ی آموزشی استفاده نمودیم و همچنین، به جای در نظر گرفتن وزن یکسان به هر دسته بند برای تاثیر در ترکیب خروجی ها، از روش اول پایان نامه ی آقای علی دانش استفاده نمودیم که ایشان به ازای ترکیب هر دسته و دسته بند از وزن مستقلی استفاده نموده اند. در روش سوم، به منظور کامل کردن روش قبلی، برای هر دسته ی آموزشی از میان مجموعه ی دسته بندها، چندین دسته بند قابل قبول را انتخاب نمودیم هدف از ارائه این روش کنارگذاشتن دسته بندهای ضعیف و جایگزین کردن آنها با دسته بندهای قویی بود که با داده های آموزشی بیشتری آموزش دیده بودند بود که این امر اشاره به قابلیت خود تطبیقی سیستم پیشنهادی دارد. در روش چهارم با بسط روش سوم در هنگام گرفتن خروجی نهایی، نودهای ایجاد کننده ی نویز را حذف و نودهایی، برای افزایش کارایی دسته بندی اضافه نمودیم. عملکرد روش های پیشنهادی با پنج روش دیگر مقایسه شد. نتایج آزمایشات، کارایی روش های پیشنهادی و بهبود کارایی دسته بندی متن را نشان می دهد.
مهرداد رستمی پرهام مرادی
با پیشرفت های به وجود آمده در جمع آوری داده و قابلیت های ذخیره سازی در طی دهه های اخیر مجموعه های داده ای با ابعاد بالا در علوم مختلف به سرعت در حال افزایش هستند. بسیاری از این مجموعه های داده ای دارای تعداد زیادی ویژگی به نسبت تعداد کم الگوها هستند. بسیاری از این ویژگی ها اغلب نامرتبط و دارای افزونگی هستند که منجر به کاهش عملکرد الگوریتم های طبقه بندی می شوند. از این رو انتخاب ویژگی، برای کاهش ابعاد مسئله و افزایش کارایی الگوریتم های طبقه بندی پیشنهاد شده است. انتخاب ویژگی از دو جهت سبب بهبود الگوریتم طبقه بندی می شوند. ازیک طرف، با کاهش ابعاد مسئله پیچیدگی محاسباتی کاهش پیدا می کند و از طرف دیگر، قابلیت تعمیم الگوریتم طبقه بندی افزایش پیدا می کند و احتمال بیش برازش کاهش می یابد. در این پایان نامه سه روش انتخاب ویژگی با استفاده از خوشه بندی گراف ارائه می شود. در روش پیشنهادی اول، در ابتدا با استفاده از یک الگوریتم تشخیص جوامع، ویژگی های اولیه به تعدادی خوشه، تقسیم می شوند. سپس، با به کارگیری الگوریتم ژنتیک و با استفاده از الگوریتم طبقه بندی knn یک روش انتخاب ویژگی مبتنی بر راهکار پوششی ارائه می شود. در این روش، ویژگی های نامرتبط و دارای افزونگی به طور موثر حذف می شوند، اما به دلیل استفاده از الگوریتم طبقه بندی در فرایند انتخاب ویژگی این روش دارای پیچیدگی محاسباتی بالایی برای مجموعه های داده ای با ابعاد بالا است. با در نظر گرفتن این ضعف، در روش پیشنهادی دوم با استفاده از الگوریتم بهینه سازی کلونی مورچه ها یک روش مبتنی بر راهکار فیلتر ارائه شده است که باوجود کاهش پیچیدگی محاسباتی، کیفیت ویژگی های انتخاب شده همچنان حفظ شده است. در نهایت، در روش پیشنهادی سوم، با ترکیب دو تکنیک خوشه بندی گراف و مرکزیت گره یک روش انتخاب ویژگی مبتنی بر راهکار فیلتر ارائه شده است که می تواند در هر دو حالت بدون ناظر و با ناظر زیرمجموعه مناسب را انتخاب کند. عملکرد روش های پیشنهادی با شناخته شده ترین و جدیدترین روش های انتخاب ویژگی، بر روی طبقه بندی کننده های مختلف مقایسه شده است. نتایج آزمایش ها نشان داد که روش های پیشنهادی هم از نظر زمان اجرا و هم از نظر دقت طبقه بندی دارای عملکرد مناسب هستند.
سجاد احمدیان پرهام مرادی
با توسعه ی سریع محیط جهانی وب، افراد می توانند دانش و اطلاعات خود را از طریق مجموعه ای از ابزارهای انتشار برخط نظیر سیستم های اشتراک گذاری برخط و یا سایت های تجارت الکترونیک، به اشتراک بگذارند. تاکنون ابزارهای زیادی جهت کنترل و سازماندهی این اطلاعات ارائه شده اند. سیستم های توصیه گر، نمونه ای از موفق ترین ابزارهای شخصی سازی وب هستند. مهم ترین وظیفه ی یک سیستم توصیه گر، شناسایی و معرفی آیتم های مورد علاقه ی کاربر در یک فضای بسیار بزرگ از آیتم های قابل انتخاب (مثل موسیقی، فیلم، کتاب، صفحه وب و ...) است. یکی از معروف ترین و پرکاربردترین سیستم¬های توصیه¬گر، روش پالایش گروهی می باشد که از شباهت بین کاربران برای انتخاب همسایگی و ایجاد توصیه استفاده می کند. با وجود اینکه این روش ها دقت بالایی در تولید پیشنهاد دارند، اما اغلب دارای ضعف هایی نیز می باشند. این روش ها برای محاسبه ی شباهت بین کاربران نیاز دارند که هر کاربر به تعداد زیادی از آیتم ها رتبه داده باشد که در دنیای واقعی به ندرت این اتفاق می افتد. یک راهکار برای برطرف کردن این مشکل استفاده از مفهوم اعتماد در کنار رتبه های ارائه شده توسط کاربر است که منجر به معرفی سیستم های توصیه گر مبتنی بر اعتماد شده است.
محمدمهدی آزادجلال پرهام مرادی
حجم زیاد اطلاعات آنلاین منجر به این شده تا کاربران انرژی و زمان زیادی را صرف پیدا کردن محصولات مورد علاقه خود کنند. با این حال، آنها در اکثر موارد قادر به دریافت نتایج رضایت بخشی نیستند. سیستم های توسیه گر اخیراً در کاربردهای زیادی از جمله، توصیه کتابها در سایت آمازون، ویدئو در یوتیوب و ارائه نتایج در صفحات وب مورد استفاده قرار گرفته اند. در این بین سیستم های پالایش گروهی، شهرت بسیاری را در سیستم های توصیه گر دارا بوده و برای ارائه توصیه به کاربران از آیتم هایی که قبلاً توسط کاربرانی مشابه رتبه داده شده اند استفاده می کنند. بکارگیری اطلاعات اجتماعی و به عبارت دیگر، اطلاعات مربوط به دوستان کاربر که به عنوان اطلاعات اعتماد شناخته می شوند، می توانند در سیستم های پالایش گروهی به عنوان اطلاعات اضافی جهت ارائه توصیه های دقیق تر به کاربران مورد استفاده قرار گیرد. در واقع اساس سیستم های توصیه گر مبتنی بر اعتماد، جستجوی افراد مورد اعتماد با توجه به انتشار اعتماد در شبکه اعتماد می باشد. در نتیجه، استفاده از اطلاعات اجتماعی و در نظر گرفتن شبکه اعتماد ایجاد شده توسط کاربران دقت و کیفیت سیستم های توصیه گر را بهبود خواهد داد. در این پایان نامه دو روش جدید به منظور بهبود کارایی سیستم های توصیه گر مبتنی بر اعتماد معرفی شده است. در واقع با استفاده از اطلاعات اجتماعی، علاوه بر رفع ضعف های مربوط به سیستم های پالایش گروهی، میزان دقت و پوشش بهبود پیدا کرده است. برای این منظور در روش پیشنهادی اول، از مفهوم تسلط پارتو به منظور بررسی میزان تأثیر کاربران مورد اعتماد در سیستم های توصیه گر مبتنی بر اعتماد استفاده شده و میزان دقت در این سیستم ها با حفظ میزان پوشش، بهبود داده شده است. علاوه بر این در روش پیشنهادی دوم، با ترکیب مفهوم تسلط پارتو، اعتماد، اطمینان و شباهت در سیستم های توصیه گر مبتنی بر اعتماد، کارایی این سیستم ها در بهبود دقت و پوشش بر روی کاربران و آیتم ها افزایش یافته است. داد.
شادی محمودی فردین اخلاقیان طاب
مسأله طبقه بندی داده های نامتعادل یکی از مسائلی است که اخیراً توجه زیادی از مهندسین و محققین را به خود جذب کرده است. داده¬های نامتعادل در واقع نوعی از داده¬هاست که در آن تعداد نمونه¬های یک کلاس نسبت به دیگر کلاس¬ها بسیار بیشتر (یا بسیار کمتر) است. در نتیجه الگوریتم¬های طبقه¬بندی¬کننده به کلاس اکثریت بایاس شده و در بیشتر موارد کلاس نمونه¬های ورودی جدید را از نوع اکثریت تشخیص می¬دهد که این امر منجر به کاهش کارایی آنها در مواجهه با این نوع داده می¬شود. یکی از پرکاربردترین تکنیک هایی که جهت برخورد با داده های نامتعادل به کار می رود، تغییر توزیع کلاس ها با روش های رایجی چون تکنیک های افزایش نمونه یا کاهش نمونه و همچنین سازگار کردن طبقه¬بندی¬کننده¬ها است. در این پایان¬نامه دو راهکار برای افزایش کارایی طبقه¬بندی کننده¬ها در مواجهه با داده¬های نامتعادل ارائه شده است. ایده اصلی در روش پیشنهادی اول استفاده از دو معیار تنوع و تفکیک پذیری در افزایش نمونه ی کلاس اقلیت است که معیار تنوع در جهت کاهش بیش یادگیری و معیار تفکیک پذیری با جلوگیری از تولید نمونه های ریسک پذیر، تأثیر مثبتی در متعادل سازی توزیع کلاس ها داشته است. روش پیشنهادی اول بر روی 11 مجموعه داده ای با سه نوع طبقه¬بندی¬کننده بر اساس شش معیار ارزیابی با چهار روش پیشین مورد مقایسه و ارزیابی قرار گرفته است. در روش پیشنهادی دوم طبقه¬بندی بیز ساده، به گونه¬ای تغییر داده شده است که در طبقه¬بندی کلاسهای اکثریت و اقلیت هزینه¬های متفاوتی را اعمال نماید. در این روش از ماتریس جریمه مناسب، به منظور کاهش بایاس طبقه-بندی¬کننده به سمت کلاس اکثریت استفاده شده است. نتایج کار بر روی نه مجموعه داده ای و با بهره گیری از شش معیار ارزیابی داده های نامتعادل و با استفاده از منحنی هزینه نهایی، دقت و عملکرد طبقه¬بندی¬کننده بیزین ساده با طبقه¬بندی¬کننده استاندارد مورد ارزیابی قرار گرفته است. طبق نتایج به دست آمده دقت روش پیشنهادی در بیشتر موارد افزایش یافته و یا قابل مقایسه با طبقه¬بندی¬کننده استاندارد می باشد و از طرفی با اعمال ماتریس جریمه، هزینه نهایی طبقه¬بندی¬کننده حساس به هزینه در بیشتر موارد، پایین تر از طبقه¬بندی¬کننده بیزین ساده استاندارد می باشد.
پرهام مرادی نادر مهرگان
اقتصاد ایران یکی از ثروتمندترین اقتصادها در خاورمیانه و حتی در میان کشورهای در حال توسعه منطقه است. با این حال مدیریت ناصحیح بخش عمومی اقتصاد ایران را، به سوی وضعیت ناکارآمد فعلی سوق داده، تا جایی که با یکی از بالاترین شاخص های فلاکت مواجهیم. این پژوهش به بررسی ارتباط بین شاخص فلاکت و اندازه دولت برای سال های 1390-1338 می پردازد. برای رسیدن به این هدف از الگوی var استفاده شده است. با استفاده از آزمون های دیکی فولر تعمیم یافته و فیلیپس پرون مانایی متغیرها بررسی شد. همچنین آزمون علیت گرانجری و آزمون جوهانسون برای بررسی همگرایی بین متغیرها مورد استفاده قرار گرفت. نتایج آزمون مانایی نشان داد متغیرها همگرا از مرتبه یک هستند. همچنین آزمون همگرایی جوهانسون وجود یک رابطه بلند مدت میان متغیرها را نشان داد. نتایج این پژوهش نشان داد ارتباط مثبتی میان اندازه دولت و شاخص فلاکت در اقتصاد ایران وجود دارد.