نام پژوهشگر: رضا منصفی
حسین کاری رضا منصفی
با گسترش روزافزون استفاده از رایانه و بالطبع اتصال آنان و پیچیده تر شدن شبکه های رایانه ای، نیازمندی های کیفیت سرویس کاربران متنوع شده است. مسیریابی در بزرگ راه ها جهت انتقال بسته های اطلاعاتی نقش مهمی را در جابجائی بهینه ایفاء می کنند. ospf از جمله پروتکل های مسیریابی بهینه در مقایسه با همتای خود،rip است. با کاربردهای مورد نیاز امروزه دیگر مسیریابی تنها توسط یک معیار برای بیان وضعیت واقعی لینک به نظر کافی نمی آید. معمولاً در مسیریابی شبکه های فوق نگرانی هایی نسبت به دقت اطلاعات بسته های اعلان وضعیت لینک وجود دارد[gue97], [pos98]. دقت اطلاعات فوق جهت به روز رسانی وضعیت شبکه از قبل توسط فاصله زمانی تعیین می شود. لذا ممکن است به علت عدم ثبت نوسانات پارامتر مزبور، برخی اطلاعات نادقیق به فرآیند مسیریابی وارد شود[gue97]. بنابراین مفیدتر آن است که اجازه دهیم علاوه بر آن تک معیار، پارامتر دیگری جهت بیان وضعیت لینک مشارکت نماید تا از نظر دقت اطلاعاتِ بیان کننده وضعیت شبکه، مشکلی به وجود نیاید. در این تحقیق سعی شده است تا چگونگی ترکیب2 پارامتر: پهنای باند مصرفی لینک و طول صف مسیریاب مرتبط با همان لینک بررسی شده تا به کمک الگوریتم فازی ساده، معیاری فازی ایجاد نماییم. شبیه سازی های انجام شده در محیط شبیه سازns-2 در سیستم لینوکس پس از انجام سناریوهای مختلف نتایج بهتری نسبت به روش تک معیاریospf از خود نشان می دهد.
محمد قاسمی گل رضا منصفی
امروزه با گسترش شبکه¬های کامپیوتری، بحث امنیت شبکه¬ها بیش از گذشته مورد توجه قرار گرفته است. به-طوری¬که می¬توان به کمک یک جستجوی ساده در اینترنت و مشاهده صفحات فراوان یافت شده به اهمیت این موضوع پی¬برد. یکی از اجزای اساسی برقراری امنیت در شبکه¬های کامپیوتری تشخیص نفوذ به آن¬ها می¬باشد که هدف اصلی آن کنترل ترافیک شبکه و تحلیل رفتارهای کاربران است. بنابراین سیستم¬های تشخیص نفوذ به شبکه¬های کامپیوتری نقش مهمی در حفظ امنیت و جلوگیری از دسترسی¬های غیر مجاز به شبکه ایفا می¬کنند. تاکنون روش¬های متعددی برای حل مسأله تشخیص نفوذ ارائه شده است که در این میان تکنیک¬های داده-کاوی و یادگیری ماشین بیش از سایر روش¬ها مورد استفاده قرار گرفته¬اند. از طرف دیگر ماهیت مسأله تشخیص نفوذ به گونه¬ای است که می¬توان آن¬را به¬صورت یک مسأله دسته¬بندی داده¬ها با هدف شناسائی نمونه¬های حمله از نمونه¬های نرمال در نظر گرفت. بر این اساس می¬توان روش¬های مختلف دسته¬بندی داده¬ها را برای حل این مشکل به¬کار گرفت. در بین روش¬های متعدد دسته¬بندی داده¬ها، دسته¬بندهای یک¬کلاسی به دلیل توانایی در تشخیص نمونه-های پرت و دقت بالا در شناسایی نمونه¬های نویزی به¬عنوان گزینه مناسبی در حل مسأله تشخیص نفوذ به شبکه¬های کامپیوتری محسوب می¬شوند. از¬این¬رو هدف اصلی تحقیق فوق بر روی طراحی و پیاده¬سازی روشی جدید در دسته¬بندی داده¬ها بنا شده است. روش پیشنهادی بر پایه یکی از مشهورترین دسته¬بندهای یک¬کلاسی بنا شده است و بهترین مرز موجود برای توصیف داده¬های کلاس هدف را ایجاد می¬کند. مرز بدست آمده می-تواند به¬عنوان سطح تصمیمی مناسب جهت تشخیص نمونه¬های نرمال از نمونه¬های غیر¬نرمال مورد استفاده قرار گیرد. در این پروژه برای ارزیابی توانایی روش ارائه شده در تشخیص نفوذ به شبکه¬های کامپیوتری، آنرا بر روی یکی از مشهورترین مجموعه¬های داده¬ای مربوط به تشخیص نفوذ (kdd-cup99) تست نموده¬ایم. نتایج بدست آمده حاکی از قدرت این روش در فرایند شناسایی نمونه¬های حمله دارد (هرچند میزان هشدارهای غلط سیستم نیز در سطح قابل قبولی است). به¬طور¬کلی با استفاده از این تکنیک می¬توان به نرخ دسته¬بندی صحیح بالاتر از 95 درصد دست یافت که این میزان در میان روش¬های منفرد ارائه شده جهت تشخیص نفوذ، نرخ تشخیص بالایی محسوب می¬گردد. مهم¬ترین مزیت این روش در مقایسه با روش¬های مشابه قابلیت شناسایی حملات جدید در آن است. روش پیشنهادی با توجه به نرخ خطای بسیار کم در شناسایی نمونه¬های حمله می-تواند در آینده به¬عنوان یکی از الگوریتم¬های بکار رفته در سیستم¬های ترکیبی تشخیص نفوذ مورد استفاده قرار گیرد.
احسان ضمیری محسن کاهانی
امروزه پست الکترونیکی یا ایمیل یکی از سریع ترین و اقتصادی ترین راهها برای ارتباط می باشد. با این حال، افزایش کاربران پست الکترونیکی باعث افزایش بی سابقهای در تعداد هرزنامه ها در چندین سال اخیر شده است. در چند ساله ی اخیر تلاش های زیادی برای فیلترکردن هرزنامه صورت گرفته است که اغلب آنها از روش های آماری و یادگیری ماشینی استفاده کرده اند که اغلب نیازمند انبوه داده برای عملیات یادگیری می باشند. هم چنین در این روشها برای فیلترکردن هرزنامه ، از معنای محتوای ایمیل و نیز نحوه ی تعاملات بین فرستندگان هرزنامه و فرستندگان معتبر، استفاده نشده است.در این پایان نامه دو روش برای فیلترکردن هرزنامه ارائه شده است. در روش اول یک آنتولوژی از مفاهیم متداول هرزنامه ساخته می شود. مشابهت معنایی گراف موضوعی متن و نیز سرآیند ایمیل با این آنتولوژی به همراه مشابهت معنایی بین سرآیند و بدنه ی ایمیل، سه مولفه برای فیلترکردن معنایی ایمیل می باشند. محاسبه ی مشابهت معنایی با استفاده از آنتولوژی زمینه ی wordnet صورت می گیرد. در روش دوم از گزارشات تراکنش ایمیل بین فرستندگان ایمیل به منظور ساخت یک شبکه ی اجتماعی ایمیل استفاده می شود. سپس یکسری از ویژگی های متمایز کننده ی فرستندگان هرزنامه و فرستندگان معتبر ارائه می شود. سرانجام از این ویژگی ها به منظور دسته بندی ایمیل های هرزنامه و ایمیل های معتبر استفاده می شود. از آنجائی که هر یک از این دو فیلتر بر روی ویژگی های متمایزی تمرکز دارند، ترکیب این دو فیلتر به صورت سری منجر به نتایج کامل تری می شود.فیلتر مبتنی بر شبکه ی اجتماعی در فیلترکردن هرزنامه دقت بیش از 93 درصد از خود نشان داده است. این نتیجه قابل مقایسه با فیلترهای مبتنی بر یادگیری می باشد. همین طور فیلتر مبتنی بر مشابهت معنایی به صورت مکملی برای فیلتر مبتنی بر شبکه ی اجتماعی می باشد، به طوری که دقت بالای 96 درصد نتیجه ی ترکیب این دو فیلتراست.
اعظم خان احمدی رضا منصفی
هدف اصلی این تحقیق به دست آوردن درک بهتری از چگونگی ایجاد اعتماد در مصرف کننده جهت خرید و یا استفاده از خدمات الکترونیکی است. برای رسیدن به این مقصود بر اساس پژوهش ها و تئوری های گذشته ادبیات تحقیق را در سه حوزه ی محیط آنلاین، خدمات مشتری و فرآیند ایجاد اعتماد بررسی کرده و در نتیجه عوامل تأثیر گذار بر اعتماد به خدمات الکترونیکی را شناسایی نمودیم. و یک چار چوب مفهومی مرجع از عوامل شناسایی شده به دست آوردیم. بر اساس شیوه ی تحقیق پیمایشی، اثر هر یک از این عوامل را از دیدگاه کاربران ایرانی بررسی نموده و پس از تحلیل پاسخ ها بر اساس آزمون رتبه بندی فریدمن توانستیم عوامل تأثیرگذار بر اعتماد به خدمات الکترونیکی را اولویت بندی کنیم. و پس از آن به یک مدل مفهومی برای این تحقیق دست پیدا نمودیم. درآخر عوامل اولویت بندی شده ی بدست آمده در قالب مدل مفهومی را بر روی دو وب سایت خدمات دهنده، ارزیابی نموده و پس از جمع بندی و نتیجه گیری به ارائه پیشنهاداتی برای صاحبان کسب و کارهای الکترونیکی و تحقیقات آینده پرداختیم.
عباس پورفرخی رضا منصفی
فناوری اطلاعات و ارتباطات و حرکت از جوامع سنتی به جوامع اطلاعاتی تمامی ابعاد و نیازمندی های بشری را تحت تاثیر قرار داده است، روش آموزش نیز تابع چنین تغیر و تحولاتی می باشد. بهره گیری از آموزش الکترونیکی با استفاده ازروش های جدید، موجبات کارایی و اثر بخشی بیش از پیش نظام های آموزشی در جوامع بشری را فراهم می نماید. آموزش الکترونیکی فرصت مناسبی را برای تمامی دست اندرکاران سیستمهای آموزشی فراهم آورده است تا بتوانند با بهره گیری از آخرین فناوری های موجود، مهم ترین رسالت خود را که همان آموزش است با سرعت و کیفیتی مطلوب در اختیار متقاضیان قرار دهند هدف اصلی این پایان نامه نیز پیاده سازی یک سیستم آموزش الکترونیکی درون سازمانی و یا به اختصار یک پورتال آموزشی سازمانی می باشد. برای پیاده سازی این ویژگی ها، نیاز به انتخاب ابزار مناسبی است که ما تکنولوژی طراحی پرتال های سازمانی مایکروسافت moss 2007 را برای این هدف برگزیدیم. کلید واژه ها: پرتال، آموزش الکترونیکی ، استاندارد scorm ، سیستم مدیریت محتوی ، سیستم مدیریت آموزشی ، یکپارچگی سرورها، سرویس های اشتراکی، نرم افزار moss 2007
طاهر ره گوی رضا منصفی
یکی از مسائل مهم دنیای امروز استخراج دانش از پایگاه داده های بسیار بزرگ است. داده کاوی این امکان را فراهم کرده است که بتوان به صورت خودکار اطلاعات مفیدی را از پایگاه داده های بسیار بزرگ استخراج نمود. اطلاعات استخراج شده توسط داده کاوی ممکن است موجب نقض حریم خصوصی افراد و سازمان ها گردد. با افزایش موارد نقض حریم خصوصی توسط داده کاوی، نگرانی ها در میان شهروندان برای حریم خصوصی نیز افزایش روزافزون داشته است. لذا در سال های اخیر حفظ حریم خصوصی در داده کاوی به عنوان مبحثی حیاتی، مورد توجه جامعه علمی قرار گرفته است. یکی از روش های بسیار مهم در داده کاوی، کاوش قوانین انجمنی می باشد. مبحث حفظ حریم خصوصی در کاوش سودمندی که یکی از مدل های کاوش قوانین انجمنی است، اخیراً در محافل علمی مطرح گردیده و تاکنون دو الگوریتم مکاشفه ای برای آن ارائه شده است. اگرچه این الگوریتم ها به خوبی می توانند حریم خصوصی داده ها را حفظ کنند اما داده های تولید شده توسط این الگوریتم ها از کیفیت مناسبی برخوردار نیستند. از این رو هدف اصلی این تحقیق بر روی طراحی و پیاده سازی روش ها و الگوریتم های جدید و کارآمد برای حفظ حریم خصوصی در کاوش سودمندی تمرکز دارد. مسأله یافتن راه حل بهینه برای پاک سازی پایگاه داده از مجموعه-اقلام حساس، یک مسأله برنامه ریزی غیرخطی عدد صحیح است و راه حل کارآمد ریاضی برای حل آن وجود ندارد. روش-های پیشنهادی برای حل مسأله فوق در سه دسته ی مکاشفه ای، تکاملی و دقیق ارائه شده اند. الگوریتم های مکاشفه ای بر اساس قوانین شهودیِ کلی می کوشند که فرآیند پاک سازی را با وارد نمودن کم ترین آسیب به کیفیت داده ها، به اتمام برسانند. الگوریتم های تکاملی پیشنهادی تلاش می کنند که با بهینه سازی معیارهای کیفیت داده عملیات پاک-سازی را انجام دهند. در نهایت الگوریتم های دقیق، مدل ساده شده ای از مسأله فوق که با روش های ریاضی قابل حل باشد را به عنوان تقریبی از مسأله اصلی در نظر گرفته و با حل آن امید دارند که عملیات پاک سازی را با تولید داده-های با کیفیت بالا به انجام برسانند. نتایج آزمایشات ارائه شده در این تحقیق، برتری چشم گیرِ روش های پیشنهادی بر روش های موجود کنونی را نشان می دهد.
سید مرتضی هاشمیان رضا منصفی
آونگ وارونه مسأله ای کلاسیک در زمینه تئوری کنترل و دینامیک است و به طور گسترده به-عنوان معیاری برای تست الگوریتم های کنترل به کار می رود. مشکل اصلی کنترل آونگ وارونه، کنترل آنلاین این سیستم تحت شرایط متغیر محیطی و امکان تطبیق پذیری هر چه بهتر این سیستم با محیط است. از این رو روش های یادگیری تقویتی گزینه مناسبی برای رفع این گونه چالش ها به حساب می آید. یکی از موانع اصلی دربرابر سرعت و دقّت یادگیری، مخصوصاً برای سیستم های پویا و پیوسته، وجود نویز محیطی است که تولید تابعِ ارزش تقریبی لازم برای این نوع سیستم پیوسته را با مشکل روبه رو می کند. استفاده از مدل های فازی برای تقریب این گونه سیستم ها، مسأله پیوسته بودن را تا حد قابل قبولی مرتفع می سازد، اما در مواجهه با نویز عکس-العمل قابل قبولی از خود نشان نمی دهد. از این رو مدل فازی بازه ای برای این نوع یادگیری پیشنهاد شده است که در آن پارامترهای فازی از قبیل عرض توابع عضویت و میزان فعال سازی قوانین به صورت بازه ای تعریف شده اند. ما از این بازه جهت استفاده از مجموعه فازیِ کم تر و در نتیجه قوانین کم تر برای کاربردهای با حافظه کم تر نیز استفاده نموده ایم. این مدل همانند مدل فازی نوع 1 عمل می کند با این تفاوت که برای تمامی آن ها به دو محاسبه نیاز است، یکی برای کران پایین و دیگری برای کران بالای بازه مورد نظر. مرحله غیرفازی سازی در روش پیشنهادی نسبت های مشخصی از آن کران ها است. مرحله تولید قوانین نیز به صورت تکاملی و باکارایی ارزش عمل صورت می پذیرد. نتایج حاصل از شبیه سازی در متلب نسخه 2010 و مقایسه این مدل با 4 مدل غیر بازه ایِ fql، elfq، swarm و dfql به خوبی نشان دهنده تأثیر این بازه بر تحمل پذیری در برابر نویز است، کارایی و زمان اجرای روش پیشنهادی به دلیل تعدیل اثر نویز و تغییرات محیط، نسبت به روش های غیربازه ای اشاره شده بهتر بوده لذا برای محیط نویزیِ آنلاین و بلادرنگ مناسب تر می باشد.
کاظم وحدانی رضا منصفی
نگهداشت و مدیریت سیستم های ارتباط داده ای دیجیتال، مستلزم به کارگیری پرسنل فنی زیادی است که بالطبع هزینه های زیادی را بر شرکت های استفاده کننده تحمیل می کند. استفاده از سیستم های هوشمند تا حدی راه گریز از این هزینه ها است. هدف این تحقیق، استخراج الگو از سیستم های فوق و آموزش شبکه عصبی مصنوعی به عنوان سیستم خُبره است. سرعت یادگیری در سیستم های هوشمند، همواره مدنظر محققان بوده است. در پایان نامه حاضر، شبکه های عصبی بولی و باینری به لحاظ صحیح بودن مقادیر وزن نرون های شان، و متناظراً سرعت بیشترشان، و به دلیل ساختار نرون ها به صورت گیت آستانه، مورد استفاده قرار گرفته-اند. در آغاز، مقادیر بهینه پارامترهای گیت آستانه برای شبکه های بولی محاسبه شد که باعث کاهش پیچیدگی مدارات شبکه بولی گردید. آن وقت برای رفع محدودیت شبکه بولی با توابع بولی دارای بیش از شش متغیر (که محاسبه وزن ها و مقدار آستانه، مستلزم محدود نمودن مقادیر و سپس جستجوی الگوریتمی است) در محاسبه وزن ها و مقدار آستانه ی گیت آستانه، روی کرد جدیدی در تحقق این امر ارائه شده است. روش فوق برروی قسمتی از سیستم خبره ای که سیستم ارتباط داده ای را مدل کرده است اِعمال شد تا شبکه معادل به دست آید. از موارد برتری شبکه بولی، بهینه سازی شبکه بولی (تعداد حداقل گیت های آستانه در لایه مخفی) به دلیل وجود پروسه انتقال در الگوریتم ims شبکه بولی می باشد که نسبت به شبکه باینری به راحتی قابل انجام است. شناسائی توابع بولی ممتاز توسط شبکه عصبی بولی که مقادیر وزن باینری دارند از دیگر موارد برتری شبکه عصبی بولی است.
مهدی نادری رضا منصفی
ردگیری خط سیر ربات صنعتی با خطا و نوسان کمتر، از مسائل مهم در کنترل ربات است. به دلیل پیچیدگی زیاد و همچنین وجود نایقینی ها در دینامیک ربات، طراحی مدل گرای ربات، زمان بر بوده و پیاده سازی آن بسیار مشکل است. روش پیشنهادی، سعی در یادگیری آنلاین و سریع تر دینامیک ربات و تولید گشتاور مناسب بدون اطلاع از مقدار مطلوب آن دارد. روش پیشنهادی به منظور استفاده از توانایی های کنترل کننده های خطی، شبکه-های عصبی و سیستم استنتاج فازی، از کنترل کننده ی pid و anfis اصلاح شده به طور همزمان استفاده می کند. کنترل کننده ی pid موجب تطبیق سریع و محدود شدن خطای ردگیری مسیر شده و استفاده از الگوریتم یادگیری را میسر می سازد و کنترل کننده ی anfis اصلاح شده خطای کنترل کننده ی pid را کاهش می دهد. به منظور کاهش خطای ردگیری مسیر، کارایی کنترل کننده ی anfis، توسط ترکیب خطی از خطای مکان و سرعت زاویه ای، سنجیده می شود. مهم ترین ویژگی روش پیشنهادی، اصلاح الگوریتم یادگیری کنترل کننده ی anfis متعارف، به گونه ای است که از برخی اطلاعات دینامیک ربات (ماتریس اینرسی)، استفاده کرده و اطلاعات بیش تری را در اختیار الگوریتم یادگیری قرار می دهد که منجر به یادگیری مناسب تر دینامیک ربات و تسریع آن می شود. سیستم پیشنهادی در محیط simulink نرم افزار matlab، شبیه سازی شده و نتایج بدست آمده از لحاظ خطای مکان و سرعت زاویه ای، خطای عملگر نهایی، زمان یادگیری و مقدار گشتاور تولیدی با کنترل کننده های pid، تطبیقی و هوشمند آنلاین، مقایسه می شود.
الهام منوچهری رضا منصفی
اخیراً داده های جریانی به دلیل کاربرد در انواع مختلف داده ها از قبیل دنباله ی کلیک ها، صفحات وب، داده های حس گرهای بی سیم و غیره توجه زیادی را به خود جلب کرده است. برای کاوش در چنین داده هایی، توانایی پردازش در یک گذر از روی داده ها و با مصرف حافظه ی کم امری مهم به شمار می رود. یکی از چالش های مهم در داده های جریانی، تغییر تدریجی داده ها یا مفهوم آن با گذشت زمان است که نیاز به به روزرسانی مدل می باشد. در حال حاضر الگوریتم درخت هافدینگ، درخت تصمیمی برای داده های جریانی، در طبقه بندی این گونه داده ها مورد توجه می باشد. هدف اصلی این تحقیق بهبود عملکرد درختان هافدینگ از دو جنبه می باشد. 1) الگوریتم هافدینگ با ورودی صفات گسسته عمل می نماید، در حالی که برخی از مسائل دنیای واقعی با صفات عددی توصیف می گردند. نوآوری این تحقیق ارائه ی روشی برای گسسته سازی داده ها می باشد که با نیازمندی داده های جریانی مطابقت داشته باشد. 2) درختان هافدینگ سازگار با تغییر مفهوم در صورت مشاهده تغییر در مفهوم، زیردرختانی را گسترش می دهد و تا زمانی که این زیردرختان به اندازه کافی دقیق نگردیده اند از آن ها استفاده نمی گردد. نوآوری دیگر این تحقیق، استفاده از این درختان در پیش گویی و تلفیق آنان با درخت اصلی می باشد. ارزیابی کارآیی روش پیشنهادی توسط زبان برنامه نویسی جاوا با مجموعه داده های ساختگی و kdd98 انجام گرفت و نتایج بدست آمده برتری مدل پیشنهادی در امر کاهش خطا و دستیابی به دقت بالا تر در حضور تغییرات در داده ها و مفهوم، با حافظه ی مصرفی و زمان اجرای محدود در مقابل دیگر روش های ارائه شده در ادبیات نشان می دهد.
غلامحسین اکباتانی فرد رضا منصفی
طراحی بهینه ی لایه کنترل دسترسی به رسانه ی انتقال (mac) یکی از چالش های مهم در طراحی پشته پروتکل شبکه های حسگر بی سیم است. هماهنگ سازی خواب و بیداری گره ها، سربار انجام این کار، تصادم فریم ها، مصرف انرژی جهت ارسال(های) مجدد، تخصیص کانال به رادیو(ها)ی گره ها جهت کاهش تداخل از جمله مسائلی است که در لایه دسترسی به رسانه ی شبکه های حسگر بی سیم مطرح است. در این تحقیق ابتدا مسائل و چالش های مربوط به لایه کنترل دسترسی شبکه های حسگر بی سیم بررسی شده، سپس پروتکل های کنترل دسترسی چند کاناله موجود مورد تجزیه تحلیل و مقایسه قرار گرفته است. پس از آن، سیستم حدنصاب (quorum) نامتقارن جدیدی به نام dygrid، با چرخه وظیفه ی پایین ارائه شده است. حدنصاب پیشنهادی با حدنصاب های دیگر مورد مقایسه قرار گرفته و تحلیل های نظری نشان داده که حدنصاب پیشنهادی از نظر حداقل چرخه وظیفه، حساسیت شبکه و تنوع تعداد ملاقات ها، دارای مزایایی نسبت به دیگر حدنصاب ها است. در ادامه، با بهره گیری از سیستم حدنصاب پیشنهادی، پروتکلی وفقی، مبتنی بر استفاده از چند کانال در لایه دسترسی به رسانه، جهت صرفه جویی در انرژی و هم چنین افزایش گذردهی شبکه حسگر پیشنهاد شده است. این روش با تأکید بر کاربردهای جمع آوری داده از گره های حسگر پخش شده در محیط بنا نهاده شده ولی می تواند برای کاربردهای انتشار داده نیز مورد بهره برداری قرار گیرد. برای ارزیابی کارایی پروتکل کنترل دسترسی پیشنهادی (queenmac) تحلیل های نظری و شبیه سازی های گسترده ای انجام شده است. انتقال داده همه پخشی در شبکه های مبتنی بر حدنصاب در این رساله مورد تحقیق و تجزیه تحلیل نظری قرار گرفته و روش هایی برای آن نیز ارائه گردیده است. در ادامه ی رساله، نحوه ی انتقال داده های حجیم به صورت بلادرنگ توسط گره های opal مورد ارزیابی قرار گرفته است. پروتکل 3mu بدین منظور تهیه و پیاده سازی شده و کارایی آن در سناریوهای مختلف بررسی شده است. نتایج نشان داده که 3mu با بکارگیری گره های opal توانسته به گذردهی بیش از چهار برابر کارهای مشابه دست یابد.
محسن عباسی رضا منصفی
با افزایش سریع حجم اطلاعات در دنیای امروزی، به سیستمی که با دادن پیشنهادات مناسب با خواستههای کاربر (پیشنهادات شخصیسازیشده)، او را از مرور آیتمهای بسیار زیاد باز دارد، احساس نیاز می شود. امروزه سعی در ساخت "سیستمی توصیهگر" با درصد خطای کم و سرعت بالا در تمام شرایط به یکی از پرطرفدارترین حوزههای تحقیقاتی دانشگاهی تبدیل شده است. به دلیل درصد خطای بالا، معمولاً یک روش پایه در ساخت این گونه سیستم ها به کار گرفته نمی شود. اکثر اوقات جهت پیاده سازی آن از ترکیب چندین روش استفاده میشود. الگوریتمهای پیشنهادی در دو دستهی کاربرمحور و آیتممحور تقسیم می شوند. جهت بهبود توصیهها و در نتیجه حل مشکل "شروع سرد" (کاربری و آیتمی)، از دادههای خارج از سیستم توصیهگر نیز استفاده میشود. در این پایاننامه، روش کاربرمحور پیشنهادی از روابط اعتماد بین کاربران در شبکههای اجتماعی، جهت تشخیص هرچه بهتر علایق کاربر و در نتیجه بهبود توصیهها، استفاده میشود. جهت تشخیص هر چه بهتر شباهت میان آیتمها، روش آیتممحور پیشنهادی نیز از طبقهبندی موضوعی و معنایی آیتمها بهره میگیرد. همچنین از کلمات کلیدی استخراج شده با روشهای معنایی از محتوای آیتمها در جهت بهبود توصیهها، بهخصوص در هنگام برخورد با مشکل شروع سرد، استفاده شده است. نوآوری در این تحقیق بدین ترتیب است که با ادغام تکنولوژیهای معنایی و شبکه های اجتماعی مشکلاتی چون شروع آهسته، و به طور کلی "تُنُکی دادهها" در سیستمهای توصیهگر به میزان قابل توجهی برطرف شده است. از مجموعه داده های جمعآوری شده جهت این تحقیق توسط نگارنده، از تراکنش های سایت epinions.com و نیز از اطلاعات تکمیلی موجود در سایتهایی چون آمازون و کتاب خانه کنگره و غیره استفاده شده است. ارزیابی کارآیی الگوریتم های پیشنهادی در مقایسه با الگوریتم های رقیب مرزهای دانش انجام پذیرفت و نتایج ارزیابی کارآیی بهبود یافته، نشان گر تأثیر بسزای به کارگیری اطلاعات اجتماعی و معنایی در کاهش خطای سیستم های توصیه گر است.
جواد حمیدزاده رضا منصفی
کمبود داده های آموزشی یکی از مشکلات بارز روش های طبقه بندی غیرپارامتری جهت تخمین پارامترها است. با افزایش ابعاد داده ها نیاز به داده ها به صورت نمایی رشد می نماید. از طرفی با افزایش داده ها 1) نیاز به حافظه بیش تر جهت نگهداری داده ها و 2) افزایش زمان لازم جهت طبقه بندی داده ها احساس می شود. در روش های فوق همواره بین فضای حافظه و نرخ صحت طبقه بندها مصالحه وجود دارد. از طرفی تابع چگالی در نقاط مرزی بین کلاس ها ثابت نیست. تحقیق در زمینه طبقه بندی غیرپارامتری، هم چنان موضوعی چالش بر انگیز است. یکی از روش های معمول طبقه بندی، روش بیز می باشد. در روش بیز ممکن است توزیع ثابت سراسری برای داده ها صادق نبوده و یا این که داده ها در نقاط مختلف از توزیع متفاوتی پیروی نمایند. برای رفع این مشکل می توان از جنبه محلی بودن روش پیشنهادی سود جست. هدف، ارایه مدلی مبتنی بر ویژگی های محلی و سراسری جهت طبقه بندی داده ها به صورت کارآمد است. روش فوق از دو جنبه سراسری و محلی به داده ها اهمیت می دهد، به طوری که جنبه سراسری سعی در کاهش داده های آموزشی (فضای حافظه) و جنبه محلی سعی در غلبه بر عدم تبعیت داده های واقعی از مدل توزیع یکتای سراسری دارد. نوآوری تحقیق حاضر استفاده از ترکیب فاصله ها تا نمونه های آموزشی کلاس ها و ایجاد سطح تصمیم می باشد. دید محلی و سراسری در داده های آموزشی توسط ترکیب این دو لحاظ شده است. از خصوصیات روش پیشنهادی، سادگی طبقه بند است که بدون آموزش و یا با افزودن آموزش مقیاس پذیر به آن می توان طبقه بندی کارآمد ارائه نمود. از اهداف نظری این تحقیق 1) تعیین میزان تعمیم پذیری طبقه بند پیشنهادی و هم چنین 2) تعیین کران بالای امید ریاضی خطا در حالت های مجانبی است. از معیار پیچیدگی rademacher در تعیین کران بالای امید ریاضی خطای طبقه بند پیشنهادی استفاده شده است. برای ارزیابی کارایی روش پیشنهادی، با الگوریتم های مرزهای دانش مانند dwknn، pnnr، lms و kdf-knn بر روی مجموعه داده های استانداردuci مقایسه شده است. در ارزیابی فوق جهت پیاده سازی از محیط های matlab2010 و gams استفاده شده است. از 10-fold cross validation برای تعیین نرخ صحت روش پیشنهادی، استفاده گردیده است. برای سنجش نتایج ارزیابی ها به صورت آماری از روش آزمون فرضیه و آزمون بازه ای با درجه اطمینان 95% کمک گرفته شده است.
حسن عباسی رضا منصفی
معیارهای مختلفی برای ارزیابی طبقه بندها وجود دارد که از آن جمله می توان به صحت، دقت، سادگی، تعمیم پذیری، تفسیرپذیری، تعداد پارامترها و نحوه ی تنظیم آن ها اشاره نمود. طبقه بندهای خطی، ساده، تعمیم پذیر، تفسیرپذیر و دارای تعداد پارامتر کم هستند. اما اغلب مسائل طبقه بندی دنیای واقعی دارای الگوهای جداناپذیر خطی است. برای این که طبقه بند خطی بتواند داده های جداناپذیر خطی را نیز درست طبقه بندی کند، یک راه حل، تبدیل داده ها به کمک توابع کرنل و راه حل دیگر ترکیب طبقه بندهای ساده است. از جمله ی روش های ترکیب، می توان به طبقه بندهای خطی محلی و روش های boosting اشاره کرد. یکی از نکاتی که در ترکیب طبقه بندها باید رعایت شود این است که هر چقدر طبقه بندهای پایه ی تشکیل دهنده ی طبقه بند نهایی، ساده تر باشند و توزیع داده ها در آن ها نامتوازن تر باشد، طبقه بند حاصل بهتر عمل می کند. نوآوری این تحقیق، ارائه یک کران بالای خطا برای روش های مبتنی بر ترکیب طبقه بندها است که وابسته به پیچیدگی طبقه بندهای پایه و تعداد موثر آن ها است. بر اساس این معیارها، مدلی جدید برای طبقه بندی غیرخطی، پیشنهاد می گردد که شامل 3 مرحله ی تقسیم، مدل سازی و ترکیب است. الگوها در مرحله ی «تقسیم»، به دو یا چند بخش تقسیم می شود با این هدف که علاوه بر کاهش پیچیدگی موجود در آن ها، توزیع داده ها در آن ها نیز نامتوازن تر شود. مثلاً مشخصاً در اثر تقسیم، بخش بزرگی از داده ها جداپذیرخطی شود. در مرحله ی «مدل سازی»، مدلی برای توصیف هر بخش ارائه می گردد. در مرحله ی فوق، از روش های طبقه بندی خطی، روش های توصیف داده ها وطبقه بندهای تک کلاسه استفاده می شود. در مرحله ی «ترکیب»، طبقه بندهای خطی و مدل های ساخته شده برای هر بخش با یکدیگر ترکیب شده و طبقه بند نهایی را تشکیل می دهند. با انتخاب روش های مختلف تقسیم، مدل سازی و ترکیب، طبقه بندهای نمونه ای به نام های constraint embedded classifier(cec)، recursive cec(rcec) و cluster linear decision tree (cldt) ساخته شده است. سپس امید ریاضی کران بالای خطای آزمون مدل با معیار پیچیدگی rademacher و گاوسی محاسبه شده است. سازگاری و هم گرایی مدل نیز اثبات شده است. عمل کرد الگوریتم های ارائه شده با روش های طبقه بندی متداول مانند svm، k-nn، cart و adaboost روی مجموعه داده های دنیای واقعی مقایسه گردیده است. انجام آزمون های آماری روی نتایج مقایسه، برتری متوسط مدل نسبت به روش های دیگر را نشان می دهد. در نهایت تحلیل اثر انتخاب طبقه بند خطی پایه و هم چنین تحلیل نویز انجام شده است.
محسن شفیعی رضا منصفی
دسترس پذیری بالای داده ها در جوامع اطلاعاتی کنونی، وجود ابزاری معتبر و کارآمد به منظور مدل سازی و تحلیل داراییهای با ارزش (اطلاعات) را ملموس تر می نماید. از موانع مهم در استفاده ابزارهای داده کاوی در این راستا حجم بالای داده های مورد بررسی است که هزینه های زمانی و تحلیلی زیادی را به دنبال دارد. در اغلب موارد می توان با حذف داده های زائد وبی ارزش علاوه بر کاهش هزینه های کاوش، صحت نتایج تولیدی را نیز تا حد قابل قبولی حفظ کرد. انتخاب ویژگی یکی از روش هایی است که سعی دارد با کاهش تعداد صفات داده های مورد بررسی هزینه های داده کاوی را کاهش دهد، ولی از آن جا که خود روال انتخاب ویژگی مناسب جزو مسائل np-complete است، می توان به جای تولید پاسخ قطعی با صرف زمان قابل ملاحظه، به دنبال رسیدن به پاسخ قابل قبول باشیم. استفاده از رویکرد فرامکاشفه ای برای این منظور مناسب و پرکاربرد است، در این پایان نامه با ترکیب و ایجاد تغییرات مناسب در روش های متداول فرامکاشفه ای مانند روش کلونی مورچه ها، جستجوی هارمونیک و بهینه سازی ذرات هوشمند توانسته ایم به ایجاد بهینگی در این روش ها برای حل مسأله انتخاب ویژگی دست یابیم، که نتایج حاصل از اعمال این تغییرات با شبیه سازی انجام شده با نرم افزار متلب و بر روی مجموعه داده های بزرگ و معتبری مانند گیست و درثا که به منظور استفاده در روش انتخاب ویژگی مناسب سازی شده است اعمال و نتایج حاصل تایید کننده بهینگی روش مورد بررسی است.
عادل قاضی خانی رضا منصفی
طبقه بندی داده های جریانی غیرایستان یکی از شاخه های مهم علم تشخیص الگو و یادگیری ماشین است که به طور روز افزون مورد توجه قرار گرفته است. دلیل این موضوع کاربردهای فراوان جدیدی از قبیل کارت های اعتباری، آب و هوا، شبکه های حس گر بی سیم، داده های وب و غیره است. در طبقه بندی داده های جریانی چالش اساسی تغییر مفهوم (غیرایستان بودن) است، که در آن تابع توزیع زیرین توصیف کننده داده ها به مرور زمان تغییر می کند. یکی از چالش های دیگری که در طبقه بندی داده های جریانی وجود دارد کلاس های نامتعادل است. کلاس های نامتعادل چالشی برای بیش تر طبقه بندهای باناظر است که در آن تعداد نمونه ها در کلاس های مختلف با یکدیگر اختلاف فاحش دارند. اغلب الگوریتم هایی که تاکنون برای طبقه بندی داده های جریانی غیرایستان و نامتعادل ارائه شده اند رویکرد دسته ای دارند. از این رو، برخلاف مطالعات قبلی، در این پایان نامه طبقه بندهایی برخط برای طبقه بندی داده های جریانی غیرایستان و نامتعادل پیشنهاد شده است. در این راستا، الگوریتم هایی در سه دسته اساسی مبتنی بر فیلترهای وفقی، پرسپترون و ترکیب برخط طبقه بندها ارائه شده است. در الگوریتم های مبتنی بر فیلتر وفقی و پرسپترون رویکرد اساسی وزن دهی به خطا و در الگوریتم های مبتنی بر ترکیب برخط طبقه بندها رویکرد اساسی وزن دهی به رأی طبقه بندهای پایه است. در الگوریتم های مبتنی بر فیلترهای وفقی از تئوری ردیابی و تئوری کالمن و در الگوریتم های مبتنی بر پرسپترون و ترکیب برخط طبقه بندها از مدل کران خطا برای تحلیل الگوریتم ها استفاده شده است. برای ارزیابی الگوریتم ها از مجموعه داده های متنوع واقعی و مصنوعی مورد استفاده در تحقیقات پیشین، بهره برده شده است. در ارزیابی الگوریتم ها از معیارهای میانگین هندسی، نرخ صحت مثبت و منفی (tpr,tnr)، f-measure و هم چنین مرتبه زمانی و مکانی استفاده شده است. برای تأیید نتایج آزمایش ها از آزمون های تمایز آماری anova و hsd استفاده شده است. نتایج آزمون های تمایز آماری نشان دهنده برتری الگوریتم های پیشنهادی مبتنی بر فیلترهای وفقی نسبت به rlsp,rbsop,lbsop,rbp,lbp، الگوریتم های پیشنهادی مبتنی بر پرسپترون نسبت به spa,sop,lbsop,rbsop و الگوریتم های پیشنهادی مبتنی بر ترکیب برخط طبقه بندها نسبت به oe1,oe2,onb دارد.
حمید رضا غفاری هادی صدوقی یزدی
در این رساله، برای طراحی طبقه بند چندکلاسی تعمیم پذیر مقیاس پذیر، بُعد vc در نظر گرفته شده است. این بُعد، ظرفیت مجموعه ای از توابع طبقه بندی را اندازه گیری می کند و در الگوریتم های یادگیری، خطای تعمیم پذیری وابسته به آن می باشد. وجود گستردگی در استفاده از طبقه بند چندکلاسی در کاربردهای جهان حقیقی از یک سو و تعداد زیاد کلاس های این گونه کاربردها از سوی دیگر، سبب شده تا نتوان از طبقه بند ماشین تکی استفاده نمود، زیرا که در طبقه بند ماشین فوق، تمام ابرصفحه های بین کلاس ها با هم به دست می آید. در این گونه روش ها با بهینه سازی مسأله ای بسیار بزرگ و پیچیده مواجهیم که حل آن بسیار زمان بر و بعضاً غیرممکن است. بنابراین، برای حل این گونه از مسائل، از روش های تجزیه استفاده می شود. در این رساله، با بهره گرفتن از مفهوم پیچیدگی داده ها (به عنوان یک عنصر کم تر استفاده شده در تحقیقات گذشته طبقه بند چندکلاسی)، مسأله دنبال شده است تا تعمیم پذیری طبقه-بندهای چندکلاسی مبتنی بر روش های تجزیه بهبود یابد. پیچیدگی داده ها جهت خوشه بندی کلاس ها و تعیین ساختاری مناسب برای طبقه بند بکار رفته، به نحوی که مقدار هزینه برای تابع هدف حداقل و در نتیجه خطای تعمیم پذیری کم شود. بعد از تعیین ساختار مناسب برای طبقه بند (با توجه به ویژگی های مناسب)، صرفاً طبقه بندهای باینری ماشین بردار پشتیبان جهت اخذ نتیجه استفاده گردیده است. در انتخاب روش های طبقه بندی مبتنی بر تجزیه نیز باید توجه نمود که در روش های تجزیه: 1- یکی در برابر دیگری، 2-یکی در برابر بقیه، با مشکلاتی مواجه ایم، در مورد اول، تعداد طبقه بند پایه با تعداد کلاس رشد فزاینده ای دارد و در روش دوم با مشکل عدم موازنه داده ها مواجه ایم. استراتژی تجزیه ای که مشکلات فوق را تا حدی حل می نماید، استراتژی درختی است، اما کماکان مسأله مهم در این جا، چگونگی ساخت درخت است. در استراتژی درختی، روش ماشین بردار پشتیبان با روش درختی ترکیب شده، بدین معنی که حل مسأله از دو قسمت یادگیری بدون ناظر و یادگیری باناظر تشکیل می شود. بخش اول که یادگیری بدون ناظر است، درختی سلسله مراتبی از کلاس ها ساخته می شود که هر کدام از کلاس ها در برگ های درخت قرار می گیرد، در بخش دوم، برای هر گره، طبقه بندی باینری آموزش داده می شود. نهایتاً، دو قسمت مذکور با هم، ساختار طبقه بند چندکلاسی را تشکیل می دهد. در این رساله، تمرکز اصلی بر روی بخش بدون ناظر (بهینه سازی ساختار طبقه بند مورد نیاز برای طبقه بند چندکلاسی) می باشد. بنابراین آنچه که در این رساله دنبال خواهد شد، ارائه روشی است که کاربرد آن در بعضی از روش های متعارف، باعث بهبود کارایی می شود. برای بیان ایده، ابتدا ارتباط بین پیچیدگی داده ها، پیچیدگی مدل و بُعد fat-shattering را مورد بررسی قرار می دهیم، سپس سنجه های مختلف موجود برای اندازه گیری پیچیدگی داده ها بررسی می شوند. در این راستا بدنبال کمیتی متناسب با نوع طبقه بند به کار برده شده هستیم. در ادامه، به کمک سنجه مشخص شده برای پیچیدگی داده ها، ساختار مناسبی را برای طبقه بند تعیین و در انتها ثابت می کنیم که طبقه بند پیشنهادشده دارای حداقل بُعد fat-shattering و در نتیجه دارای تعمیم پذیری خوبی است. در انتها، از مجموعه داده های استانداردی نظیر پایگاه های داده ا ی uci، satlog و هم چنین از مجموعه داده ی ایستگاه هوایی برای ارزیابی روش ها استفاده شده است، نتایج حاصل از آزمایش ها، برتری روش پیشنهادی را بر سایر روش ها بیان می کند.
محمد خیراندیش رضا منصفی
طراحی و زمان بندی فعالیت ها از دیدگاه تولید طرح های موفق و بیشینه نمودن بهره وری اهمیت فوق العاده ای دارند. به علاوه در محیط واقعی، مسائل شامل چندین هدف می باشند که باید به طور هم زمان بهینه شوند و محیط واقعی معمولاً به وسیله اطلاعات غیر قطعی و غیر قابل کنترل مشخص می شود. مسأله زمان بندی پروژه با منابع محدود (rcpsp) چند هدفه می کوشد تا فعالیت ها را زمان بندی نماید و منابع را به منظور یافتن یک مجموعه عملیات کارا برای کمک به مدیران پروژه و بهینه سازی چندین معیار اختصاص دهد. برای حل این قبیل مسائل نیاز به الگوریتم های تکاملی می باشد. در این تحقیق، روشی مبتنی بر مفاهیم چند هدفه و الگوریتم تکاملی کوانتومی (qea) را به منظور حل مسأله فوق توسعه می دهیم. در روش پیشنهادی نحوه کدگذاری جدیدی برای هر فرد جمعیت درنظر گرفته شده و هم چنین به منظور دستیابی به عملکرد بهتر از روال به روزرسانی و مشاهده (observe) پیشنهادی در الگوریتم استفاده شده است. در ابتدا مسأله rcpsp در حالت تک هدفه و سپس در حالت چند هدفه به دو روش ترکیب اهداف و روش مبتنی بر بهینه pareto توسط الگوریتم پیشنهادی حل شده و در هر روش، الگوریتم های جدیدی ارائه می شود. عملکرد الگوریتم های پیشنهادی از طریق آزمایش های عددی با الگوریتم nmopso، mots و nsga ii مقایسه شده است. آزمایش های عددی حاکی از برتری الگوریتم-های پیشنهادی می باشد.
رامین رضوانی خراشادی زاده رضا منصفی
الگوریتم ماشین بردار پشتیبان (svm)، به عنوان یکی از رایج ترین طبقه بندها، سعی در یافتن ابرصفحه ای می کند که دو کلاس از داده ها را با حداکثر حاشیه جدا کند. طبقه بندهای svm، بیشتر روی جداسازی بین کلاس ها تمرکز می کنند و توجه خاصی به استخراج ساختارهای درون داده های آموزشی نشان نمی دهند. درحالی که اخیرا کشف شده است که، اطلاعات ساختاری، به عنوان دانش پیشین ضمنی، نقش اساسی و حیاتی برای طراحی طبقه بندی خوب، در مسائل مختلف جهان طبیعی بازی می کند. اساسا، استفاده از اطلاعات ساختاری درون داده ها برای بهبود قابلیت تعمیم پذیری یک طبقه بند، کلاسی از طبقه بندهای حاشیه بزرگ ساختاری را معرفی می کند مانند ماشین حاشیه بزرگ ساختاری (structured large margin machine, slmm). اینکه چگونه اطلاعات ساختاری داده ها را برای ساختن طبقه بندی خوب اعمال کنیم، موضوع تحقیقاتی جدیدی است که اخیرا مورد توجه قرار گرفته است. همان طور که می دانیم، همه متدهای حاشیه بزرگ ساختاری (structural large margin) موجود، همه اطلاعات ساختاری درون کلاس ها را به درون یک مدل درنظر می گیرند. به عبارت دیگر، این متدها ارتباط اطلاعات ساختاری درون کلاسی و بین کلاسی را بالانس نمی کنند که سبب می شود این اطلاعات پیشین به طور کامل و کافی استخراج نشود. الگوریتم s-twsvm برای بهبود تعمیم پذیری متدهای مبتنی بر اطلاعات ساختاری معرفی شد و توانست مشکل تداخلات اطلاعات ساختاری بین دو کلاس را برطرف کند. اما در حل تداخلات و تناقض های بین اطلاعات ساختاری کلاسترهای یک کلاس ناتوان است و همچنین توانایی ممیزسازی داده های آموزشی از نقاط نویز را ندارد. در این نوشتار الگوریتمی با عنوان ماشین بردار پشتیبان دوگانه ساختاری چگالی گرا (dos-twsvm) معرفی می شود که با بهره بردن از قابلیت های s-twsvm، توانایی مدیریت کردن اطلاعات ساختاری درون کلاسی، به طوری که مسائل تداخلات اطلاعات ساختاری درون کلاسی را حل کند، دارا می باشد. از طرف دیگر با تمایز کردن نقاط پرت و نویز از سایر نقاط آموزشی، قابلیت تعمیم پذیری را افزایش می دهد. در انتهای این نوشتار، الگوریتم پیشنهادی با الگوریتم s-twsvm، روی مجموعه داده ساختگی و داده های mnist و همچنین مجموعه داده های uci آزمایش می شود و برتری الگوریتم پیشنهادی از نظر صحت و دقت (accuracy) در طبقه بندی داده های تست، مشاهده می شود.
مصطفی سمزقندی رضا منصفی
مدیریت ترافیک هوایی یکی از مشاغل حساس و پراسترس است که همه روزه با مشکلات و موانع مختلفی روبه¬رو می¬شود و مسأله توالی هواپیما (aircraft sequencing problem) یکی از مهم¬ترین مسائلی است که این روزها در حوزه کاری مراقبت پرواز (air traffic control) به آن پرداخته می¬شود. مسأله توالی هواپیما یک مسأله np-سخت است، الگوریتم¬های دقیق کارایی خود را بر روی این مسأله در ابعاد بالا از دست می¬دهند و نمی¬توانند به جواب بهینه در یک زمان قابل قبول دست یابند؛ درنتیجه امروزه برای حل این¬گونه مسائل از الگوریتم¬های ابتکاری و فرا ابتکاری استفاده می¬شود. در این پایان نامه سعی شده با تلفیق الگوریتم ert(earliest ready time) جهت انتخاب بهترین هواپیمای آماده عملیات با الگوریتم استعماری اصلاحی که از روش نزدیک¬ترین همسایه تصادفی برای تابع جذب در کنار روش بهبود¬دهنده سه¬نقطه¬ای برای تابع انقلاب استفاده کرده، روش جدیدی در حل مسأله توالی هواپیما ارائه شود. نتایج حاصل از پیاده سازی این الگوریتم نشان می¬دهد که در مقایسه با سایر الگوریتم¬ها از کارایی بالایی برخوردار است.