نام پژوهشگر: ستار هاشمی
حسین فرجی محمد هادی صدرالدینی
حجم روز افزون دادهها در فایلها، پایگاه دادهها و دیگر انبارههای داده، توسعه روشهای تجزیه و تحلیل و استخراج اطلاعات مفید و ضمنی موجود در دادهها را ایجاب می نماید. این اطلاعات می توانند در پروسهای تصمیم گیری سازمانها بسیار موثر باشند. داده کاوی کشف الگوهای پنهان واطلاعات مفید از پایگاه دادهها است. داده کاوی یکی از قدم های مهم در پروسه کشف دانش است. کاوش وابستگیهای تابعی تقریبی به عنوان یکی از روشهای داده کاوی می تواند ارتباطات پنهان و نسبی بین خصیصه های موجود در داده های رابطه ای را استخراج کند. همچنین ارتباطات پنهان بین مقادیر این خصیصه ها را می توان توسط قوانین انجمنی بیان نمود. در این پایان نامه یکی از بهترین روش های کاوش وابستگی های تابعی تقریبی بهبود داده شده است. در این بهبود علاوه بر تولید نتایج مفیدتر کارایی الگوریتم نیز در بسیاری از موارد بهبود می یابد. همچنین با استفاده از مفهوم وابستگی های تابعی تقریبی روش جدیدی بنام ar-miner برای کاوش قوانین انجمنی از پایگاه داده های رابطه ای ارائه می شود. روش جدید علاوه بر کارا بودن می تواند قوانین انجمنی را مستقیما از داخل پایگاه داده های رابطه ای استخراج کند. در انتها با استفاده از الگوریتم ارائه شده برای کاوش وابستگی های تابعی تقریبی، خصیصه های شرکت کننده در دسته بندی ماژول های معیوب نرم افزار را بدون کم شدن کارایی دسته بند کاهش می دهیم.
رحیم غلامی شولی ستار هاشمی
یکی از روش های تشخیص الگو،استفاده از شبکه های عصبی می باشد.ما در این پایان نامه از شبکه grnn برای تشخیص الگو استفاده می کنیم.grnn یکی از انواع شبکه های برپایه شعاع و یک ابزار رگرسیون قوی می باشد. grnn مقدار یک یا بیشتر متغیر وابسته را، با گرفتن مقدار یک یا بیشتر متغیر مستقل پیشگویی می کند. برای بهینه سازی شبکه grnn ، می توان از الگوریتم های بهینه سازی مختلفی استفاده کرد.ما در این پایان نامه از الگوریتم رقابت استعماری برای بهینه سازی grnn در تشخیص الگوها، استفاده می کنیم.دراین پایان نامه مراکز grnn و مقدار گستردگی شبکه، در یک کشور کد می شوند و این دو پارامتر حیاتی ،توسط الگوریتم رقابت استعماری بهینه می شوند. ابتدا تعدادی از الگوهای مجموعه داده به صورت تصادفی به عنوان مراکز grnn انتخاب شده و کشورهای اولیه را تولید می کنند، و سایر الگوها به عنوان مجموعه تست درنظر گرفته می شوند.سپس الگوریتم اجرا می شود.در هر چرخه از الگوریتم، امپراطوری را که الگوهای بیشتری از مجموعه تست را به درستی تشخیص می دهد، به عنوان قویترین امپراطوری در نظر می گیریم.زمانی که تنها یک امپراطوری باقی ماند،الگوریتم متوقف می شود وآن امپراطور،به عنوان جواب بهینه انتخاب می شود. مقادیر ذخیره شده در امپراطور نهایی، مراکز grnn و مقدار گستردگی بهینه را تعیین می کند. نتایج به دست آمده نشان می دهد که grnn بهینه سازی شده با این الگوریتم،دارای دقت بالایی در تشخیص الگو می باشد.
زهرا شهابی راد محمدعلی خجسته پور
چکیده بررسی کاربرد سیستم های پشتیبان تصمیم گیری decision support systems مطالعه موردی : قابلیت استفاده و اجرای سیستم پشتیبان تصمیم گیری در اعطای تسهیلات بانکی در بانک مسکن به کوشش زهرا شهابی راد با بررسی و تجزیه و تحلیل روند پرداخت تسهیلات در بانک ها به این نتیجه رسیدیم که کمبود یک سیستم مکانیزه تصمیم گیری در اعطای تسهیلات به چشم می خورد. این نقیصه باعث طولانی شدن روند تصمیم گیری و فراموشی برخی آیتم های کنترلی یا تصمیم گیری نادرست می گردد. لذا در این پروژه بر آن شدیم جهت مرتفع ساختن این خلاء، استفاده از سیستم پشتیبان تصمیم گیری dss را به عنوان یک سیستم جهت کمک به مدیران و تصمیم گیرندگان اعتباری در تصمیم گیری های اعطای تسهیلات مورد مطالعه قرار دهیم. هدف از این تحقیق توجیه علمی و عملی ضرورت وجود و پیشنهاد طراحی یک سیستم پشتیبان تصمیم گیری یا dss در اعطای تسهیلات می باشد و به عنوان مطالعه موردی، این سیستم به صورت یک سیستم عملی و کاربردی در پرداخت تسهیلات بانک مسکن مورد بررسی قرار گرفته است. روش اصلی استفاده شده در این تحقیق مصاحبه برای استخراج داده های لازم، استفاده از پرسشنامه و مطالعه مستندات مرتبط با پرداخت تسهیلات پیشین، مطالعه دستورالعمل های بانکی و سیاست های اعتباری بانک می باشد. همچنین مطالب زیادی از طریق کتب، مقالات و جستجو در اینترنت گردآوری گردید. یافته های این تحقیق نشان می دهد که سیستم تصمیم گیری پرداخت تسهیلات در بانک مسکن بسیار زمان بر بوده و معمولا در نهایت به نتایج کاملا صحیح نیز منتهی نمی گردد. این روند به دلیل کثرت آیتم های کنترلی و تعداد زیاد متقاضیان، اشتباه در تصمیم گیری و فراموشی کنترل برخی آیتم ها را اجتناب ناپذیر می سازد. با استفاده از مطالعات و تحقیقات صورت گرفته و استفاده از تجارب کارشناسان از طریق پرسشنامه ها و مصاحبه های گوناگون، استفاده از یک سیستم خبره که پروژه را در سه فاز مطابقت با آیین نامه ها، قوانین، مقررات و سیاست های اعتباری، اعتبارسنجی متقاضیان و بررسی پروژه مورد ارزیابی قرار می دهد، جهت مرتفع ساختن مشکلات موجود در تصمیم گیری اعطای تسهیلات در بانک مسکن پیشنهاد گردید که بتوان به کمک این سیستم جدید نقاط ضعف سیستم فعلی را بهبود بخشید.
سعید گودرزیان ستار هاشمی
سامانه های طبقه بند یادگیر و یکی از معروف ترین آنها یعنیxcs، ازانواع سامانه های بر خط مبتنی بر قانون هستند که یک مکانیزم کلی برای تولید قوانین به صورت موازی دارند و به صورت تطبیقی، قوانین جدیدی را که کاراتر از قوانین موجود باشند، تولید می کنند. این سامانه ها حاصل ترکیب دو رهیافت مهم در حوزه یادگیری ماشین به نام های روش های یادگیری تقویتی و پردازش های تکاملی می باشند. سامانه های طبقه بند یادگیر قادرند، هر سه دسته کلی مسائل حوزه یادگیری ماشین یعنی مسائل بهینه سازی، کلاسه بندی و یادگیری تقویتی را حل کنند. سامانه های طبقه بند یادگیر از سه مولفه اصلی عملکرد، تقویت وکشف تشکیل شده اند. مولفه عملکرد متناسب با یک ورودی جدید، کنش مناسب را انتخاب و بر محیط مسئله اعمال می کند. مولفه تقویت با توجه به نتیجه حاصل از عملکرد کنش، قوانین درگیر را به روز رسانی می کند و مولفه کشف نیز هر از چند گاهی قوانین جدیدی را تولید و به مجموعه قوانین موجود اضافه می کند. با توجه خاص به این نکته که سامانه طبقه بند یادگیر درصدد تولید قوانینی است که بتوانند در شرایط مختلف و با ورودی های مختلف بهترین کنش را انجام دهند، در خواهیم یافت که در مقایسه دو قانون با شرایط یکسان، قانونی که بتواند در تمام نقاط حوزه ی فعالیت خود کنش های بهتری را بر محیط مسئله اعمال کند، قانون قوی تری است و مجموعه قوانین قوی تر می توانند مسئله را به طور قابل توجهی بهتر حل کنند و یا مسائلی را حل کنند که پیش از این قابل حل نبوده اند. یکی از چالش های پیش روی سامانه های طبقه بند یادگیر، افزایش بی رویه تعداد قوانین است، که این مسئله می تواند منجر به کاهش کارایی و دقت این سامانه گردد. با دقت به این نکته که هر قانون تنها در یک زیر مجموعه از فضای مسئله فعالیت می کند، کنش قوی تر برای قوانین می تواند حوزه فعالیت قوانین را گسترده تر و در نتیجه باعث کاهش چشمگیر تعداد قوانین گردد. محوریت این رساله بر ارائه روش نوینی برای تولید کنش های پیوسته در سامانه های طبقه بند یادگیر استوار است به طوری که کنش های پیوسته را به طور مستقیم از مقدار ورودی و با استفاده از فرمول چند جمله ای تولید می کند. دو ویژگی مهم مدل ارائه شده عبارت است از: 1) تولید کنش های پیوسته با استفاده از چند جمله ای باعث افزایش کارایی سامانه طبقه بند یادگیر و افزایش قدرت قوانین می گردد. 2) اندازه جمعیت به رغم استفاده از توابع چند جمله ای در محاسبه کنش هابه دلیل تولید نمودار منحنی شکل برای کنش ها، کاهش پیدا می کند.
سیدرضا اکرمیان ستار هاشمی
با توسعه ابزارهای الکترونیکی و ذخیره سازها دیجیتالی ، سازمانها این توانمندی را کسب کردد که اطلاعات مشتریان و تراکنشهای روزانه سازمان را به صورت دائم ذخیره سازی نمایند . تحلیل این داده به صورت هدفمند در کسب و کارهای موجود منجر به خلق مزیت رقابتی می گردد . این روش تحلیل تحت عنوان هوشمندی کسب و کار به صورت فراگیر در شرایط رقابتی سنگین مورد استفاده قرار می گیرد . یکی از ابزارهای خلق هوشمندی در کسب و کار داده کاوی می باشد . داده کاوی با استفاده از ترکیب روشهای نیمه خودکار و خودکار و همچنین روشهای آماری و یادگیری ماشین منجر به تولید دانش از داده های خام میگردد . یکی از صنایعی که به دلیل فشار زیاد رقابتی مجبور به استفاده از این ابزارها برای کسب موفقیت و کسب رقابت هوشمند می باشد صنعت بانکداری می باشد . بانکداری خرد با تکیه بر جذب منابع خرد مشتریان می تواند به موفقیت زیادی دسترسی داشته باشد . توسعه ابزارهای پرداخت الکترونیکی مانند دستگاههای کارتخوان این فرصت را برای بانکها ایجاد کرده است تا با در اختیار گرفتن سهم درصد بیشتری از بازار به سود آوری دست یابند . از طرفی دیگر داده های تراکنشی مشتریان از درگاههای بانکداری الکترونیکی فرصت دیگری برای تحلیل بازار بر مبنای رفتارهای مشتریان ایجاد نموده است . استفاده از این داده ها به منظور بازاریابی و شناسایی فرصتهای بالقوه بازار سالها تحت عنوان بازاریابی پایگاه داده مورد استفاده قرار گرفته است . بازاریابی پایگاه داده به منظور ایجاد لبه رقابتی با ترکیبی از داده کاوی و روشهای آماری منجر به بازاریابی هوشمند می گردد که نه تنها سازمانها را در تولید دانش مربوط به مشتریان یاری میکند بلکه سبب کاهش هزینه های بازاریابی و افزایش کارآیی روشهای موجود بازار یابی می گردد . در این مقاله سعی گردیده است با تحلیل داده ها موجود مشتریان در پایگاه داده های بانک و تلفیق دانش استخراج شده با سایر داده ها مانند داده های جغرافیایی به تولید دانش مفید در زمینه بازاریابی و مکان یابی پایانه های فروشگاهی جهت توسعه بازار بانکداری خرد پرداخته شود .
محمد کامیاب طاهرنژادیانی ستار هاشمی
این پایان نامه روش های بهینه سازی چند هدفه تکاملی بر اساس ابر حجم را مورد بررسی قرار داده و سعی در ارائه روشی موثر و کارا بر اساس معیار ابر حجم دارد. امروزه روش های تکاملی برای حل مسائل بهینه سازی چندهدفه به دلیل قدرت بالا و قابلیت جستجوی به طور موازی، به عنوان بهترین روش در نظر گرفته می شود. هدف نهایی در این گونه از مسائل، رسیدن به مجموعه ایی از اعضای غیر مغلوب با بیشترین مقدار پراکندگی (توزیع) است. اصطلاحا به مجموعه اعضای بهینه در فضای هدف، جبهه پارتو و به نگاشت این اعضا در فضای تصمیم، مجموعه پارتو گفته می شود. در این پژوهش سعی شده، با ارائه رویکردی جدید بر اساس ابرحجم وزنی اصلاح شده ،معیار پراکندگی مجموعه ها را در فضای تصمیم بهبود داده شود. برای این منظور با استفاده از دو روش پیشنهادی بر اساس فاصله اقلیدوسی و روش های خوشه بندی سلسله مراتبی معیار پراکندگی اعضای مجموعه غالب را محاسبه کرده و با یک روش هوشمندانه با معیار های سازگار با جبهه پارتو، ادغام می نماییم. برای ارزیابی روش های پیشنهادی ، از یک سری توابع آزمایشی چند هدفه استاندارد که در تحقیقات مشابه نیز به کار برده شده است، استفاده کرده و با پیاده سازی انجام شده، نتایج روش های پیش نهادی را با سایر روش های موجود بر اساس معیار ها مختلفی مورد مقایسه قرار می دهیم. نتایج آزمایشگاهی و نمودار های مقایسه ای به صورت کاملا واضح نشان می دهند که روش های پیشنهاد شده در این پایان نامه از عملکرد بالاتری بر اساس معیار پراکندگی مجموعه ها در فضای تصمیم برخوردار بوده و توانسته اند مقادیر جواب های بهینه پارتو پراکنده تری در بین کل اعضای جواب به دست آورند.همچنین به لحاظ کارایی در فضای هدف توانسته اند که با سایر روش های مطرح در این حوزه رقابت کنند.
فاطمه نوری کورش زیارتی
داده کاوی به معنای استخراج داده و اطلاعات غیر صریح و احتمالاً سودمندی از حجم زیادی از داده ها می باشد، که در گذشته ناشناخته و پنهان بوده اند. با انجام عملیات داده کاوی دانش جالب و گاه غیر منتظره، نظم ها و الگوهای پنهان، یا اطلاعات سطح بالا می توانند از مجموعه ای از داده های مرتبط موجود در پایگاه داده استخراج شوند. یافتن اقلام تکراری یک عمل بسیار مهم در داده کاوی محسوب می شود. با استفاده از اقلام تکراری قوانین همبستگی استخراج و بیان می شوند. یکی از بهترین الگوریتم های ارائه شده در این زمینه الگوریتم تک گذره به نام newmoment می باشد که مجموعه ایی از اقلام تکراری بسته را با روش پنجره ی کشویی حساس به تراکنش بدست می آورد. الگوریتم پیشنهادی ما به نام tmoment، نیز مجموعه ایی از اقلام تکراری بسته را با روش پنجره ی کشویی حساس به تراکنش بدست می آورد، با این تفاوت که الگوریتم قبل از روش بیتی استفاده می کند که در پایگاه داده های خلوت فضای زیادی را از دست می دهد، اما در روش پیشنهادی، خود تراکنش ها نگه داشته می شوند، که باعث کاهش فضای مصرفی و همچنین زمان اجرا می شود. در این پایانامه کارایی الگوریتم جدید به همراه چند الگوریتم دیگر از لحاظ حافظه مصرفی و زمان اجرا با انجام تعدادی آزمایش مورد بررسی قرار گرفته است. ارزیابی های صورت گرفته نشان دهنده برتری الگوریتم جدید از لحاظ زمان اجرا و حافظه مصرفی است.
سیده فاطمه زین العابدینی مهرگان مهدوی
گسترش فناوری اطلاعات واینترنت باعث پیدایش گزینه های متنوعی ازمحصولات وخدمات وافزایش فشار رقابتی بین صنایع مختلف می شود که یکی ازاین صنایع، صنعت بانکداری می باشد ازاینرو نظام بانکداری الکترونیکی نیازمند ساختاری جهت یکپارچه سازی ومدیریت دانش مرتبط با مشتریان و ساختاری که بواسطه آن بتوانند دانش نهفته در داده های مربوط به مشتریان را استخراج ، مدیریت و سپس به پشتیبانی از تصمیمات بازاریابی بپردازند می باشند، بنابراین بانکها باید بمنظور افزایش سهم خود در بازار رقابتی و بکارگیری بهینه منابع بانکی در ارائه خدمات متناسب با نیاز مشتریان به بخش بندی مشتریان و انتخاب گروه هایی از مشتریان ارزشمند برای کمک به اتخاذ استراتژی های بازاریابی هدفمند برآیند، با توجه به حجم زیاد داده های مشتریان، می توان از تکنیک های داده کاوی در کسب دانش نهان برای پشتیبانی از تصمیمات بازاریابی استفاده نمود. برای حل این مسئله مدل پیشنهادی پایان نامه با استفاده از تکنیک خوشه بندی به بخش بندی مشتریان و با تکنیک بازاریابی مدل تحلیل rfm به شناسایی و تحلیل رفتار مشتریان بانکداری الکترونیکی و تعیین میزان ارزش آن ها می پردازد و با استفاده از تکنیک دسته بندی در داده کاوی به پیش بینی رفتار آینده مشتریان در بانک پرداخته است. پیاده سازی روش پیشنهادی برمبنای متدولوژی ششگانه crisp-dm بعنوان یک مدل استاندارد در داده کاوی بوده وتکنیکهای مختلفی مورد آزمون قرارگرفت که در انتها نتایج حاصله با یکدیگر مقایسه گردید و بهترین مدل برای اجرا بر روی داده های مشتریان شعبات موسسه اعتباری توسعه در تهران انتخاب و پیاده سازی گردید.
مهسا بادامی ستار هاشمی
امروزه الگوریتم های خوشه بندی چند هدفه جهت کاربری های مختلفی به کار گرفته می شوند. این کاربردها در تمامی زمینه ها از فرآیندهای تصمیم گیری گرفته تا یادگیری ماشین و تشخیص الگو می باشد. خوشه بندی چند هدفه عناصر مشابه را بر اساس چندین معیار مختلف که می توانند متناقض هم باشند، به گروه های مختلفی تقسیم می کند. یکی از روش هایی که اخیرا جهت این نوع خوشه بندی مورد توجه قرار گرفته است، خوشه بندی بر اساس نظریه بازی ها می باشد. نظریه بازی ها علاوه بر توانایی در بهینه سازی معیارهای متناقض، توانایی منحصر به فردی در حل کردن مسائل به صورت توزیع شده دارد. اولین روش پیشنهادی در این پایان نامه روشی مبتنی بر الگوریتم k-means و نظریه بازی ها می باشد. در این الگوریتم که egtkmeans نام دارد، یک تابع پرداخت نوین ارائه گردیده است. علاوه بر این، الگوریتم پیشنهادی توانایی حل کردن بازی هایی با تعادل نش مختلط را نیز دارد. بدین ترتیب با اعمال کردن این الگوریتم خوشه هایی به مراتب بهتر با کارایی بالاتری خواهیم داشت. الگوریتم پیشنهادی دوم که egtmoc یک روش استنتاج جمعی بوده که در آن نظریه بازی ها بر اساس پارامترهای ارائه شده در الگوریتم egtkmeans می باشد. این روش با حذف k-means و تقسیم فضای مسئله به چندین قسمت مجزا کارایی بسیار خوبی را از خود نشان داده است. نکته ی مهم در نظریه ی بازی ها، افزایش پیچیدگی محاسباتی و زمانی با افزایش تعداد نمونه های پایگاه داده می باشد. جهت رفع این مشکل الگوریتم سومی پیشنهاد شده است که بر روی اندازه ی مجموعه ی استراتژی ها، اندازه ی ماتریس پرداخت و به همین ترتیب سایز مسئله تاثیر ویژه ای دارد. این الگوریتم که با روش انتخاب استراتژی خوانده می شود از بین استراتژی های هر بازیکن تعدادی را انتخاب می کند. این عمل به صورت یک خوشه بندی محلی در داخل هر خوشه در نظر گرفته می شود. بدین ترتیب به جای انتقال تنها یک نمونه در بین خوشه، مجموعه ای از نمونه ها جا به جا می شوند.الگوریتم های پیشنهادی بر روی مجموعه داده های واقعی و ساختگی آزمایش شده است و کارایی خوب آن توسط معیارهای مختلفی از جمله شاخص های انصاف، معیار های پیجیدگی محاسباتی و زمانی و در نهایت معیارهای خوشه بندی بررسی و تحلیل شده است.
علی اکبر نوریان اول ریوف خیامی
پروژه های سیستم های برنامه ریزی منابع سازمانی، بطور طبیعی جامع و در سطح سازمان فراگیر بوده و اثرات فراوانی بر سازمان دارند. ریسک پیاده سازی پروژه های پیچیده فناوری اطلاعات به این عظمت، در سازمان ها بالا می باشد. معماری سازمانی فناوری اطلاعات، رهیافتی برای هم راستایی فناوری اطلاعات، با استراتژی و فرآیندهای کسب وکار سازمان پیشنهاد می کند. به طور معقول، یک ارتباطی بین معماری سازمانی و موفقیت سیستم های سازمانی که بایستی درسازمان پیاده شوند، وجود دارد. به عنوان نمونه معماری سازمانی، فضاهایی از سازمان، که سیستم های برنامه ریزی منابع سازمانی اثر گذار هستند را مشخص می کند. در این پژوهش ارتباط، وابستگی و اثرگذاری معماری سازمانی برسیستم های برنامه ریزی منابع سازمانی جستجو، مشخص و توصیف خواهد شد. سوالاتی که در این جا مطرح است، که آیا انجام طرح معماری سازمانی، در انتخاب و پیاده سازی سیستم های برنامه ریزی منابع سازمانی موثر است؟ آیا معماری سازمانی به سازمان، درباره اجرای سیستم های برنامه ریزی منابع سازمانی دید می دهد؟ در این پژوهش سعی شده، که درباره پاسخ این سوال ها و دیگر اثرهای معماری سازمانی بر سیستم های برنامه ریزی منابع سازمانی، از لحاظ تئوری و همچنین عملی در یک نمونه کاربردی تحقیق شود.
عباس خسروانی ستار هاشمی
کاوش در جریان داده فرایندی است که منجر به استخراج دانش از جریانی سریع از داده های پیوسته می شود. در سالهای اخیر، به دلیل اهمیت کاربردهای آن و پیشرفت در تکنولوژی سخت افزاری بسیار مورد توجه قرار گرفته شده است. در بسیاری از زمینه های کاربردی مانند شبکه های کامپیوتری، بازارهای مالی و مبادلات ارزی، مکالمات تلفنی، کارت های اعتباری، مراکز داده و سرورها، تصاویر ویدئویی، شبکه حسگرها، رادارها، ماهواره ها و ...، حجم جریان های داده به قدری زیاد است که ذخیره آن تقریبا غیر ممکن است. بعلاوه، حتی اگر ذخیره داده ها ممکن باشد، نرخ داده های ورودی بقدری زیاد است که انجام عملیات بیش از یک بار بر روی هر داده امکان پذیر نمی باشد. از طرفی در بسیاری از موارد توزیع داده ها متأثر از عوامل بیرونی، پیوسته با زمان تغییر میکند. در نتیجه طراحی الگوریتم های برخط و کارا به منظور کاوش در ساختار متغیر جریان های داده ضرورت می یابد. روش های غیر خطی بر پایه آنالیز مولفه های اصلی کرنلی (kpca) در داده کاوی به منظور استخراج ساختار های غیر خطی از داده ها بسیار مورد استفاده قرار گرفته شده و کارایی بالایی نسبت به روش های خطی از خود نشان داده اند. اما پیاده سازی این روش ها که بر پایه تجزیه مقدار تکین کرنلی (ksvd) دسته ای ماتریس داده ها است، مناسب کاربرد هایی که نیازمند پردازش برخط می باشند، نمی باشد. در این پایان نامه ما sksvd را که یک الگوریتم جدید به روز رسانی ksvd می باشد را به منظور یافتن کارای الگوهای غیر خطی از داده های جریانی ارائه کرده ایم. الگوریتم ارائه شده به کمک ایده توابع کرنل ، یک انتقال متعامد خطی را از داده های اخیر در فضایی با ابعاد بسیار بالاتر ( شاید بی نهایت) که به آن فضای ویژگی یا فضای کرنل می گویند، یاد می گیرد و هرگاه داده ی جدیدی تولید شود این الگوریتم آن را به صورت غیر خطی به آن فضا نگاشت کرده و بعد از استخراج الگوهای آن، انتقال متعامد را به صورت افزایشی و با کمترین میزان مصرف منابع به روز می کند. از آنجا که فضای اولیه و فضای ویژگی به صورت غیر خطی به هم وابسته هستند، الگوهای بدست آمده غیر خطی خواهند بود. الگوهای بدست آمده را سپس می توان به منظور کشف تغییر در مفهوم و توزیع داده ها و یا شناسایی ناهنجاری مورد استفاده قرار داد. نتایج حاصل از آزمایش هایی گوناگون بر روی داده های واقعی و ساختگی تاثیر گذاری و کارایی روش ما را نشان میدهد.
مهرنوش ترابی ستار هاشمی
امروزه با رشد سریع فناری اطلاعات در بخش های مختلف کسب و کار و صنعت، نیاز به اطلاعات دقیق که در زمان مناسب و با کمترین هزینه به دست آمده باشند، نقش مهمی را در جهت موفقیت سازمان ایفا می کند. با توجه به وجود داده های زیاد در بانک های اطلاعاتی سازمانها، برای بازیابی و فراهم نمودن اطلاعات مناسب، فرایند کشف دانش از پایگاه داده های سازمانی مطرح است که یک فرآیند علمی برای شناسایی الگوهای معتبر، نوین و قابل فهم از داده ها می باشد. مهم ترین بخش این فرآیند، داده کاوی می باشد که با استفاده از الگوریتم های مشخص، الگوهایی را از پایگاه داده استخراج می نماید. این الگوهای کشف شده در توصیف وضعیت کنونی یا پیش بینی وضعیت آینده، استفاده می شوند. داده کاوی یکی از دستاوردهای فناوری اطلاعات و ارتباطات برای بهبود تحلیلها و تصمیمات سازمانی و استراتژی های مدیریتی می باشد. صنعت برق هر کشور نقش به سزایی در زیرساختهای آن کشور ایفا می کند. تامین تقاضای انرژی الکتریکی و ارائه آن به مصرف کننده با قابلیت اطمینان بالا، تغییرات ساختاری عمده را در صنعت برق می طلبد. یکی از این تغییرات، حرکت به سوی بازار رقابتی برق می باشد. پیش بینی دقیق بار، یک الزام کلیدی برای طراحی و عملیات اقتصادی و امنیتی سیستمهای جدید قدرت می باشد. این تحقیق رویکردی را برای پیش بینی ساعتی سه روز آینده مصرف انرژی الکتریکی نشان می دهد. رویکرد مورد نظر از چندین ویژگی مهم برای پیش بینی استفاده می کند: انرژی الکتریکی مصرف شده ساعتی، انرژی الکتریکی مصرف نشده که در اثر خاموشی ایجاد می شود و داده های هواشناسی. پس از اینکه پیش پردازش و اصلاح انجام شد، الگوهای مصرف شناسایی خواهد شد. برای پیش بینی انرژی الکتریکی از روش های svm، شبکه عصبی و ترکیبی از روشهای شبکه عصبی و svm که مبتنی بر خوشه بندی است، استفاده می شود. نتایج نشان می دهد که مدل نهایی بدست آمده، دقت بیشتری نسبت به رویکردهای موجود در صنعت برق دارد.
حمیدرضا الواری علی حمزه
امروزه شبکه های اجتماعی نظیر فیسبوک از محبوبیت زیادی برخوردار شده اند، چرا که به مردم سرتاسر جهان این اجازه را می دهند که بدون تماس فیزیکی، با دوستان خود ارتباط برقرار کرده، برای آن ها پیغام گذاشته و نظرات خود را در مورد موضوعات گوناگون بیان کنند. شناسایی تشکل ها در شبکه های اجتماعی بسیار مورد توجه قرار گرفته است اما به مبحث همپوشانی اگرچه در اغلب شبکه های اجتماعی دیده می شود کمتر پرداخته شده است. مفهموم تشکل، یک مفهوم اجتماعی است. مردم اغلب سعی در ایجاد گروه هایی در خانواده، دوستان و محیط کار دارند. تشکل های شبکه های اجتماعی می تواند دایره های دوستی یا گروه هایی از مردمی باشد که علائق مشترکی دارند. به علاوه، بسیاری از سیستم های پیچیده ی دیگر نظیر شبکه های زیستی و علوم کامپیوتر نیز دارای تشکل هستند. این ویژگی شبکه ها، به علت کاربرد زیاد، توجه محققان زیادی را از رشته های مختلف به خود معطوف کرده است. در این مطالعه، بر اساس وجود انگیزه در انسان ها برای برقراری ارتباط و دوستی با یکدیگر، مسئله ی تشخیص تشکل های شبکه های اجتماعی را به عنوان یک رویکرد مبتنی بر تئوری بازی ها در یک محیط چند عامله در نظر گرفته ایم که در آن هر رأس از گراف شبکه عاملی است که سعی در بیشینه کردن تابع سودمندی خود از طریق ایجاد دوستی با عامل های مشابه خود در دو مرحله دارد: اولا به عامل های مشابه خود درخواست دوستی می دهد و ثانیا از سیستم، پیشنهادهای دوستی دریافت می کند. در اینجا، شباهت های بین عامل ها از طریق رابطه ی پیرسون و رابطه ی همسایگی محاسبه می شود. هر چه عامل ها به هم شبیه تر باشند، تابع سودمندی آن ها بیشتر خواهد بود. ساختار نهایی شبکه زمانی معلوم می شود که بازی مورد نظر به تعادل نش برسد که در آن هیچ عاملی سعی در تغییر استراتژی خود ندارد. اثبات وجود تعادل نش آورده شده که نشان می دهد روش موجود همواره به جواب نهایی می رسد. نتایج حکایت از برتری روش پیشنهادی در مقایسه با سایر روش های مطرح موجود دارد.
علیرضا حاجی باقری علی حمزه
بسیاری از سیستم های پیچیده طبیعی و اجتماعی را می توان در قالب یک شبکه یا گراف نشان داد، مجموعه ای از رأس ها و یال هایی که این رأس ها را به هم متصل می کنند. به عنوان نمونه هایی از شبکه ها، می توان به شبکه های اجتماعی، شبکه های فنی (مانند اینترنت) و شبکه های زیستی (مانند شبکه های عصبی) اشاره کرد. رأس ها در این شبکه ها، موجودیت ها و یال ها، ارتباط بین آن ها را نشان می دهند. مثلاً در شبکه اجتماعی، مردم را با رأس ها، و ارتباط های داده ای بین کامپیوترها و یا روابط دوستی بین مردم را با یال ها نمایش می دهیم. شبکه ها دارای ویژگی های آماری مشترکی هستند. یکی از این ویژگی ها، ویژگی پدیده دنیای کوچک بوده که به 6 درجه جدایی نیز معروف است و بیان می کند که در یک شبکه، فاصله متوسط بین رأس ها، کوتاه و معمولا تابعی لگاریتمی از تعداد آن هاست. ویژگی بعدی، ویژگی خوشه بندی یا انتقال پذیری شبکه است و بیان می کند که دو رأس مجاور با رأس سوم، با احتمال زیادی با یکدیگر مجاور بوده و با ضریب خوشه بندی مقداردهی می شود. جدا از ویژگی های آماری مشترک میان شبکه های اجتماعی ، ویژگی دیگری را نیز می توان در نظر گرفت که به تازگی کانون توجهات را به خود جلب کرده و از آن به عنوان راه حلی برای بسیاری از مشکلات موجود در شبکه های اجتماعی استفاده می شود. این ویژگی فرآیند انتشار در شبکه های اجتماعی نام دارد. انتشار اطلاعات را می توان به عنوان یکی از نمونه های فرآیند انتشار نام برد. انتشار اطلاعات یک تعریف عمومی است که شامل هر چیزی که در یک شبکه گسترش می یابد می شود. بیشینه کردن گسترش اعتبار مانند یک ایده ی برتر و یا حتی تشخیص سریع یک فاجعه مانند دزدی. همه ی اینها نمونه هایی از انتشار اطلاعات هستند. در نهایت از فرایند انتشاری که در شبکه های اجتماعی رخ می دهد، از جمله انتشار اطلاعات، جهت ارائه ی مدلی برای دسته ای از پدیده ها در این شبکه ها استفاده می شود. پدیده هایی مانند گسترش ویروس ها و بد افزارها در کامپیوتر ها، گسترش اطلاعات مربوط به کالاها در میان مردم و غیره. ارائه این مدل های آماری می تواند راهنمایی باشد جهت بررسی بیشتر ساختار شبکه های اجتماعی ، نحوه گسترش و انتشار اطلاعات در آنها و همچنین تشخیص تاثیرگذارترین رئوس در این شبکه ها ؛ مبحثی که به تازگی مورد توجه بسیاری از محققین قرار گرفته است.
مهدیه رزم پور ستار هاشمی
استفاده از تکنولوژیهای جدید، امروزه از الزامات رشد و ترقی و مدیریت مطلوب هر کسب و کاری بشمار میآید. در حمل و نقل دریایی کالا نیز به دلیل اهمیت این کسب و کار و لزوم رقابتپذیری بنادر با یکدیگر، کاربرد فناوری و تکنولوژیهای جدید در مدیریت موثرتر و اتخاذ تصمیمات بهتر میتواند بسیار مفید باشد. در این پایاننامه ابتدا به معرفی دادهکاوی، تکنیکهای آن و متدولوژی مورد استفاده جهت دادهکاوی خواهیم پرداخت و سپس با طی کامل مراحل فرایند استاندارد دادهکاوی (crisp-dm) و با در دسترس داشتن دادههای واردات خودرو سواری در فاصله سالهای 1386 تا 1390 در بندر شهید رجایی به پیشبینی میزان واردات خودرو سواری در سالهای آتی با استفاده از الگوریتمهای مختلف شبکههای عصبی پرسپترون چند لایه، هموارسازی نمایی و arima پرداخته و با مقایسه پارامترهای خروجی (r2 ، mape و rmse) در هر مدل ، بهترین مدل جهت پیشبینی واردات این کالا را معرفی میکنیم. نتایج نشان میدهد که شبکههای عصبی مصنوعی عملکرد بهتری نسبت به مدلهای سریهای زمانی نظیر هموارسازی نمایی و arima دارند و الگوریتم لونبرگ مارکوات بهترین پیشبینی را در این خصوص ارائه میدهد.
سیما قاسمپور فریبرز سبحان منش
اصلی ترین مدلی که تاکنون در بازشناخت گفتار مورد استفاده قرار گرفته، مدل نهان مارکف است که از دقت خوبی برخوردار است اما حساسیت بالایی نسبت به نویز دارد. بر این اساس اخیرا از مدل شبکه های پویای بیز که گسترش یافته مدل نهان مارکف است, استفاده گردیده است. این مدل نه تنها در زمینه پایداری در برابر نویز که مد نظر ماست استفاده شده, بلکه در هر زمینه ای که اطلاعاتی چندگانه لازم به استفاده بوده است, به عنوان مدلی کارآمد به کارگرفته شده است. در این پژوهش چندین ساختار شبکه های پویای بیز به منظور بررسی نقش متغیرهای گوناگون در آن مطالعه شده اند و سپس دو ساختار جدید به منظور پایداری در برابر نویز معرفی شده اند. همچنین مطالعه ای بر روی ابزار bnt که شبکه مورد نظر تحت آن به کار بسته شده, انجام گرفته است. کارایی این ساختارها با دادگان m2vts بررسی شده و از نویزهای محیط های واقعی در چندین سطح سیگنال به نویز برای آزمودن پایداری استفاده شده است. نتایج آزمایش ها, بهبود پایداری ساختارهای ارائه شده را در مقایسه با مدل های استفاده شده پایه، در باز شناسی کلمه روی دادگان اشاره شده نشان می دهد.
لیدا رشیدی علی حمزه
مسئله شناسایی الگوهای نامتعارف، به خصوص به صورت بدون سرپرست، یکی از چالش های حایز اهمیت در فعالیت های انسانی است که محدوده وسیعی از کاربرد ها همچون نظارت بر ترافیک شبکه تا تحیل های بیومتریکال را شامل می شود. چالش عمده ای که به صورت ارثی در چنین زمینه ای حضور دارد، عدم وجود نمونه از کلاس نامتعارف می باشد. بر اساس چنین محدودیتی بسیاری از روش های واقع بینانه شناسایی نمونه های نامتعارف فرض می کنند تنها داده های آموزشی نرمال در اختیار دارند. علاوه بر این در بسیاری از مسائل ما به دنبال یافتن نمونه های نامتعارف معنادار می باشیم. نمونه هایی که بتوان عدم تبعیت رفتار آن ها را از یک رفتار نرمال توسط تعداد قابل قبولی نمونه توجیه کرد. با توجه به نکات ذکر شده، رهیافت های پیشنهادی ما در مطالعات انجام شده، شامل چهار مزیت نسبت به روندهای مشابه خود می باشند. اولین مزیت بهره جویی از دو معیار هوشمندانه جمله تنظیم و تغییر نسبت غیر معین برای شناسایی ناهنجاری های معنادار می باشد. دومین برتری روند های پیشنهادی، ارائه چهارچوبی برای حل مسئله با در نظر گرفتن شرایط واقع گرایانه می باشد. در این رهیافت ها، داده های آموزشی نرمال فرض شده اند و مسئله برای مجموعه داده هایی که دارای صفات عددی و غیر عددی هستند، تعریف شده است. مزیت دیگر این روش ها، استفاده از شبکه بیزین برای تعیین کوچکترین مجموعه قوانین و امتیاز دهی به نمونه های تست است. آخرین برتری مربوط به یک ساختار درختی به نام ad tree است که به منظور ذخیره و بازیابی موثر اطلاعات، در رهیافت های پیشنهادی استفاده شده است. نتایج تجربی به دست آمده بر روی چندین مجموعه داده نمایانگر برتری الگوریتم های پیشنهادی نسبت به سایر روش های پایه ای است که در گذشته پیشنهاد شده است.
شروان فکری ارشاد فرشاد تاجری پور
تاکنون روش های متنوعی برای تشخیص عیوب بر پایه آنالیز بافت تصویر ارائه شده است. یکی از روش هایی که علاوه بر محاسبات کم، ویژگی های مناسبی را برای آنالیز بافت تصویر ارائه می دهد، الگوی دودویی محلی دو بعدی است. با توجه به مفهوم عیوب سطحی، می توان تخلخل در سنگ را در زمره عیوب سطحی سنگ بر شمرد. بنابراین در این مقاله برای نخستین بار روشی برای آشکارسازی و تخمین میزان تخلخل در سنگ های ساختمانی، بر پایه الگوی دودویی محلی یک بعدی ارائه شده است. روش ارائه شده مشتمل بر دو مرحله است. در مرحله آموزش، ابتدا بردار ویژگی مبنا از طریق اعمال عملگر الگوی دودویی محلی یک بعدی بر روی کل تصویر فاقد تخلخل محاسبه می شود. سپس تصویر سالم پنجره بندی شده و برای هر پنجره بردار ویژگی استخراج می گردد. در ادامه با مقایسه میزان عدم شباهت بردارها با بردار مبنا، حد آستانه مناسبی برای سالم بودن پنجره ها بدست می آید. سپس در مرحله آشکارسازی، تصویر ورودی پنجره بندی شده و به کمک حد آستانه سالم بودن، پنجره های حاوی تخلخل تشخیص داده می شوند. در نهایت نیز میزان تخلخل در الگوی عیب تولیدی، بر حسب درصد محاسبه می شود. همچنین جهت افزایش دقت تشخیص ، یک مرحله پیش پردازش جهت نرمال سازی تصاویر بر پایه تکنیک روپوش شبکیه تک میزانی ارائه شده است. دقت تشخیص بالا، پیچیدگی محاسباتی کم، توانایی بر خط بودن و حساسیت کم به نویز از جمله مزایای روش ارائه شده به شمار می روند. شایان ذکر است که روش ارائه شده، جنبه عمومی داشته و برای اکثر کاربردهای تشخیص عیوب و طبقه بندی دو کلاسه قابل استفاده است
محمد مهدی نعمت الهی ستار هاشمی
در روزگاری که محیط مجازی روز به روز گسترده تر و وسیع تر می شود تا جایی که کنترل و پردازش اطلاعات دریافتی تقریبا امری ناممکن شده است، نیاز به وجود سامانه ای که بتواند بر این مشکل غلبه کند، بیش از هر زمان دیگری حس می شود. سیستم هایی که بتوانند از میان خیل عظیمی از اطلاعات و محصولات گوناگون، مناسب ترین و مورد پسند ترین ها را بنا به شرایط و ویژگی های خاص هر کاربر به وی پیشنهاد دهند، طرفداران بسیاری یافته اند. حال اگر در این فرآیند از نظرات کسانی استفاده شود که ما از سلیقه آن ها آگاهیم، پیشنهادهای بسیار منطقی و دقیق تری به دست خواهد آمد. سیستم هایی که چنین وظیفه ای بر عهده دارند، "سیستم های پیشنهادی" نامیده می شوند. سیستم های پیشنهاد دهنده بر اساس تخمین امتیاز و چگونگی پیشنهادات به روشهایی تقسیم بندی می شوند که در این بین روش فیلتر همبستگی که عموماً با توجه با سابقه کاربران عمل می کند با استقبال بیشتری روبرو شده است. سیستم های مبتنی بر فیلتر همبستگی بعنوان موفق ترین سیستم های پیشنهاد دهنده شناخته می شوند. در این پایان نامه بر آنیم تا با دخیل کردن مفهوم زمان در فیلتر همبستگی و پیدا کردن الگوهای زمانی مشخص، نتایج این روش را بهبود بخشیم.
سعیده عباسی بهروز مینایی
داده «طب کار» یا سلامت کارکنان، از انبوه داده هایی است که در سازمان ها، به فراموشی سپرده می شوند. در این تحقیق به مطالعه این داده با توجه به مشخصه وقوع حوادث کاری پرداخته شده است. این داده مربوط به سالهای 1385 تا 1389، متعلق به یکی از بزرگترین خودروسازان کشور است و شامل مشخصات عمومی کارکنان و برخی از فاکتورهای عمومی سلامت آنها می شود، مشخصاتی از قبیل سن، سابقه کار و سابقه بیماری های مزمن. در این مطالعه، برخی از این مشخصات با توجه به ارتباط آنها با وقوع حوادث کاری، با روش درخت تصمیم رگرسیونی از نوع هرس شده، برگزیده شده اند. در گام بعدی به خوشه بندی داده ها به شیوه خوشه بندی c-means پرداخته شده و در کنار آن خوشه بندی به شیوه k-means نیز، به منظور مقایسه با روش c-means انجام شده است. در مطالعه انجام شده در خصوص پیشینه تحقیق، مشابه این اقدام در خصوص داده سلامت کارکنان، مشاهده نشد. همچنین تعداد خوشه های بهینه نیز با تکیه بر ویژگی های تقویت کننده خوشه بندی به شیوه ای خاص تعیین شدند. در نهایت خوشه بندی نهایی گویا مشخصاتی است که با توجه به آن ها امکان وقوع حادثه برای آن دسته از افراد کمتر خواهد بود.
رضا آموزگاران ستار هاشمی
بطور معمول، یک شبکه حسگر بیسیم برای مانیتورینگ خط لوله آب، نفت، و گاز بکار می رود. هنگامی که یک گره حسگر شرایطی مانند فشار، دما، و نشتی در نقطه ای از خطوط لوله را اندازه گیری کند، باید این داده را به صورت تعدادی بسته به ایستگاه مرکزی بفرستد. بسته هایی که از گره ها به یک ایستگاه فرستاده می شوند، می توانند در بین راه درنتیجه خرابی های خط لوله و یا رخدادهای طبیعی از بین بروند. رساندن درست این بسته ها از مکان اندازه گیری به ایستگاه در یک سیستم مانیتورینگ خط لوله بسیار مهم است. ما در این پژوهش یک پروتکل برای گردآوری داده در شبکه حسگر خط لوله به نام psnc پیشنهاد می دهیم. این پروتکل تلاش می کند که با افزایش redundancy در شبکه، قابلیت اطمینان (احتمال گم نشدن بسته ها) را افزایش دهد. برای افزایش redundancy چند کپی از بسته را از مسیرهای گوناگون به سمت ایستگاه می-فرستیم. کپی گرفتن از بسته را به کمک تکنیک network coding انجام می دهیم که توانایی کاهش تعداد کپی های موردنیاز را دارد. پروتکل psnc تلاش می کند که سربار ترافیک و انرژی مصرفی در شبکه بیش از اندازه بالا نرود. نتیجه شبیه-سازی های ما در یک شبکه که درصدی از خطای بیتی در آن وجود دارد، نشان می دهد که پروتکل psnc در مقایسه با حالتی که این پروتکل در شبکه بکار نرود، قابلیت اطمینان را بخوبی افزایش می دهد درحالیکه انرژی مصرفی آن پذیرفتنی است. برای آنکه پروتکل پیشنهادی در برابر دستکاری بسته ها نیز پایدارتر شود، با تغییر کوچکی در پروتکل psnc، یک پروتکل به نام spsnc طراحی می کنیم. روتکل spsnc روند کدگذاری بسته ها را به عنوان رمز کردن آنها بکار می برد. سربار ترافیک و انرژی مصرفی پروتکل spsnc همانند پروتکل psnc است.
سید مهدی حضرتی فرد ستار هاشمی
انتخاب یک زیر مجموعه ی مناسب از ویژگیهای داده ها که به منظوری خاص مانند طبقه بندی صورت پذیرد، یک امر بسیار مهم در تمامی مسائل می باشد. در این پایان نامه روشی عملی برای انتخاب ویژگی پیشنهاد شده که روی انواع داده ها به جوابهای مناسبی می رسد. بدین منظور محیط مسأله به صورت یک بازی تک نفره معرفی شده است و با استفاده از روش های مونت کارلو و تفاوت زمانی که از روشهای بسیار کارای الگوریتم یادگیری تقویتی می باشد، پیمایش محیط را پیش می برد و در نهایت زیرمجموعه هایی بهینه یا نیمه بهینه از ویژگیها انتخاب می کند. در این راه ابتدا محیط را به صورت تصادفی می پیماید و از محیط یاد می گیرد و در تکرارهای بعدی بهترین نواحی را برای پیمایش انتخاب می کند.
مینا سهرابی ستار هاشمی
امنیت کامپیوترها و شبکه ها یک مسئله حیاتی در دنیای امروزی ما می باشد. یک روش برای حفاظت اطلاعات ذخیره شده در سیستم های پایگاه داده ای استفاده از سیستم تشخیص نفوذ می باشد. اخیراً محققان روی تکنیک های داده کاوی ای کار می کنند که تراکنش های بدخواه در سیستم های پایگاه داده ای را کشف می کنند. روش آن ها روی استنتاج وابستگی های داده بین اجزاء داده در پایگاه داده متمرکز است، اما الگوریتم هایی که این روش ها استفاده می کنند، چند محدودیت دارد. برای نمونه تنظیمات لازم برای کمینه پشتیبانی و سایر شرایط وابسته را به طور تجربی بدست می آورند که لزوماً منجر به وابستگی های داده قوی نمی شود. هم چنین استفاده از پشتیبانی کمینه به عنوان یک شرط اولیه برای کشف قوانین می تواند محدودکننده باشد چون معمولاً نمی توان یک آستانه پیشتیبانی کمینه را پیشگویی کرد که به تعداد قابل مدیریتی از قوانین منجر شود. محدودیت دیگر استفاده از پشتیبانی کمینه این است که معمولاً پشتیبانی بیانگر ارزش واقعی قانون ها نمی باشد. در این پایان نامه یک الگوریتم داده کاوی نوین به نام استنتاج بهینه قوانین وابستگی بین دسترسی ها به داده برای طراحی استنتاجگر وابستگی داده سیستم تشخیص نفوذ ارائه کرده ایم. الگوریتم ارائه شده بسیاری از محدودیت های الگوریتم های قبلی را از بین می برد. در نتیجه، روش پیشنهادی ما قادر به دنبال کردن بهتر تراکنش های نرمال و تشخیص کاراتر تراکنش های بدخواه نسبت به روش های موجود می باشد.
حجت الله عبدی دهکردی محمد هادی صدرالدینی
امروزه مساله ی کاوش الگوهای تکراری بر روی جریان های داده ای از اهمیت ویژه ای برخوردار است. منظور از یک الگوی تکراری، الگویی است که در تعداد قابل توجهی از تراکنش ها دیده می شود. با توجه به خواص این مدل داده ها یعنی تولید به صورت نامحدود و با سرعتی بالا نمی توان این داده ها را در حافظه ذخیره نمود و به همین خاطر نیاز به تکنیک هایی است که بتوانند آنها را به صورت برخط پردازش نموده و الگوهای تکراری را بیابند. یکی از محبوب-ترین تکنیک ها در این زمینه استفاده از پنجره های کشویی می باشد. از فواید استفاده از این پنجره ها، کاهش میزان حافظه مصرفی و افزایش سرعت کاوش می باشد. ما در این پایان نامه با ارائه ی یک نمایش عمودی جدید، الگوریتمی بر پایه ی پین ها برای یافتن الگوهای پرتکرار در جریان های داده ای ارائه نموده ایم. الگوریتم ارائه شده به لحاظ حافظه ی مصرفی و زمان پردازش نسبت به دیگر الگوریتم های مشابه از کارایی بالاتری برخوردار می باشد.
رضا اوجی فرشاد تاجری پور
تشخیص و باز شناسی اشیاء و اشکال نقشی اساسی در پردازش تصویر دارند. تا کنون روش های گوناگونی برای این منظور ارائه گردیده است. ویژگی های نامتغیر مقیاسی یکی از پرکاربردترین تکنیک ها در حوزه پردازش تصویر می باشد که می تواند در بسیاری از اهداف این حوزه از جمله تشخیص شیء و شکل مربوط به آن ها مورد استفاده قرار گیرد. در این پایان نامه، روشی جدید برای تشخیص اشیاء و اشکال ارائه گردیده است. این روش، الگوریتمی بهبود یافته از ویژگی های نامتغیر مقیاسی و ترکیب آن ها با الگوریتم قطعه بندی تصاویر بر اساس مرز و نواحی اشکال در تصویر می باشد. روش ارئه شده بر پایه سه مرحله اصلی می باشد. در مرحله اول، تصاویری از مجموعه داده مورد نظر به گونه ای آموزش داده می شوند که ویژگی های نامتغیر مقیاسی آن ها تحت عنوان نقاط کلیدی، از تصاویر استخراج شوند. این ویژگی ها نسبت به تغییرات مقیاس، چرخش، جایجایی، روشنایی و نقطه نظر دوربین نامتغیر می باشند. با یافتن این ویژگی ها، نقاط کلیدی اشیا در تصاویر مختلف قابل شناسایی خواهند بود. در مرحله دوم با اعمال ویژگی های به دست آمده از مرحله قبل در الگوریتم قطعه بندی تصویر ، مرز مربوط به شیء استخراج می گردد. این هدف با استفاده از نقاط کلیدی و ادغام نواحی موجود در تصویر به دست می آید. در پایان این مرحله، مرز شیء که به صورت یک منحنی و نشان دهنده شکل آن می باشد، به دست آمده است. در مرحله آخر شکل اشیاء مورد نظر با شکستن منحنی مرز اشکال به زیر منحنی های کوچکتر به صورت درختی و تحت عنوان درخت شکل ذخیره می گردند. به وسیله درخت شکل به دست آمده از اشکال مختلف و بر پایه معیار شباهت بین آن ها می توان به راحتی اشکال مشابه را در تصاویر مختلف را تشخیص داد. نتایج به دست آمده نشان دهنده قدرت بالای الگوریتم به منظور تشخیص اشیاء و شکل آن ها می باشد. بخش عمده ای از این کارآیی مدیون نقاط کلیدی بسیار قوی به دست آمده از تصاویر است که نسبت به پارامترهای مختلف نامتغیر می باشند.
جواد دوگانی آغچغلو محمدهادی صدرالدینی
کشف قوانین وابستگی (association rule) یکی از پرکاربردترین الگوهاییاست که توسط داده کاوی استخراج می گردند و به معنای یافتن همه قوانین موجود در مشاهده اقلام مجمو عه های داده ای است.مهمترین فاز یافتن قوانین وابستگی، یافتن الگوهای پرتکرار می باشد. کشف قوانین وابستگی در جریان سریع داده ها با مشکلاتی روبروست. با توجه به ماهیت جریان داده ای، امکان ذخیره سازی داده های ورودی و مرور دوباره آنها وجود نداشته و می بایست به جای جواب های دقیق به دنبال جواب های نسبی باشیم که تا حد امکان به جواب های دقیق نزدیک باشند. به دلیل این محدودیت ها، به جای یافتن همه الگوهای پرتکرار به دنبال زیرمجموعه ای از آنها هستیم که در عین حال جزء جذاب ترین آنها نیز باشند.در این رساله نوع خاصی از الگوهای پرتکرار به نام الگوهای پرتکرار را معرفی نموده و الگوریتم جدیدی مبتنی بر پنجره کشویی برای کاوش آن معرفی می نماییم. این بخش جذاب ترین الگوها را از میان کلیه الگوهای پرتکرار انتخاب می نماید. برای رسیدن به این منطور از ساختمان داده ای پویا برای نگهداری نتایج ارزیابی در هر لحظه استفاده می گردد. از آنجایی که داده هایی که اخیرا مشاهده گردیده اند دارای اولویت بیشتری نسبت به داده های قدیمی می باشند از پنجره کشویی برای نگهداری این داده ها استفاده می گردد. جریان داده ورودی به پنجره هایی تقسیم می گردد. در واقع واحد عملیات به روز رسانی، پنجره می باشد. در این راستا از داده های مکمل داده ورودی برای رسیدن به هدف استفاده می گردد. استفاده از داده های مکمل پیپیدگی محاسباتی را کاهش خواهد داد. در نهایت روش پیشنهاد شده با استفاده از یک سری مجموعه های داده ای استاندارد مورد ارزیابی قرار گرفته و با سایر الگوریتم های ارائه شده در این زمینه مورد مقایسه قرار گرفته است. نتایج، بیانگر کیفیت روش معرفی شده در مقایسه با سایر روش ها از لحاظ زمان اجرا و همچنین کیفیت جواب های تولیدی می باشد.
حسین قنادرضایی علیرضا کشاورز حداد
در روش سنتی تخصیص ثابت طیف، طیف رادیوئی به باندهای جداگانه ایی با عرض ثابت که بوسیله ی محدوده فرکانسی شان شناخته می شوند تقسیم میشود. یک باند به کاربری که مجوز استفاده اختصاصی از آن را داشت تخصیص می یافت، شروط کیفی می توانستند تضمین شوند زیرا که از تداخل سیستمهای ناهمگن جلوگیری می شد ولی استفاده ی پراکنده کاربران دارای مجوز در حوزه ی زمانی و جغرافیایی از این منابع بهره وری کم را با وجود در اختیار بودن آن در پی داشت. از طرفی اینگونه تخصیص ها عرصه را برای حضور تکنولوژی های بیسیم که به سرعت در حال گسترش بودند تنگ میکرد. برای رسیدن به استفاده ی موثر از طیف باید تخصیص ها از حالت ثابت به پویا تغییر یابند. در این پایان نامه ابتدا به معرفی شبکه ی رادیو شناختی وچگونگی همزیستی آن با شبکه های دارای مجوز استفاده از طیف می پردازیم. انواع روش های دسترسی به طیف و مدیریت مرکزی و توزیع یافته در آنها معرفی می شود و سپس انواع پروتکل های کنترل دسترسی چندگانه، راهکار های جلوگیری از تداخل و مشکلات ترمینال های مخفی بیان می شود. به وابستگی پهنای باند و بازه ی زمانی در دسترس بودن کانال نیز اشاره میشود. با شبیه سازی یک شبکه ی رادیو شناختی اقتضایی در حضور کاربران دارای مجوز استفاده از طیف، چند الگوریتم تخصیص طیف بیان شده و به مسائلی مثل برون دهی شبکه ی رادیو شناختی، پوشش کاربران ثانویه، تخصیص منصفانه طیف در میان کاربران رادیو شناختی و رسیدن به حداقل کیفیت سرویس با مدل کردن برهمکنش های میان کاربران و تصمیم گیری توزیع یافته آنها برای بیشینه کردن تابع سود سیستم تحت شرایط تداخل در چارچوب نظریه بازی ها می پردازیم. در آخر با معرفی یک الگوریتم تخصیص منصفانه با در نظر گرفتن حداکثر کردن تعداد کاربرانی که به حداقل کیفیت سرویس دست پیدا میکنند کارائی آن را در مقایسه با دیگر الگوریتم ها در ساختار های مختلف شبکه ارزیابی میکنیم.
امیر هراتی علمداری امید بوشهریان
آنچه که تا کنون در فضای وب جریان داشته است افزایش روزافزون حجم اطلاعات و مستندات موجود در آن بوده است، بدون اینکه این افزایش حجم مستندات تاثیری در کاربرد و بهره برداری خودکار اطلاعات موجود به همراه داشته باشد. به علاوه امروزه اکثریت محتوای وب بر روی پایگاه داده های رابطه ای ذخیره شده اند. حرکتی که گام های اولیه آن درحال شکل گیری است تغییر شکل «وب» به موجودیتی تحت عنوان «وب معنایی» میباشد. وب معنایی یک گسترش از وب موجود است که گاهی اوقات تحت عنوان «وب آینده» و یا «وب نسخه 3» معرفی می شود، که در آن به اطلاعات، معانی خوش تعریفی داده می شود که بتوانند قابلیت همکاری بهتر بین کامپیوتر ها و انسان را فراهم کنند. موفقیت وب معنایی بر تولید انبوه داده های معنایی وابسته است. با توجه به حجم عظیم داده های رابطه ای ذخیره شده در پایگاه داده های رابطه ای موجود در وب، انتشار این داده های رابطه ای بر روی وب معنایی بسیار پر کاربرد خواهد بود. در این پایان نامه، الگویی جهت پیاده سازی جستجوی معنایی بر روی داده های ذخیره شده در پایگاه داده های رابطه ای، با استفاده از تکنیک های وب معنایی ارائه شده است. گام های اصلی الگوی پیشنهادی در این پایان نامه از این قرارند: 1-بازنمایی داده های سازمانی ذخیره شده بر روی پایگاه داده های رابطه ای بر اساس گراف های معنایی با استاندارد rdf به صورت یک پایگاه دانش معنایی(نگاشت داده های رابطه ای به گراف های معنایی) 2-آنالیز وابستگی های داده ای برنامه و بازنمایی اجزای برنامه و ارائه یک آنتولوژی سازمانی بر اساس آنها 3-پیاده سازی یک موتور جستجوگر معنایی که بر پایه آنتولوژی سازمانی تهیه شده و پایگاه دانش نگاشت شده، که به جستجوی معنایی بر روی اطلاعات دامنه مورد نظر می پردازد.
مهدی رفیعی مهران یزدی
انرژی یکی از احتیاجات ضروری بشر است که. تمام جنبه های فعالیت های اقتصادی و اجتماعی را در دهه های اخیر تحت تاثیرخود قرار داده است تقاضا برای انرژی رشد فزاینده ای داشته ? این درحالی است که منابع انرژی های سنتی رو به کاهش است . سه بخش اصلی و مهم مصرف انرژی عبارتند از شبکه های تولید و توزیع انرژی ، ساختمانها (گرمایش ،سرمایش و روشنایی) وحمل و نقل . ولی تمرکز تحقیق انجام شده بر ساختمان های تجاری بوده و در پژوهش حاضر با انجام مطالعات کتابخانه ای و تحقیقات میدانی ابتدا مبانی مدل های موجود در رابطه با انرژی بررسی گردیده و نقش آنها در بهینه سازی مصرف تشریح شده است . .در ادامه از طریق پرسشنامه و بکار گیری روش دلفی به شناسایی مهم ترین فاکتورها و مولفه های تاثیر گذار بر مصرف انرژی در ساخنمان های تجاری پرداخته شده و مهمترین فاکتور ها در یک جدول گرد آوری شده است . در پایان با استفاده از روش مفهومی مدل سازی ساختاری تفسیری - که بر مبنای تئوری گراف های جهت دار می باشد – و با انجام مراحل روش ، به تهیه مدل پرداخته شده و یک مدل سلسله مراتبی جهت دار ارائه گردیده است . در نهایت نیز به تفسیر و ارزیابی مدل پرداخته شده و پیشنهاداتی در این خصوص ارائه گردیده است .
فاطمه نام نیک مرضیه احمدزاده
بر اساس گزارش های تحلیلی در مورد چشم انداز آینده مطالعات اقلیمی سه بازوی اقلیم شناسی همدید ( اقلیم شناسی همدید سنتی، ریزگردانی تجربی و مدل سازی اقلیم منطقه ای) به پیشرفت خود ادامه خواهند داد ولی مطالعات از طبقه بندی های جوی به مدل سازی و شبیه سازی کشیده خواهند شد و کاربردهای آنها در زمینه حل مشکلات کنونی و آتی محیط های سطحی رواج خواهد یافت. آنچه در این مقاله به آن پرداخته خواهد شد امکان سنجی کاربرد روش داده کاوی در پهنه بندی اقلیمی است. پهنه بندی اقلیمی یعنی شناسائی پهنه هائی که از آب و هوای یکسانی برخوردارند .در این پژوهش برای ارائه مدل و پهنه بندی اقلیمی استان اصفهان 20 متغییر اقلیمی در بازه زمانی حداقل ده ساله (از بدو تاسیس ایستگاه تا سال 2005 میلادی ) از ایستگاه های سینوپتیک و اقلیمی انتخاب و سپس قوانین پهنه بندی اقلیمی را استخراج نموده و با ورود مقادیر اقلیمی از یک نقطه جغرافیایی جدید، اقلیم آن تعیین خواهد شد. در این پژوهش امکان سنجی را با مطالعه موردی داده های اقلیمی استان اصفهان پیش برده ایم و مدل سازی های انجام شده را با سه نوع از پرکاربردترین الگوریتم های داده کاوی شامل: درخت های تصمیم گیری، شبکه بیزیان و شبکه عصبی به انجام خواهیم رساند. با طی مراحل داده کاوی بر اساس معیارهای اعتبار سنجی به ارزیابی مدل های تولید شده خواهیم پرداخت. در پایان عوامل تاثیر گذار بر پهنه بندی اقلیمی استان که توسط مدل پیشنهادی بدست آمده اند، به عنوان نتایج تحقیق ارائه خواهند گردید.
عبدالرسول شیروانیان محمد بخشوده
هدفمندسازی یارانه مواد غذایی، یکی از الزامات قانون هدفمندسازی یارانه ها در ایران است. در پرداخت یارانه ها، جلوگیری از گسترش فقر، حتی به بهای از دست رفتن بخشی از کارایی اقتصادی از مهم ترین اهداف به شمار می آید. بر این اساس و با توجه به چندبعدی بودن پدیده فقر و نیز با عنایت به این که در کشورهای در حال توسعه از جمله ایران، فقر روستایی از اهمیت و جایگاه بسزایی برخوردار است، این مطالعه، نخست با استفاده از رویکرد چندبعدی فقر، به تعیین الگوهای فقر در جامعه روستایی ایران پرداخت و در ادامه بررسی تأثیر برنامه هدفمندی یارانه مواد غذایی بر آن را هدف قرار داد. در راستای بهره مندی از این رویکرد، بر اساس ادبیات موضوع و داده های طرح هزینه و درآمد خانوار در سال 1387، پنج بعد فقر شامل فقر آموزشی، فقر مسکن، فقر غذایی، فقر سلامت و فقر درآمدی مورد توجه قرار گرفت. با استفاده از تکنیک قواعد وابستگی، الگوهای فقر روستایی استخراج و با استفاده از آماره های لوین و f تمایز این الگوها از یکدیگر مورد بررسی قرار گرفت. در ادامه، با استفاده از سیستم تقاضای تقریبا ایده آل درجه دوم، به بررسی تأثیر هدفمندی یارانه مواد غذایی بر این الگوها مبادرت شد. نتایج نشان داد، فقر آموزش (سواد اطلاعاتی) در جامعه روستایی ایران، از نظر گستردگی، دارای بیشترین گستره فقر بوده (100 درصد) و پس از آن با اندک تفاوتی، به ترتیب فقر مسکن (98/99 درصد) و فقر غذایی (64/99 درصد) قرار دارند. نرخ فقر درآمدی در این جامعه 04/57 درصد بوده و کمترین پوشش فقر، مربوط به فقر سلامت می باشد (96/36 درصد). با عنایت به این نتایج، این مطالعه با قرار دادن ابعاد آموزشی، مسکن، غذایی و سلامت در کنار بعد درآمدی، موفق به استخراج چهار الگوی مستقل و متمایز فقر روستایی با پوشش 61/99 درصدی خانوارهای روستایی شد. نتایج مربوط به بررسی تأثیر هدفمندی یارانه های مواد غذایی بر فقر روستایی نشان داد اجرای برنامه هدفمندی یارانه های مواد غذایی، روند تأثیرگذاری مشخصی بر ابعاد فقر روستایی ندارد. در بعد سلامت، هم لایه سطحی و هم لایه زیرین فقر را بهبود بخشیده، در بعد درآمدی بر لایه سطحی فقر، تأثیر منفی و بر لایه زیرین آن، تأثیر مثبت داشته و در بعد غذایی، بر لایه سطحی فقر، تأثیر مثبت و بر لایه زیرین آن، تأثیر منفی دارد. همچنین برنامه یادشده، با عدم پوشش ابعاد آموزشی و مسکن، در عمل ناتوان از پوشش کامل ابعاد فقر روستایی است. بدین ترتیب در نتیجه اجرای این برنامه، ماهیت فقر برخی از خانوارها و عمق فقر آنان در پاره ای از ابعاد فقر دچار تغییر می گردد. با این تغییرات، الگوی فقر روستایی نیز دچار تغییر می گردد، اما گستره فقر کلی در جامعه روستایی تغییر نمی نماید. با عنایت به این نتایج، می توان استنباط نمود که هرچند قانون هدفمندی یارانه ها در ایران از نظر قانونی، بر اثرات اجرای این برنامه ها بر فقرا متمرکز شده است، اما هدفمندی یارانه مواد غذایی، سیاستی مبتنی بر کاهش فقر روستایی نبوده و اهدافی غیر از کاهش فقر را دنبال می نماید.
فرنوش فرهادی علی حمزه
رشد روز افزون شبکه های اجتماعی در سیستم های مدرن اطلاعاتی امروزی، امکان همکاری خبرگان را به میزان فراوان و بیش از آنچه پیش از این وجود داشته، فراهم آورده است. با یک وظیفه داده شده و یک گراف از خبرگان به عنوان نمونه ای از یک شبکه اجتماعی، به طوری که هر یک از خبرگان دارای تعدادی مهارت باشند، هدف ما، پیدا کردن گروهی موثر از خبرگان است که قادر به انجام موفق آن وظیفه در قالب یک تیم باشند. در راستای انجام موثر وظیفه و تعامل مناسب خبرگان، مطلوب است کارایی تیم انتساب یافته نیز به گونه ای در نظر گرفته شود که هر خبره کمینه سطح توانایی موردنیاز برای هر مهارت را داشته باشد. در این پایان نامه، ما تلاش نمودیم تا مساله سازمان دهی تیم خبرگان را از چند جنبه بهبود و تعمیم دهیم: نخست، یک روش برای اندازه گیری سطح توانایی هر خبره بر مبنای مهارت ها و نیز توانایی تعامل با همسایگان برای انجام هر مهارت داده شده، ارایه شده است. دوم، گراف اصلی خبرگان به صورت مجموعه ای از چندین گروه شامل افراد ماهر برای هر مهارت که دارای ارتباطات قوی با یکدیگر هستند، تجمیع می شود و از میان این گروه ها، گروه های موثر برای ادامه کار استخراج می شوند. در این گام، با در نظر گرفتن تنها این گروه های موثر، فضای جست و جو به نحو چشمگیری کاسته می شود و افزون بر آن، این امر موجب پیشگیری از افزایش غیرمنطقی هزینه ی ارتباطی و اندازه تیم در هنگام انتساب افراد کاندید به تیم انتخابی می گردد. سوم، الگوریتم rarestfirst موجود ارتقاء داده شده و یک نسخه ی تعمیم یافته از آن برای انجام وظایف عمومی-رقابتی ارایه می شود. در پایان، به منظور بهبود کارایی تیم انتخابی، تعریف سازگار یافته ای از هزینه ی ارتباطی ارایه می گردد. آزمایش ها بر روی گراف تالیفی-همکاری نویسندگان در دیتاست dblp نشان می دهد که در زمینه ی کارایی و موثر بودن، چارچوب کاری پیشنهادی ما توانسته است به نتایج خوبی در کاربردهای عملی دست یابد.
مریم سرخی ستار هاشمی
سازماندهی تیم موثر از خبرگان در جهت پوشش وظیفه ای تعیین شده در شبکه های اجتماعی در بسیاری از پروژه های دنیای واقعی مورد توجه و حائز اهمیت است. هزینه ارتباطی، و وجود همکاری مناسب بین اعضای تیم، و همچنین انتخاب تیمی کوچک و در عین حال کارا، ما را در انجام هرچه موفق تر پروژه هدایت می کند. در این پایان-نامه سه رهیافت در جهت تعمیم و بهبود کارهای پیشین انجام شده است: اول، بررسی عملکرد توابع شباهت مختلف برروی کارایی سازماندهی تیم. مسأله سازماندهی تیم را در محیط شباهتی بین رئوس هم به طور مستقیم با توجه به میزان مقاله های اشتراکی-تألیفی بین دو رأس، و هم شباهت ضمنی بین رئوس با توجه به میزان همسایه های مشترک و از طریق واسط های بین شان بررسی می کنیم. همچنین، شباهت مهارتی برای هر نویسنده را با در نظر داشتن سطح توانایی بالقوه او و میزان همکاری و اشتراکش با دیگر نویسندگان در زمینه مهارت مورد نیاز، در روند انتخاب، وارد عمل خواهیم کرد تا در انتخاب هر چه موثرتر اعضای تیم تأکید داشته باشیم. استفاده از ترکیب این معیارهای شباهت در فرمول تابع هزینه الگویتم، ما را در جستجوی هرچه کاراتر تیم نهایی در شرایط یکسان یاری خواهد کرد. علاوه براین، می توان از طریق توابع شباهت ضمنی بین رئوس، افرادی که قابلیت بالایی برای همکاری با هم دارند، در چهارچوب تیم نهایی که حاوی بهترین افراد موثر در شبکه اجتماعی موجود می باشند، طبق ساختار روابط بین شان به هم پیشنهاد داد، زیرا این افراد در ساختار قبلی شبکه تنها از طریق واسط ها به هم متصل بوده و می توانند با همکاری هم، ساختار کاراتری در گراف جدید شبکه اجتماعی ایجاد نمایند. دوم، سازماندهی k تیم برتر با استفاده از نظریه بازی ها است. پیدایش k تیم برتر زمانی اهمیت می یابد که تیم برتر نهایی به هر دلیلی منحل شود و مجبور به اجرای پروژه توسط تیم بهتر بعدی باشیم و یا با چندین پروژه و موضوع پروژه یکسان مواجه باشیم، در چنین شرایطی می توانیم پروژه ها را بر حسب اولویت به تیم های بدست آمده اختصاص دهیم. در جریان بازی، با توجه به تابع سودمندی برای هر خبره و روند عضویت در گروه های مختلف، در نهایت، هنگامی که به تعادل نش محلی دست یابیم همه ی تیم های موجود بدست خواهند آمد. سوم، سازماندهی تیم خبرگان با در نظر داشتن وظایف تعمیم یافته و گروه بندی گراف. در این رهیافت هر مهارت مورد نیاز در وظیفه شامل حداقل تعداد خبره مورد نیاز و حداقل سطح مهارتی هر خبره جهت پوشش آن می باشد. گروه بندی گراف اصلی نیز با توجه به مهارت های مورد نیاز و در اختیار داشتن آنها توسط خبرگان موجود، با توجه به اتصالات قوی بین شان انجام خواهد شد. این روش فضای جستجو را تا حد زیادی کاهش داده و مانع از انتخاب گره های غیر ضروری و افزایش بی رویه ی هزینه ارتباط و اندازه تیم می گردد. آزمایشات بر روی گراف همکاری dblp نشان دهنده کارایی بالا و موثر بودن روش های پیشنهادی می باشد.
نرجس عسکریان علی حمزه
پردازش زبان طبیعی
الهام سوچی رضا اکبری
با گسترش رو به رشد اینترنت، شبکه های اجتماعی نیز ایجاد شده و روند رو به رشدی را پیموده اند. اینگونه شبکه ها عبارتند از مجموعه ای از وب سایتهایی که بر مبنای ایجاد رابطه بین افراد بنا نهاده شده-اند. روابطی همچون دوستی، خویشاوندی، شغلی، درسی و موارد مشابه. افراد در آن ثبت نام کرده و به آن می پیوندند. کاربران علایق و مشخصات خود را وارد سیستم کرده و یک پروفایل برای خود ایجاد می کنند. همزمان با رشد شبکه های اجتماعی بازاریابی و تبلیغات در این شبکه ها نیز گسترش پیدا کرده است. در تبلیغات هدفمند کاربر آگهی های متناسب با علاقه مندی خود را دریافت خواهد کرد. از این رو یافتن کاربران کلیدی در این گونه شبکه ها دارای اهمیت ویژه ای می باشد و نیاز به آنالیز و کاوش داده ها احساس میشود. در این پایان نامه ابتدا به بررسی شبکه های اجتماعی و ساختار آنها، پرداخته می شود. سپس بحث تبلیغات، تبلیغات هدفمند و جایگاه آنها در شبکه های اجتماعی، مورد بررسی قرار می گیرد. بعد از آن روش های مختلف دستیابی به تبلیغات هدفمند در شبکه های اجتماعی بیان می شود و در نهایت ارائه روشی برای تبلیغات هدفمند بر اساس پروفایل کاربران تعریف و طراحی شده و مورد ارزیابی قرار می گیرد.
الهام حسینی ستار هاشمی
فیلترینگ اشتراکی، اصلی ترین تکنیک به کار گرفته شده در سیستم های پیشنهاد دهنده می باشد که علاقه یک کاربر را بر اساس رای های ثبت شده از کاربران- کالاها، پیشگویی می کند. به منظور استخراج رابطه بین کاربران و یا وابستگی بین کالاها، راهکارهای مختلفی وجود دارد؛ که در میان آن ها، خوشه بندی از اهمیت بالایی برخوردار است. نکته قابل توجه این است که، روش خوشه بندی ابتدایی در فیلترینگ اشتراکی، دو مشکل پراکندگی و عدم مقیاس پذیری را به همراه دارد. پراکندگی اشاره به حالتی می کند که اکثر کاربران فقط به تعداد کمی کالا رای داده اند و از سوی دیگر عدم مقیاس پذیری به دلیل تعداد زیاد کاربران و کالاها به وجود می آید. بر این اساس، ما روشی به نام spcf را ارائه داده ایم که شامل دو مرحله می باشد. در مرحله اول، کاربران و کالاها به طور جداگانه بر اساس شباهت دو بدوی آن ها، خوشه بندی می شوند. وقتی که خوشه های مرحله اول تشکیل شد، در مرحله دوم، خوشه های کاربران و کالاها با روش خوشه بندی همزمان، دوباره خوشه بندی می شوند. روش ارائه شده، از سه جهت کارایی خوبی دارد؛ ابتدا، توانایی کاهش مشکل پراکندگی که به طور ذاتی در فیلترینگ اشتراکی موجود می باشد را داراست؛ همچنین، با کاهش بعد، مشکل عدم مقیاس پذیری را کاهش می دهد و در نهایت، وابستگی میان کاربران و کالاها را به طور موثر، استخراج می کند.
بهزاد کیانی علیرضا کشاورز حداد
یکی از خدمات نوین در حوزه تجارت سیار، پرداخت سیار است. برای این که مشتریان پرداخت سیار را به عنوان روش پرداخت بپذیرند و از آن در زندگی روزمره خود استفاده نمایند، باید عوامل موثر بر پذیرش پرداخت های سیار از جانب مشتریان را شناخت. در این پایان نامه با بررسی تئوری های پذیرش فناوری، عوامل موثر بر پذیرش پرداخت های سیار شناسایی شدند و پس از شناسایی این عوامل، مدلی برای پذیرش پرداخت های سیار در جامعه ایران ارائه شده است. سپس به جمع آوری نظریات مشتریان شعب منتخب بانک صادرات در شهر زاهدان با استفاده از پرسش نامه پرداخته ایم. علاوه بر این فناوری های متعدد مورد استفاده در پرداخت سیار در جهان نیز بررسی و معرفی شده اند و با توجه به زیر ساخت فنی مخابرات ایران و شرایط جامعه ایران، استفاده از nfcو ussd برای پیاده سازی خدمات پرداخت سیار توصیه می گردد. نتایچ نمونه مورد مطالعه تحقیق نشان می دهد که نگرش افراد نسبت به هنجارهای اجتماعی، سازگاری و هزینه استفاده از خدمات پرداخت سیار بر پذیرش این روش جدید پرداخت تاثیر دارد و نگرش افراد نسبت به ریسک استفاده از پرداخت سیار و مزیت این روش پرداخت نسبت به سایر روش های پرداخت بر پذیرش پرداخت سیار تاثیری ندارد. در انتها با تحلیل این نتایج، راهکارهایی برای پذیرش بهتر این روش پرداخت در جامعه ارائه داده ایم.
رضا بخشنده زهره عظیمی فر
هدف این پایان نامه پیاده سازی روش های نوین جستجو بر روی شبکه های اجتماعی با توجه به ساختار گراف این شبکه هاست و شامل دو بخش کلی "جستجوی گراف اجتماعی" و "جستجو بر حسب محتوا" می باشد. در بخش اول پایان نامه سعی می کنیم الگوریتم های موجود را برای پیدا کردن کوتاهترین مسیر بین دو کاربر مختلف آزمایش کنیم و نیز الگوریتمهای بهتری جهت انجام این کار ارائه کنیم. لازم به ذکر است که در الگوریتم های ارائه شده باید اطلاعات درخواستی از شبکه ی اجتماعی حداقل باشد. به عبارت دیگر تعداد درخواست هایی که هر الگوریتم به سرورهای شبکه ی اجتماعی می فرستد و نیز تعداد نودهایی که تولید می شود یا گسترش می یابد باید تا حد امکان کم باشد. همچنین نسخه هایی از الگوریتم های ارائه شده را برای پیدا کردن کوتاهترین مسیر بین یک کاربر و مجموعه ای از کاربران دیگر ارائه می کنیم. در بخش دوم نیز نمونه هایی از کاربردهای الگوریتم های ارائه شده را بررسی می کنیم. اپتدا سیستم پیشنهاد دوست را مورد بررسی قرار می دهیم و سپس از داده های شبکه های اجتماعی در شخصی سازی نتایج جستجوی موتورهای جستجو بر حسب علایق کاربر استفاده می کنیم. کلیه ی الگوریتم های ارائه شده بر روی شبکه ی اجتماعی توییتر به صورت آنلاین پیاده سازی شده و اجرا شده است. همچنین از داده های شبکه ی اجتماعی فرندفید نیز جهت تست برخی از الگوریتم ها استفاده می کنیم. نتایج بدست آمده از اجرای الگوریتم ها نشان می دهد که الگوریتم های ارائه شده نسبت به نمونه های قبلی بسیار سریعتر بوده و می تواند در مدت زمان کم و به صورت آنلاین فاصله ی بین دونفر را در شبکه های اجتماعی پیدا کند. همچنین الگوریتم های ارائه شده به حالت های خاص شبکه ها حساس نیست و بر خلاف الگوریتم های قبلی برای هر جفت کاربری که به صورت تصادفی از شبکه ها ی اجتماعی انتخاب شود? می تواند درجه ی پخشش را در زمان مناسب به دست آورد.
سید کاوه احمدی ابهری ستار هاشمی
دسته بندی یکی از مهمترین فرآیندهای مورد مطالعه در حوزه یادگیری ماشین و داده کاوی است که در برنامه های کاربردی فراوانی از جمله دسته بندی متن، تشخیص پزشکی، بیوانفورماتیک و... مورد استفاده قرار می گیرد. مسائل دسته بندی را می توان براساس تعداد برچسب های منتسب به هر یک از داده ها به دو دسته کلی مسائل دسته بندی تک برچسبی و مسائل دسته بندی چند برچسبی تقسیم کرد. در مسائل دسته بندی تک برچسبی، هر داده دارای یک برچسب منحصر به فرد است. اکثر مطالعات صورت گرفته در حوزه یادگیری ماشین مربوط به این نوع مسائل دسته بندی بوده است. اما مسائل مهم زیادی وجود دارد که حل آنها مستلزم انجام دسته بندی چند برچسبی است. در این مسائل، هر داده ممکن است به بیش از یک برچسب منتسب شود. سامانه های دسته بندی یادگیرنده (lcs) یک اسلوب ایجاد و استنتاج قوانین هستند که از الگوریتم ژنتیک به عنوان ساز و کار اولیه جستجو استفاده می کنند. این اسلوب ها به دنبال یک مجموعه از قوانین قابل اطمینان و با درجه صحت بالا هستند. اگرچه فعالیت های مختلفی برای انجام دسته بندی توسط سامانه های دسته بندی یادگیرنده انجام شده است اما اکثر این فعالیت ها نیز برای دسته بندی داده های تک برچسبی بوده و در مورد دسته بندی چند برچسبی این تحقیقات در اول راه قرار دارد. هدف اصلی این تحقیق، ایجاد یک مجموعه قوانین با استفاده از lcs برای دسته بندی داده های چند برچسبی است که نتایجی کارآمد و قابل مقایسه با سایر روش های دسته بندی چند برچسبی داشته باشد. در این تحقیق از xcs به عنوان سامانه پایه استفاده شده و بخش های عمده آن برای ایجاد امکان مواجهه با داده های چند برچسبی مورد تغییر قرار گرفته است. برای این منظور دو روش مختلف بازنمایی دانش برای مسائل دسته بندی چند برچسبی، روش پاداش دهی متناسب با این مسائل و یک ساز و کار کشف قوانین که با استفاده از یک مکانیزم رای گیری برای lcs و با بهره گیری از تجربیات قبلی سامانه ی کشف را هدایت می کند معرفی شده است.
سیدحسام الدین کریمیان منوچهر کلارستاقی
در این رساله راهکاری برای کاهش تشخیص های مثبت کاذب و نیز افزایش دقت تشخیص، در سیستم های تشخیص نفوذ مبتنی بر جریان های داده ارائه شده است.
فاطمه قایم مقامی ستار هاشمی
در این پایان نامه پس از مطالعه و بررسی روشهای موجود برای خوشه بندی داده های شبکه های اجتماعی ، روشی برای خوشه بندی موثر داده های شبکه های اجتماعی به منظور شناسایی جوامع موجود دراین شبکه ها ، ارائه گردیده است . در روش پیشنهادی از الگوریتم شبکه عصبی خودسازمانده که یکی از الگوریتم های بسیار قوی در بین الگوریتم های شبکه های عصبی است ، استفاده گردیده است .در این روش با تغییر در روش وزن دهی شبکه عصبی خودسازمانده ، یک شبکه اجتماعی به خوشه های مختلف تقسیم می شود که این خوشه ها همان جوامع موجود در شبکه اجتماعی هستند . این روش بر چندین شبکه اجتماعی که دارای ساختار مشخصی هستند و تعداد جوامع موجود در آنها ، مشخص است ، اعمال گردیده است . نتایج این آزمایشات نشان می دهد که دقت خوشه بندی در این روش نسبت به سایر روشها ، بالاتر است .
سارا هاشمی شهرام جعفری
ارایه روش نوین برای فیلتر کردن هرزنامه ها اینترنت ، امکان استفاده از سرویس ها و خدمات متعددی را در اختیار کاربران قرار می دهد . ارسال و دریافت نامه الکترونیکی ، یکی از قدیمی ترین و در عین حال متداولترین سرویس ارائه شده بر روی اینترنت است.علیرغم تمامی مزایا و پتانسیل های سرویس فوق ، در چند سال اخیر و همزمان با رشد و گسترش استفاده از اینترنت ، شاهد مشکلات و مسائل جانبی در این رابطه نیز می باشیم . توزیع نامه های آلوده به ویروس ها و یا کرم ها ، ارسال و یا دریافت نامه های الکترونیکی ناخواسته که از آنان با نام اسپم یاد می شود ، نمونه هائی در این زمینه می باشد. موضوع اسپم به عقیده کارشناسان و دست اندرکاران فعالیتهای اینترنتی و حرفه ای های آن ، بیشتر موضوعی اخلاقی است . نامه های الکترونیکی می توانند به دو دسته تقسیم شوند: «اخلاقی و غیر اخلاقی » اما آن دسته از نامه های الکترونیکی که به صورت انبوه برای دهها ، صدها، هزاران و یا حتی گاهی میلیونها نفر بر روی اینترنت ارسال می شود اصط لاحاً و قطعاً کاری غیر اخلاقی است و اکثراً هم حاوی مطالبی غیر حرفه ای ، خام ، غلط ، بی محتوا و وقت تلف کن و در نهایت غیر اخلاقی هستند که در واقع می توانند مثال مشخصی باشند برای تعریف کوتاه اما جامع ما از مقوله ای به نام اسپم ، که همانا نامه های الکترونیکی انبوه و غیر اخلاقی ای هستند که برای افراد به صورت ناخواسته ارسال می شوند و موجبات نارحتی و انزجار گیرندگان آنها را فراهم می کنند . ایمیل های تبلیغاتی ناخواسته که از آن ها به عنوان اسپم یا هرزنامه نام برده می شود ، ایمیل هایی بیهوده و آزار دهنده هستند . گاهی اوقات اسپم ها شامل پیشنهادهای جعلی هستند که فقط وقت و پول شما را از بین خواهند برد . برای توقف و محدود کردن اسپم ها شما می توانید پیشنهادی را که از طریق اسپم دریافت می کنید، همانند یک تماس تلفنی ناخواسته و نابجا، رد کنید.
نجمه هادی برحق طلب زهره عظیمی فر
امروزه با افزایش رو به رشد دوربین های دیجیتال، روزانه حجم عظیمی از داده های ویدئویی تولید می شوند که بر روی وب و پایگاه های داده ی بزرگ قابل دسترس هستند. دسته بندی این داده ها بر اساس محتوایشان به صورت اتوماتیک و با دقت بالا هدف غایی بسیاری از کاربردها در این زمینه است. در این پایان نامه ما سیستمی طراحی کرده ایم که بتواند داده های ویدئویی حاوی عمل انسان را با دقت خوب و در زمان نسبتا کوتاهی برچسب گذاری کرده و دسته بندی کند. در این پایان نامه از روش های دیداری بهره گرفته شده است. روش های دیداری برای تشخیص فعالیت انسان در واقع فرایند تشخیص انسان در ویدئو و عملی که انجام می دهد با بهره گیری از تکنیک های بینایی ماشین می باشد. در این راستا سیستم طراحی شده از روش یادگیری بدون نظارت برای استخراج ویژگی و کد کردن آن ها استفاده کرده است. روش های یادگیری ویژگی نه تنها به راحتی قابل تعمیم به حوزه ه های دیگر هستند بلکه کارایی قابل توجهی بر روی داده های ویدئویی جمع آوری شده از دنیای واقعی دارند. در پایان برای ارزیابی این سیستم به دسته بندی داده های ویدئویی پایگاه های داده ی kth، ucf و youtube پرداخته ایم و به نتایج قابل توجهی دست پیدا کرده ایم.
زهرا کاظمی ستار هاشمی
در سال های اخیر، شبکه های اجتماعی مورد توجه بسیاری از محققین قرار گرفته است.این امر به دلیل رشد فن¬آوری و به تبع آن توسعه کاربردهای متنوع شبکه های اجتماعی در دهه اخیر می باشد. البته این نکته قابل توجه است که اگر چه شبکه های اجتماعی در قالب گراف نمایش داده می شوند اما آنالیز شبکه های اجتماعی تا حدودی باآنالیز دیگر داده ها که به شکل گراف نمایش داده می شوند متفاوت است. تاکنون تحقیقات متعددی از زوایای گوناگون بر روی شبکه های اجتماعی انجام گرفته¬است،اما با توجه به اهمیت و کاربردهای گسترده ¬شبکه های اجتماعی و همچنین مسائل چالش برانگیزی چون پیشنهاد پیوند در این حوزه ،هدف این پایان¬نامه، بررسی روش¬های موجود و ارائه تکنیکی جدید برای پیشنهاد پیوند از روی ساختار گراف شبکه های اجتماعی است.
حمیرا شه پرست اقبال منصوری
سیستم های خودگستر فازی روش هایی قدرتمند در جهت دسته بندی جریان های داده می باشند. در این سیستم ها، قوانین فازی به صورت خودکار تولید، به روز رسانی و حذف می گردند. با این حال، الگوریتم های معرفی شده تا این زمان نمی توانند به خوبی با مشکلات تغییر ناگهانی و تغییر تدریجی در مفهوم داده ها مقابله نماید. در این پایان نامه دو روش خودگستر آن لاین جهت دسته بندی جریان های داده معرفی شده اند، که بر خلاف روش های آف لاین ساختار خود را براساس تغییرات جدید در داده ها به روز رسانی می نمایند. روش های پیشنهادی بر روی تعدادی از مجموعه داده های استاندارد آزمایش شده و نتایج بدست آمده نشان می دهند که این روش ها در اغلب موارد بهتر از الگوریتم های پیشین عمل نموده و نتایج بهتری دارند.
حامد حدادپژوه غلامحسین دستغیبی فرد
اکثر کار های انجام شده در این حوزه دارای پیچیدگی محاسباتی بالایی می باشند. در پژوهش انجام شده، با توجه با ماهیت داده های موجود و حملات در سیستم های تشخیص نفوذ یک مدل با سرپرست دو لایه جهت شناخت بی نظمی در سیستم های تشخیص نفوذ مبتنی بر شبکه ارائه شده است. مدل ارائه شده در دوگام اقدام به شناسایی و طبقه بندی تمامی نمونه های مخرب بوسیله ی الگوریتم بیز ساده و جدا سازی نمونه های مخرب از نمونه های طبیعی بوسیله الگوریتم نزدیکترین همسایه مبتنی بر فاکتور اطمینان می کند. یکی از مزایای مدل ارائه شده تشخیص نمونه های مخرب پر خطر مانند حملات حدس زدن رمز عبور کاربران و سرریز بافر به جهت افزایش دسترسی مهاجم، با وجود فراوانی نسبتاً کم این نوع از نمونه ها جهت آموزش مدل می باشد. مدل پیشنهادی بوسیله مجموعه داده ی nsl-kdd مورد ارزیابی قرار گرفته است. مقایسه نتایج بدست آمده با سایر تکنیک ها و روش های ارائه شده در این حوزه نشان دهنده یک پیشرفت قابل قبول می باشد.
لیدا عبدی ستار هاشمی
پردازش مجموعه داده های نامتوازن در بسیاری از کاربردهای دنیای واقعی، گسترده شده اند. این مسئله زمانی به وقوع می پیوندد که تعداد نمونه های یک یا چندین کلاس موجود در مجموعه داده، نسبت به تعداد نمونه های سایر کلاس ها کمتر باشند. این مشکل به وجود چولگی و عدم توازن در توزیع مجموعه داده ای مربوط شده و باعث ایجاد مشکلات برای بسیاری الگوریتم های معمول یادگیری ماشین می شود. در حقیقت، هدف اصلی یادگیری، به دست آوردن الگوریتم های مناسبی است که علاوه بر حفظ عملکرد خود در یادگیری داده های کلاس اکثریت، قابلیت یادگیری از داده های کلاس اقلیت را نیز بهبود ببخشند. مشکل عدم توازن در حالت چندکلاسه بسیار مشهودتر بوده و پیچیدگی آن بیشتر است. راه حل های ارائه شده برای مواجهه با این گونه داده ها، روش های در سطح داده و در سطح الگوریتم می-باشند. در این مطالعه، یک روش افزایش داده نوین به نامmdo ، که بر پایه فاصله mahalanobis یا فاصله آماری بنا شده است، ارائه شده تا یادگیری از مجموعه داده های نامتوازن چندکلاسه را بهبود بخشد. به بیان دیگر، در این روش نمونه های ترکیبی به شکلی ایجاد می شوند که تقریباً ویژگی های نمونه های کلاس اقلیت اصلی را حفظ کنند. در گام بعدی، یک روش تلفیقی از افزایش داده و الگوریتم boosting ارائه شده است. در واقع mdoboost، دو تکنیک افزایش داده mdo و الگوریتم adaboost.m2 را با یکدیگر ترکیب می کند. این روش باعث افزایش کارایی کلاسه بندی، برای معیارهای ارزیابی کارایی mauc، g-mean و recall کلاس اقلیت شده و از سایر روش ها به صورت معناداری بهتر عمل می کند. در آخر نیز یک نوع تغییریافته از الگوریتم feating که توسط ting و همکاران ارائه شده، برای بهبود یادگیری از مجموعه داده های چندکلاسه به کار گرفته شده است. feating یک الگوریتم یادگیری جمعی است که با ساختن مدل های محلی کارایی کلاسه بند ها را به صورت معناداری افزایش می دهد. الگوریتم پیشنهادی که feating adaboost.m1 نام دارد، با کلاسه بندهای پایه svm و c4.5 نتایج بسیار معناداری بر روی مسائل نامتوازن چندکلاسه داشته و از سایر الگوریتم های چندکلاسه ارائه شده در این زمینه بهتر عمل کرده است. واژه های کلیدی: مجموعه داده های نامتوازن چندکلاسه، الگوریتم های یادگیری جمعی، فاصله آماری، الگوریتم boosting، مدل محلی، یادگیری ماشین، داده کاوی.
مریم کیخا ستار هاشمی
برخلاف کلاسه بندی سنتی داده های تک برچسبی که در آن هر نمونه ورودی تنها با یک برچسب کلاس مشارکت داشت، در کلاسه بندی داده های چند برچسبی هر نمونه ورودی با مجموعه ای از برچسب ها مشارکت دارد. به دلیل وجود چندین برچسب کلاس، فرآیند یادگیری تحت تأثیر قرار می گیرد و کلاسه بندهای پایه ی مورد استفاده در داده های تک برچسبی، قابل استفاده نمی باشند. برای رفع این مشکل روش های تغییر مسئله معرفی شده اند. این دسته از روش ها مجموعه ی داده ها را به گونه ای تغییر می دهند تا بتوان کلاسه بندهای معمول را مورد استفاده قرار داد. با وجود آسانی استفاده از این دسته از روش ها، دو چالش کارایی و ارتباط بین برچسب ها از مباحث بحث برانگیز در تحقیقات اخیر می باشند. با توجه به کارایی بسیار خوب و قابلیت انعطاف بالای الگوریتم های یادگیری جمعی در زمینه های مختلف یادگیری ماشین، به کارگیری این گونه الگوریتم ها روش مناسب و موثری برای بهبود یادگیری از مجموعه داده های چندبرچسبی به نظر می رسد. در این مطالعه، الگوریتم جدیدی به نام lbr معرفی شده است که در دسته ی روش های یادگیری جمعی قرار دارد و در مقایسه با روش rakel که از مفهوم الگوریتم های یادگیری جمعی استفاده می کند، به نتایج بهتری رسیده است. روش lbr از کلاسه بندی محلی نمونه ها استفاده می کند. همچنین، اخیرا مسئله ارتباط بین برچسب ها در روش دیگری با نام cc مورد بررسی قرار گرفته است. این روش از کارایی پیش بینی بالایی برخوردار است. مشکل اصلی این روش عدم در نظر گرفتن ترتیب مشخصی از برچسب ها در زنجیره ی خود است. در گام بعدی در این رساله، دو روش fbcc و wbcc به منظور ارائه ی ترتیبی از برچسب ها با بیشترین میزان وابستگی به مجموعه ی ویژگی ها، معرفی شده اند. ارزیابی های تجربی روی طیف وسیعی از مجموعه های داده ای چند برچسبی حاکی از بهبود کارایی کلاسه بندی در روش های پیشنهادی نسبت به روش های پیشین می باشد.
حسین علیزاده مقدم ستار هاشمی
در تحقیقات صورت گرفته تا کنون استفاده از مدلهای مخفی مارکوف(hmm) جهت تشخیص بد افزارهای دگرگون نتایج خوبی به عمل آورده است. این درحالیست که برخی بدافزارها از جمله mwor و metaphor توانسته اند با استفاده از متدهای دگرگونی خود را همانند فایلهای سالم ساخته و مانع تشخیص خود شوند. روش hmm دوگانه با استفاده از چندین مدل مخفی مارکوف که هر کدام بر اساس یک دسته از فایل های سالم و مخرب آموزش داده شده اند میتواند بدافزارهای نامبرده را تشخیص دهد. در این تحقیق روشی برای تفکیک اهمیت بخش های فایلهای بدافزار ارائه شده که برای آموزش مدل مخفی مارکوف بکار میروند. اهمیت این بخشها بر اساس عدم شباهتشان به فایلهای سالم درنظر گرفته شده است و استخراج آنها با استفاده از روشهای مشابه پردازش صدا صورت گرفته است. پس از آن تعدادی فایل نسبت به hmm آموزش داده شده کلاس بندی شدهاند و دقت نتایج بدست آماده محاسبه گردید. نتایج بدست آماده نشان داد که روش پیشنهادی در تشخیص بدافزارهای کاربردی دارای دقت بهتری نسبت به روشهای کنونی بوده و همچنین دارای سرعت بالاتری در کلاسه بندی میباشد.
سید عماد آرمون ستار هاشمی
امروزه با توجه به توسعه کاربرد کامپیوتر در اکثر ابعاد زندگی ما، بدافزارها تبدیل به یکی از بزرگترین مشکلات فضای سایبری و حتی جوامع انسانی شده اند. بدافزار قطعه کدی نرم افزاری با اهداف خصمانه است که ضمن آسیب به سیستم های نرم افزاری، در کارایی آن ها اختلال ایجاد می کند. بدافزارها برای فرار از چنگ ضدبدافزارها ، از تکنیک های مختلفی از جمله، تکنیک های مبهم سازی استفاده می کنند. به این شکل که بدافزار مربوطه ظاهر خود را تغییر می دهد، به نحوی که کارایی خصمانه آن بدون تغییر می ماند، اما دیگر قابل کشف به وسیله ضدبدافزارهای رایج نیست. این مشکل به وسیله روش های سنتی که به امضای بدافزارها وابسته هستند، قابل حل نیست. بنابراین تکنیک های بهنجارسازی یا غیرمبهم سازی برای مقابله با این روش ها ارائه شدند. در این پژوهش می خواهیم یک روش بهنجارسازی جامع معرفی کنیم که بتواند همه نوع تکنیک مبهم سازی را به فرم اوتوماتا در پایگاه داده ی خود ذخیره کند و از آن ها به منظور بهنجارسازی بدافزارهای دگرریخت استفاده کند. هر تکنیک مبهم سازی به وسیله ی یک اتوماتای معین محدود افزوده (که مختصراً به آن adfa می گوییم) مدل می شود. این رهیافت به وسیله پیمایش این adfa ها، در کد منبع به دنبال وقوع تکنیک های مبهم سازی می گردد. پس از پیدا شدن یک کد مبهم، این کد در فاز دوم، بهنجار شده و در نتیجه بدافزار مورداشاره توسط ضدبدافزارهای سنتی شناخته می شود. مهم ترین نقطه قوت رهیافت مورداشاره جامع بودن آن است. یعنی این رهیافت توانایی کشف گستره ی وسیعی از تکنیک های مبهم سازی را دارد. در نهایت نیز رهیافت موردبحث پیاده سازی و آزمایش شده است. نتایج بدست آمده نویدبخش سیستمی کارا برای کشف بدافزارهای دگرریخت است.
حنانه نجد عطایی محمد اقتصاد
رباتهای گروهی در کاربردهای رباتیکی به طور گسترده مورد استفاده قرار میگیرند؛ به خصوص در مواردی که استفاده از رباتهای انفرادی برای به نتیجه رساندن کاری مشخص امکانپذیر نباشد. بنابراین، طراحی الگوریتمی کارا برای کنترل رباتهای گروهی یکی از مسائل مورد بحث در رباتیک میباشد. در این پایان نامه در ابتدا شبیه سازی ای طراحی شده تا کارکرد جستجوی گروهی رباتها با استفاده از بهینه سازی ذرات بررسی شود. سپس دو الگوریتم هوشمند غیرمتمرکز به نامهای mpso و mbso برای کنترل گروهی از رباتهای همکار بر اساس دو الگوریتم pso و bso ارائه میشوند. این دو الگوریتم برای کاربرد جستجو در یک محیط ناشناخته و پیدا کردن بهترین هدف از میان اهداف گوناگون موجود در محیط، آزمایش میشوند. نتایج آزمایشات انجام شده نشان میدهد الگوریتم mbso به دلیل قابلیت اکتشاف بالا، قدرت پیدا کردن هدف اصلی از میان تمامی اهداف فرعی موجود در محیط را دارد؛ اما الگوریتم mpso به دلیل همگرایی زودرس، در پیدا کردن بهترین هدف موفق نمیباشد. در ادامه پایان نامه و برای بررسی کاربرد تخصیص وظایف، مدلی به صورت لایه ای پیشنهاد شده است. با استفاده از این مدل، در لایه بالا وظایف موجود در یک محیط ناشناخته شناسایی شده و در لایه پایین متناسب با میزان کار مورد نیاز هر وظیفه، تعدادی ربات به آنها اختصاص داده میشوند. کار واگذاری وظایف به رباتها در طول اجرای الگوریتم به صورت پویا صورت میپذیرد. نتایج آزمایشات انجام شده بر روی این مدل نیز حاکی از کارایی الگوریتم پیشنهادی در به انجام رساندن تمامی کارها در کمترین زمان ممکن است.
زهره بستانیان رضا بوستانی
طبقه بندی تقویت تطبیقی یک روش شناخته شده و موثر برای جمع آوری ویژگی های مثبت گروهی از یادگیرهای ضعیف موازی است; با این حال، از حساسیت بالا به داده های نویزی و همچنین آموزش تعداد زیادی از یادگیرهای ضعیف رنج می برد. در اینجا، یک روش جدید به منظور کاهش تعداد یادگیرهای تطبیقی با استفاده از روش گرام اشمیت به صورت یک طرح وزن دهی جدید که منجر به متعامد شدن توزیع تمام یادگیرهای تنبل می شود پیشنهاد شده است. مشکل طرح وزن دهی طبقه بندی تقویت تطبیقی استاندارد ناشی از این است که هر یادگیر فقط با یادگیر قبلی متعامد است، در حالی که تعامد بین توزیع تمامی یادگیرها تضمین شده نیست. برای ارزیابی روش ارایه شده، تعدادی از مجموعه داده های متعلق به uci به عنوان معیار انتخاب شده است، و عملکرد طبقه بندی تقویت تطبیقی متعامد پیشنهادی را با الگوریتم های طبقه بندی تقویت تطبیقی استاندارد، logitboost و aveboost-ii مقایسه شده است. نتایج بدست آمده تایید برتری طبقه بندی تقویت تطبیقی متعامد در مقایسه با روشهای رقیب است. علاوه بر دقت، خواص دیگری مانند استحکام و تعمیم طبقه بندی تقویت تطبیقی متعامد در نظر گرفته شده است. نتایج مقایسه بر برتری روش ارائه شده به رقبا برحسب دقت، نیرومندی و تعمیم را نشان می دهد.
امیر درجه رئوف خیامی
از اوایل دهه 90 میلادی با توجه به گسترش روز افزون سازمان های بزرگ، نیاز به طراحی و توسعه ی سیستم های اطلاعاتی پیچیده با اهداف خاص در جهت پاسخ به نیازهای سازمان ها، مفهومی به نام معماری سازمانی پدیدار شد. کیفیت مناسب ارائه خدمات و کسب درآمد محرک های مهمی هستند که ضریب تأثیر بالایی در تصمیم¬گیری های مدیران هر سازمان دارند. لذا برنامه¬ریزی دقیق و داشتن سازمانی یکپارچه و منسجم گامی است در جهت پاسخگویی به محرک های ذکر شده. با توجه به مطلب فوق، دانشگاه ها نیز در زمره سازمان های بزرگی قرار می گیرند که لزوم استفاده از سیستم های اطلاعاتی پیچیده با کارکردهای خاص در آن ها به شدت ملموس می باشد. همچنین با تغییرات سریع محیط کسب و کار و افزایش تعداد سازمان هایی که با این نهاد در ارتباط هستند؛ نیاز دانشگاه ها به سیستم های اطلاعاتی انعطاف پذیر و ساختار سازمانی بهینه جهت پاسخ به این چالش ها کاملاً واضح است. معماری سازمانی یکی از ابزارهایی می باشد که می تواند به خوبی به نیازهای ذکر شده پاسخ بدهد. اما به علت نبود تخصص و دانش کافی در رابطه با این مبحث در سطح کشور و هزینه های سنگین اجرای طرح های معماری سازمانی، اکثر سازمان ها از مزایای این ابزار بهره¬ای نمی برند. از جمله فعالیت هایی که می توان در راستای کمک به سازمان ها جهت بهره برداری مناسب از معماری سازمانی کرد، تدوین معماری های مرجع مختص صنعتی خاص می باشد. معماری های مرجع عناصر ایده¬آل جهت یک صنعت خاص را در قالبی استاندارد ارائه می دهند. هر سازمان می تواند با صرف حداقل منابع، معماری مرجع مختص حوزه فعالیت خود را سفارشی سازی نماید و از مزایای آن بهره بگیرد. در این پایان¬نامه هدف ما این است تا با تدوین طرح معماری سازمانی سرویس¬گرای مرجع جهت دانشگاه های آموزش الکترونیکی ایران مبتنی بر چارچوب توگف، خط¬مشی مشخصی را برای دانشگاه های آموزش الکترونیکی ایران ایجاد نماییم. دانشگاه های آموزش الکترونیکی می توانند با استفاده از عناصر این معماری، با حداقل منابع نیازهای خود را به بهترین نحو مرتفع نمایند. علاوه بر این، معماری پیشنهادی پایه¬ای را برای ایجاد معماری های مرجع جهت سایر صنایع ایجاد می نماید. در گام آخر با اجرایی سازی برخی از قسمت های اصلی معماری پیشنهادی در دانشکده آموزش های الکترونیکی دانشگاه شیراز و ارزیابی آنها با استفاده از روش دلفی، کارایی معماری پیشنهادی مورد سنجش قرار گرفت. نتایج حاصل از ارزیابی ها نمایانگر کارایی بالای معماری مرجع پیشنهادی می باشند.
راحله بهشتی نژاد علی حمزه
ما در زندگی خود برای خرید مواردی همانند کتاب، فیلم، cd، موسیقی و دیگر موارد به پیشنهادهای دیگران که به صورت شفاهی و یا نوشتاری ارائه می شوند، اعتماد می کنیم و در تصمیمات خود از آن ها بهره می بریم. امروزه با پیشرفت فنّاوری و گسترش کسب و کار الکترونیکی در بستر وب سایت های اینترنتی، مبحثی تحت عنوان سیستم های توصیه گر مطرح شده است و مهم ترین هدف در این سیستم ها، جذب مشتریان و جلب اعتماد آن ها از طریق ارائه بهترین و مناسب ترین پیشنهاد خرید محصولات، با توجه به علایق و سلایق آن ها می باشد. در این پژوهش سعی گردیده است، به کمک ارتباطات موجود در هستان شناسی dbpedia، اطلاعاتی در ارتباط با دامنه فیلم استخراج گردد. سپس ساختار سیستم توصیه گر طراحی می شود و به کمک اطلاعات موجود بر روی پایگاه داده movielens، عملکرد سیستم توصیه گر مورد ارزیابی قرار می گیرد. در این پایان نامه سعی خواهیم نمود تا پس از بیان توضیحات و مروری جامع بر سیستم های توصیه گر، روشی پیشنهادی مبتنی بر فواید استفاده از پایگاه داده های مبتنی بر وب معنایی، همراه با پیاده سازی و نتایج حاصل از آن، در مقایسه با دیگر روش های موجود ارائه گردد. طرح حاضر در میان سایر روش هایی که به نحوی از وب معنایی بهره می برند، از کارایی بالاتری برخوردار است.
حمید توزنده جانی فرشاد خون جوش
مطالعه امکان طراحی یک سیستم هوشمند پیش بینی و هشدار سیلاب در محدوده رودخانه و سد استقلال میناب خواهد بود
محمدباقر ملک حسینی رضا فرهی مقدم
چکیده ندارد.
ستار هاشمی محمدرضا کنگاوری
درخت تصمیم یکی از روشهای نمایش دانش بوسیله یادگیرنده های استقرایی می باشد که طی بیست سال گذشته مورد توجه بوده است. استقرا درخت تصمیم در محیط های مغشوش شامل دو مرحله توسعه درخت و هرس آن می باشد که ره کدام نقش به سزایی در افزایش دقت درخت تصمیم نهایی ایفا می کند. اخیرا استفاده از ضردازش موازی به منظور توسعه درخت تصمیم مطرح شده است که زمان یادگیری بر روی مجموعه هایآموزشی بزرگ را کاهش می دهد. در این پایان نامه یک روش جدید موازی سازی در سطح گره جهت توسعه درخت پیشنهاد شده است ک با استفاده از ترکیب چندین روش یادگیری بصورت موازی سعی در بهبود دقت درخت حاصله دارد. در این روش ابتدا مجموعه آموزشی به صورت تصادفی به چند قسمت همپوشان تسیم شده و هر قسمت در اختیار یک پردازنده قرار میگیرد. پردازنده ها پس از انجام عمل یادگیری در هر گره، نتایج را در اختیار پردازنده دیگری (ناظر) قرار میدهد، این پردازنده با استفاده از دو مدل فازی و کرامر، درخت نهایی را تولید می کند. در صورتیکه تعداد نمونه های مجموعه آموزشی کم نبوده و توزیع کلاسها و خصیصه ها در آن یکنواخت باشد، دقت درخت مورد نظر بهبود می یابد.