نام پژوهشگر: محمد صنیعی آباده
هادی شکیبیان نصرالله مقدم چرکری
استخراج الگوی نهفته داده ها در یک شبکه حسگر، تمرکز اصلی این پژوهش است. توزیع شدگی داده ها و منابع محاسباتی در سطح گره ها، در کنار محدودیت های منبع تغذیه و پهنای باند ارتباطی، از اصلی ترین چالش های فراروی این پژوهش اند. هر چند در علم یادگیری ماشین و داده کاوی رویکردهای شناخته شده ای برای این منظور وجود دارند، اما ماهیت متمرکز و پیچیدگی محاسباتی، استفاده مستقیم آنها در شبکه های حسگر را دشوار می کنند. رویکرد کشف الگوی داده ها با دیدگاه بهینه سازی راه حل مناسبی را پیشنهاد می کند که در آن، مسئله یادگیری مدل داده ها به یک مسئله بهینه سازی تبدیل می شود. به این ترتیب فرصت بکارگیری رویکردهای مختلف بهینه سازی با هدف مدل کردن داده ها در محیط شبکه های حسگر فراهم می شود. رویکردهای افزایشی مبتنی بر گرادیان و nelder-mead simplex، با دیدگاه بهینه سازی فوق و در یک رَویه گره به گره به یادگیری مدل داده ها می پردازند. دقت پایین این رویکردها در مقایسه با روش متمرکز و میزان تاخیر ساخت مدل، مشکل مشترک آنها و انگیزه ارائه این پژوهش هستند. شالوده راهکارهای پیشنهادی بر محاسبات تکاملی استوار است. بنابراین میزان مصرف انرژی جدی ترین چالشی است که در کنار اهداف فوق باید به دقت مورد بررسی قرار گیرد. از میان الگوریتم های تکاملی، روش بهینه سازی ذرات، با توجه به مدیریت بهتر آن در محیط های توزیع شده به عنوان پایه رویکرد پیشنهادی قرار داده شده است. با بهره گیری از مفاهیم بهینه سازی چندهدفی مسئله رگراسیون توزیع شده در قالب یک مسئله چندهدفه مدل شده و روش dvep روی مسیر هامیلتونی، به مانند دیگر روش های افزایشی، به یادگیری مدل داده ها می پردازد که به لطف استفاده از یک الگوریتم تکاملی، با پویش بهتر فضای جستجو به دقت بالاتری دست می یابد. با اجرای درون خوشه ای روش فوق، روش idvep ارائه می شود که بدلیل حضور همزمان بیش از یک مدل کاندید، دقت نهایی به میزان قابل ملاحظه ای بهبود می یابد. با حذف مسیر سریال بین گره ها، روش dp ارائه می شود که در دو گام عمده، یادگیری مدل خوشه ها و ترکیب آنها، رگراسور شبکه را بدست می آورد. با شناسایی نقاط ضعف روش dp، بهبودهایی در هر مورد پیشنهاد می شود. سپس با هدف حذف مهاجرتهای صریح ذرات، که یکی از چالشهای روش dp است، با بهره گیری از خصوصیات ویژه الگوریتم جستجوی هارمونی، مکانیزم هارمونیک مدیریت ذرات معرفی و روش hdp ارائه می شود. مکانیزم فوق، کاهش چشمگیر تعداد گامهای مهاجرت ذرات و پیامد آن مصرف انرژی را موجب می شود. در نهایت با بکارگیری و تطبیق تکنیک boosting، افت دقت مدل که حاصل شبیه سازی متمرکز عملکرد مکانیزم مهاجرت ذرات است، مدلی تقویت شده توسط روش bhdp بدست می آید. تمامی روش های ارائه شده در این پژوهش با روشهای افزایشی مبتنی بر گرادیان، سیمپلکس و متمرکز بر اساس دقت پیش بینی، تاخیر، میزان انرژی مصرفی، و تحمل پذیری خرابی مورد مقایسه قرار گرفته اند. به این منظور از داده های دو شبکه واقعی و مصنوعی، در مجموع سه مجموع? آموزشی، استفاده شده است. محیط توزیع شده و خصوصیات خاص شبکه های حسگر موجب می شود ارضاء همزمان معیارهای ارزیابی توسط هیچ یک از روش ها امکان پذیر نباشد. از اینرو انتخاب هر یک از روش های پیشنهادی بستگی به کاربرد و درجه اهمیت هر یک از معیارها از دید کاربر نهایی شبکه دارد.
احسان کمالو محمد صنیعی آباده
بانک ها و موسسات مالی و اعتباری با اعطای تسهیلاتی از قبیل وام و اعتبار در اختیار مشتریان خود با ریسک هایی از جمله عدم پرداخت سر موعد مشتری و کاهش نقدینگی مواجه هستند. پیش بینی این ریسک ها قبل از اعطای تسهیلات برای بانک ها از اهمیت ویژه ای برخوردار است. به این گونه تصمیم گیری ها اعتبارسنجی گفته می شود. اطلاعات لازم برای چنین تصمیم گیری هایی به سابقه ی مالی مشتری، وضعیت جاری وی و ریسک های کنونی بانک بستگی دارد. امروزه افزایش مشتریان بانک از یک طرف و افزایش سرویس های بانکی از طرف دیگر سنجش دستی اعتبار را تقریباً غیرممکن ساخته است. در این پژوهش یک دسته بند فازی برای حل مسأله ی اعتبارسنجی ارائه شده است. در این دسته بند، دانش خروجی به صورت قوانین فازی نمایش داده می شود. توانایی سیستم های فازی در مدل کردن ابهام و قابل تفسیر بودن دانش خروجی کمک می کند تا راهکار پیشنهادی توسط متخصصان رشته ی مالی قابل فهم باشد. اما مفهوم قابلیت تفسیر و کارایی با یکدیگر نسبت عکس دارند که یکی از چالش های این پژوهش می باشد. یک سیستم فازی متشکل از مولفه های مبدل فازی، یادگیرنده ی قانون و مفسر فازی می باشد. راهکار پیشنهادی در مبدل فازی ویژگی های مجموعه ی داده ای را برای سادگی نرمال می کند. مولفه ی یادگیرنده ی قانون از سیستم ایمنی مصنوعی برای استخراج قانون بهره می برد. سیستم ایمنی مصنوعی، روشی برگرفته از سیستم ایمنی بدن انسان می باشد. مزیت اصلی سیستم ایمنی در نرخ بالای جهش است که قدرت اکتشاف الگوریتم را افزایش می دهد. برای اندازه گیری میزان پیوند آنتی بادی-آنتی ژن، توابع نوینی بکار گرفته شده است که علاوه بر کارایی، قابلیت تفسیر را نیز بهبود می بخشند. برای موازنه ی میان اکتشاف و استخراج از مدل های جدید حافظه ی ایمنی برای یادآوری جهش های موفق استفاده می شود. مدل های حافظه ای ارائه شده، احتمال انتخاب یک ویژگی را حین جهش دستکاری می کنند. برای مقابله با عدم تقارن ویژگی ها در مجموعه ی داده ای، مراحل کمکی به الگوریتم اصلی اضافه می شوند که قوانین را با استفاده از توابع عضویت چندگانه و قیدهای فازی اصلاح می نمایند. در مولفه ی مفسر فازی، در کنار روش تک قانون برنده، روش شبیه ترین قانون ارائه شده است. نتایج ارزیابی روی مجموعه های داده ای اعتباری نشان می دهد که راهکار پیشنهادی توانسته است چالش قابلیت تفسیر و کارایی را حل کند. از نظر کارایی به مقدار 90.72 درصد در مجموعه ی استرالیا و 80.1 درصد در مجموعه ی آلمان رسیده است که قابل رقابت با سایر پژوهش های این حوزه می باشد و از لحاظ قابلیت تفسیر نیز به نتایج قابل قبولی در میان الگوریتم های اعتبارسنجی که تاکنون ارائه شده، دست یافته است.
هادی کثیری حمیدرضا مومنی
توربین های بادی کلاس مگاوات در مزارع بادی معمولا در سرعت های متغیر می چرخند. بنابراین برای رسیدن به ماکزیمم بازدهی تبدیل در نرخ سرعت پایین و کاهش اثر بار بر روی سیستم متحرک، باید عملکرد توربین کنترل شود. علاوه براین محققان توجه ویژه ای به کنترل زاویه پیچ برای مدیریت انرژی تولیدی در نرخ سرعت های بالا و پایین باد دارند. در این تحقیق تغییرات گسترده ی باد توسط شبکه عصبی درک کننده چندلایه و تابع بنیادی شعاعی مورد بررسی قرار گرفته است. در نتیجه این روش های پیشنهادی به صورت بهینه ای با تنظیم زاویه خمش قدرت خروجی را مدیریت می کند، سپس یک سیستم فازی ژنتیک جدید به صورت موفقیت آمیزی برای شناسایی اغتشاش در ورودی توربین بادی بکار برده شده است. بعد قوانین فازی با موفقیت از شبکه عصبی توسط یک سیستم فازی ژنتیک جدید استخراج شده است. این روش اغتشاش باد را با تولید زاویه پیچ مناسب در ورودی توربین بادی دفع م کند. در پایان نیز طرح جدیدی ارائه شده که بر مشکل اغتشاش باد بر اساس کنترلگر ژنتیک فازی که پایگاه دانش فازی به صورت خودکار با الگوریتم ژنتیک تنظیم می شود غلبه می کند که این کنترلگر به سیستم فازی ژنتیک تنظیم شده شناخته میشود. پاسخ ها مشخص می کنند که روش های پیشنهادی از بهترین و جدیدترین روش ها در کنترل توربین در هنگام اغتشاش باد میباشد.
مصطفی فتحی گنجی محمد صنیعی آباده
دیابت یکی از بیماری های رایج در جوامع امروزی است که دارای عوارض خطرناکی می باشد. این بیماری اگر چه گونه ای از بیماری های قلبی محسوب نمی شود ولی اغلب سبب بیماری های قلبی می شود. شخص زمانی به بیماری دیابت مبتلا می شود که بدن قادر به تامین انسولین مورد نیاز برای موازنه کردن گلوکز خون نباشد یا سلول های بدن توان استفاده از انسولین تولید شده را نداشته باشند.تشخیص بیماری دیابت و یا آگاهی یافتن از احتمال بالای ابتلاء به این بیماری همواره کار آسانی نخواهد بود. چرا که این بیماری علائم متعددی را بروز می-دهد که بعضی از این علائم در سایر بیماری ها نیز وجود دارند. بنابراین پزشک برای اتخاذ یک تصمیم مناسب، باید نتیجه ی آزمایش های بیمار و تصمیم های که در گذشته برای بیماران با وضیعت مشابه گرفته است، را بررسی کند. با توجه به حجم انبوه تعداد بیماران، می توان از یک ابزار داده کاوی برای شناخت الگوی بیماران قبلی استفاده کرد. در این پایان نامه قصد داریم از یک الگوریتم دسته بندی مبتنی بر قانون برای دسته بندی بیماران دیابتی استفاده کنیم. برای استخراج قوانین فازی از یک الگوریتم کلونی مورچه ها استفاده شده است. این الگوریتم دارای ویژگی-هایی است که آن را از سایر الگوریتم مورد استفاده متمایز می کند. از جمله ی این ویژگی ها می توان به تابع به روز رسانی جدید، استفاده از تابع آنتروپی برای اندازه گیری اطلاعات اکتشافی و مقادیر بی اهمیت، پیاده سازی نسخه ی موازی الگوریتم و روال هرس کردن جدید اشاره کرد. به منظور دسته بندی نمونه های آزمون نیز یک موتور استنتاج فازی مبتنی بر میانگین گیری پیشنهاد شده است. برای ارزیابی کارایی الگوریتم از دو مجموعه داده ی دیابت شده است. نتایج ارزیابی ها نشان می دهد که الگوریتم برای مجموعه داده ی دیابت دارای کارایی بسیار بالایی می باشد. همچنین کارایی الگوریتم پیشنهادی با چندین مجموعه داده ی پزشکی دیگر ارزیابی شده است که نتایج به دست آمده برای این مجموعه داده ها نیز بسیار مناسب می باشد.
محمد حسین زنگویی سعید جلیلی
مولکول پروتئین زنجیره خطی از اسید آمینه ها است. پیش بینی ساختارهای پروتئین از جمله مسائل چالش برانگیزی است که در طی 35 سال گذشته محققان بسیاری در سراسر دنیا در این زمینه تحقیق کرده اند. اکثر ساختار و عملکرد سلول ها توسط پروتئین ها تعیین می شوند. عملکرد یک پروتئین توسط ساختار آن تعیین می شود. اما به دست آوردن و تعیین ساختار پروتئین کاری مشکل می باشد. برای به دست آوردن ساختار پروتئین از روی دنباله اسید های آمینه آن نیاز به روش های محاسباتی سنگینی می باشد. امروزه به کارگیری علوم مهندسی برای حل مسائل حوزه علوم زیستی و پزشکی به سرعت و با موفقیت رو به افزایش است، بنابراین بسیاری از دانشمندان علوم کامپیوتر به این سمت گرایش پیدا کرده اند تا بتوانند از روش های مختلف یادگیری ماشین در پیاده سازی سیستم های خودکار هوشمند به منظور دسته بندی پروتئین ها کمک بگیرند. هدف نهایی در ساخت این سیستم ها، نزدیک بودن هر چه بیشتر تصمیم اتخاذ شده توسط ماشین به تصمیم فرد خبره زیست شناس می باشد. دقت روش های یادگیری ماشین برای پیش بینی ساختار دوم و سوم (تاخوردگی) پروتئین به ترتیب حدود 80% و 60% می باشد و محققان در تلاش هستند که بتوانند با استفاده از روش های یادگیری ماشین این دقت را افزایش دهند. در این پژوهش ابتدا به بررسی ساختار دوم و تاخوردگی پروتئین پرداخته و سپس با استفاده از چندین روش مبتنی بر روش های یادگیری ماشین (ماشین بردار پشتیبان، شبکه عصبی و c4.5)، تلاش کردیم ساختارهای پروتئین را با دقت قابل قبولی پیش بینی کنیم. با بهینه سازی پارامتر های ماشین بردار پشتیبان و ترکیب کرنل های آن، دقت پیش بینی ساختار دوم پروتئین در مقایسه با سایر روش ها حدود 2% بهبود داشت. همچنین در ساختار سوم پروتئین با بهبود روش های بردار پشتیبان و شبکه های عصبی و سپس ترکیب این دو روش، دقت یادگیری نسبت به سایر روش ها حدود 3% بهبود یافت.
ستار مهدوری سید رحمان ترابی
چکیده معمولاً پیش بینی پایداری در فضاهای زیرزمینی، از طریق ارزیابی تغییرات تنش و کنترل جابه جایی های پیرامون سازه انجام می شود. جابه جایی دیواره ها و سقف یا همگرایی، تأثیر زیادی بر روی پایداری فضاهای زیرزمینی در طول حفاری و حتی پس از آن دارد؛ به طوری که یکی از پارامترهای مفید برای ارزیابی فشار اعمالی به سیستم نگهداری محسوب می شود. همچنین با ثبت تغییراتِ نرخ همگرایی و کنترل آن، از بروز ناپایداری در طول عملیات حفاری جلوگیری می شود. بنابراین با پیش بینی همگرایی در طول عملیات حفاری و پس از نصب سیستم نگهداری می توان پایداری فضاهای زیرزمینی را پیش بینی نمود. همگرایی از طریق کنترل رفتار وابسته به زمان توده سنگ و ثبت تاریخچه تغییرات جابه جاییِ سقف و دیواره ها، در طول حفاری و پس از آن محاسبه می شود. امروزه تونل ها به عنوان یکی از فضاهای زیرزمینی، برای کاربردهای مختلفی در سراسر جهان حفاری می شوند. در حفاری تونل به روش مکانیزه، همگرایی بیش از حد، سبب گیرکردن ماشین حفاری شده و این پدیده نرخ پیشروی را کاهش داده و با توقف عملیات حفاری، سبب افزایش هزینه ها می شود. در این تحقیق کاربرد روش های عددی و یادگیری ماشین در پیش بینی همگرایی در تونل انتقال آب قمرود بررسی شده است. تونل قمرود بخشی از سیستم انتقال آب از سرشاخه های دز به سد گلپایگان بوده و حد فاصل شهرهای الیگودرز و گلپایگان حفاری شده است. محدوده مورد مطالعه در زون سنندج-سیرجان واقع شده و به علت وجود گسل ها و چین خوردگی های متقارن، مقاومت توده سنگ های منطقه عمدتاً ضعیف می باشد. در این تونل ماشین حفاری چندین بار در اثر همگرایی تونل و ناپایداری دیواره ها در شرایط نامناسب زمین گیر کرده و سبب توقف عملیات حفاری شده است. برای پیش بینی همگرایی در این تونل، از دو روش یادگیری ماشین به نام های شبکه های عصبی پرسپترون چند لایه و رگرسیون بردار پشتیبان استفاده شده است. به این ترتیب که با استفاده از این دو الگوریتم رابطه غیرخطی بین همگرایی به عنوان متغیر وابسته و پارامترهای ژئومکانیکی به عنوان متغیر مستقل تخمین زده شده است. به طور همزمان، حداکثر بردار جابه جایی در مقاطع مختلف این تونل با استفاده از روش عددی تفاضل محدود (نرم افزار flac) محاسبه شده و نتایج حاصل با روش های یادگیری ماشین مقایسه شده است. طبق نتایج حاصل از این تحقیق، همگرایی پیش بینی شده با روش های یادگیری ماشین همخوانی زیادی با مقادیر واقعی نشان می دهد. در روش های عددی به علت ساده سازی های زیاد و عدم استفاده از اطلاعات زمین شناسی، نتایج حاصل دقت کمی داشته و حتی در برخی مقاطع همگرایی پیش بینی شده با مقادیر واقعی اختلاف زیادی داشته است. همچنین روش های یادگیری ماشین محدودیت های روش های عددی را نداشته و علاوه بر تونل ها، توانایی پیش بینی همگرایی در سایر فضاهای زیرزمینی از جمله معادن زیرزمینی، مغارها و غیره را نیز دارا می باشند.
عباس ذیبخش شبگاهی محمد صنیعی آباده
یکی از بیماری های شایع در جوامع امروزی، سرطان است. تشخیص و درمان سریع آن اهمیت حیاتی دارد و شناسایی افراد در معرض ابتلاء، یکی از اهداف مهم در تحقیقات سرطان است. تشخیص بیماری سرطان همواره کار آسانی نیست. اخیراً داده های توصیف ژنی برای تشخیص بیماری سرطان بکار گرفته شده اند که این نوع داده ها از آزمایشات میکروآرایه استخراج می شوند. تعداد زیاد ژن ها و تعداد نمونه های کم بدلیل محدودیت در انجام آزمایشات، موجب پیچیدگی استخراج دانش از این نوع مجموعه داده ها شده است. در این پژوهش یک دسته بند فازی برای حل مسأله ی تشخیص بیماری سرطان مبتنی بر داده های توصیف ژنی ارائه شده است. در این دسته بند، دانش خروجی به صورت قوانین فازی نمایش داده می شود. توانایی سیستم های فازی در مدل کردن ابهام و قابل تفسیر بودن دانش خروجی کمک می کند تا راهکار پیشنهادی توسط متخصصان پزشکی قابل فهم باشد. اما مفهوم قابلیت تفسیر و کارایی با یکدیگر نسبت عکس دارند که یکی از چالش های این پژوهش می باشد. یک سیستم فازی متشکل از مولفه های مبدل فازی، یادگیرنده ی قانون و مفسر فازی می باشد. در مبدل فازی ویژگی های مجموعه داده ای برای سادگی نرمال می شوند. مولفه ی یادگیرنده ی قانون از الگوریتم مِمِتیک برای استخراج قانون بهره می برد. الگوریتم های ممتیک مشابه با الگوریتم های ژنتیک هستند با این تفاوت که جستجوی محلی قدرت اکتشاف الگوریتم را افزایش می دهد. در مولفه ی مفسر فازی، به منظور دسته بندی نمونه های آزمون روش استنتاج مبتنی بر معیار شباهت پیشنهاد شده است. نتایج ارزیابی روی مجموعه داده ی تومورهای سرطانی نشان می دهد که راهکار پیشنهادی توانسته است مصالحه ای قابل قبول میان قابلیت تفسیر و کارایی برقرار کند. نتایج ارزیابی ها نشان می دهد که الگوریتم دارای کارایی قابل قبولی بر روی مجموعه داده فوق بوده و از لحاظ قابلیت تفسیر نیز قابل رقابت با روش های تفسیر پذیر می باشد.
مجتبی علاء محمد صنیعی آباده
کاوش قوانین وابستگی یک تکنیک مهم در داده کاوی است که در آن یافتن الگوهای تکراری، یک مرحله بسیار زمان بر و پر هزینه به شمار می رود. در این تحقیق یک روش جدید برای یافتن الگوهای تکراری بر روی داده هایی که مقادیر آن ها به شکل نوسانی (افزایش، کاهش یا بدون تغییر) هستند مانند داده های تغییرات قیمت سهام در بورس اوراق بهادار ارائه می شود. در این روش، فقط تعداد کمی از تکرار مجموعه عناصر از پایگاه داده جستجو می شود و تکرار بقیه مجموعه عناصر به کمک تکرار مجموعه عناصر بدست آمده و روابط پیدا شده بین تکرار آن ها محاسبه می شود. بدین ترتیب نیاز به کاوش کل الگوهای تکراری از پایگاه داده نیست. این امر باعث صرف زمان بسیار کمتری برای یافتن الگوهای تکراری و در نهایت یافتن قوانین وابستگی می شود. با توجه به نکات یاد شده، در این تحقیق با پیاده سازی الگوریتم fp-math (مخفف frequent patterns-math) کارایی آن بر روی داده های واقعی بورس تهران بررسی و نشان داده می شود. همچنین نتایج آزمایشات نشان می دهد الگوریتم fp-math در مقایسه با الگوریتم های پیشین مانند الگوریتم apriori، که یکی از مشهورترین و پر کاربردترین آن ها در این زمینه است، تقریباً سه برابر سریع تر اجرا می شود. در مجموع، بهره گیری از الگوریتم پیشنهادی توانست الگوهای تکراری و قوانین وابستگی جالبی را از داده های بورس اوراق بهادار تهران استخراج نماید.
حمید صابری محمد صنیعی آباده
امتیاز دهی اعتباری ، نظامی است که به وسیله آن بانک ها و موسسات اعتباری با استفاده از اطلاعات حال و گذشته متقاضی ، احتمال عدم بازپرداخت وام توسط وی را ارزیابی نموده و به او امتیاز می دهند. مدل های اعتبار سنجی متداول یا مدل های ارزیابی اعتبار، متقاضیان دریافت اعتبار را بر اساس فاکتور های مالی به دو گروه "وام گیرنده های خوش حساب" یعنی کسانی که توانایی پذیرش مسئولیت ها و تعهدات مالی را دارند و "وام گیرنده های بدحساب" یعنی کسانی که درآن ها احتمال نقض تعهدات مالی بسیار است، تقسیم بندی می کنند. امتیاز دهی اعتباری یک تکنیک تحلیلی برای ارزیابی ریسک می باشد. ریسک اعتباری مهم ترین ریسکی است که بانک ها و موسسات مالی با آن مواجه می باشند. حجم قابل ملاحظه ای از تسهیلات اعطایی سوخت شده یا معوقه بانک ها ، گویای فقدان مدل های مناسب اندازه گیری ریسک اعتباری و سیستم های مدیریت ریسک در شبکه های بانکی است . یکی از مهمترین ابزارهایی که بانک ها برای مدیریت و کنترل ریسک اعتباری بدان نیازمند می باشند، سیستم رتبه بندی اعتباری مشتریان است. با رشد بسیار زیاد داده ها و تجربیات خصوصا در دو دهه گذشته در صنعت مالی و اعتباری و نیز با بالا رفتن تعداد ومیزان پتانسیل افراد متقاضی، نیاز به توسعه مدل های کامل تر و پیچیده تر بیشتر نمایان شده است به طوری که بتوان رویه های اعطای اعتبارات را به صورت خودکار انجام داد و سلامت مالی افراد را نظارت کرد. از آنجا که یک افزایش دقت در تشخیص مشتریان حتی به اندازه درصدی کوچک ممکن است منجر به حفظ و ذخیره حجم عظیم منابع و منافع مالی شود، لذا باید مدل های کاملتر و خبره تری در این زمینه ارائه شوند تا به افزایش دقت در مدل های اعتبار سنجی بپردازند. در این پایان نامه یک مدل اعتبار سنجی ترکیبی از الگوریتم آدابوست و درخت تصمیم پیشنهاد داده شده است. در این مدل چندین درخت تصمیم به عنوان یادگیر های اولیه و ضعیف با هم تجمیع می شوند و یک درخت (دسته بند) و احد و قوی را تشکیل می دهند .آدابوست با توجه به توانایی دسته بندی هر درخت و نیز میزان توانایی هر درخت در تقویت نقاط ضعف درختان قبلی در تشخیص نمونه ها به هریک از درختان تصمیم یک ضریب وزنی اختصاص می دهد و این فرایند را به صورت ترتیبی انجام می دهد. دسته بند ایجاد شده بر اساس ضرایب وزنی درختان تصمیم سازنده آن به پیش بینی نمونه های جدید می پردازد.در واقع تمرکز الگوریتم آدابوست برروی انتخاب درختانی است که بهتر بتوانند نمونه هایی را که درختان تصمیم قبلی در مورد آن ها دقت کمتری داشته اند را دسته بندی کنند و به این ترتیب باعث افزایش دقت ، پایداری و کاهش overfitting نسبت به یادگیرهای اولیه می شوند.توانایی این مدل ترکیبی توسط معیارهای ارزیابی مانند نرخ دقت ، نرخ صحت ، نرخ اختصاصی، منحنی ( roc) و سطح زیر منحنی (auc) مورد سنجش قرار گرفته است. برای ارزیابی مدل از دو مجموعه داده ی اعتباری واقعی آلمان و استرالیا استفاده شده است . در راستای ارائه مدل پیشنهادی ، یک نرم افزار مبتنی بر زبان c# و پایگاه داده sqlserver طراحی و پیاده سازی شده است و تمامی الگوریتم ارزیابی در این نرم افزار فراهم آورده شده است. هم چنین این نرم افزار امکان ساخت هزار درخت تصمیم را فراهم آورده است .نتایج پیاده سازی نشان می دهد که مدل ترکیبی پیشنهادی، دقت طبقه بندی و کارایی بسیار بالاتری نسبت به اکثر الگوریتم های اعتبار سنجی مورد مقایسه در این تحقیق چه در حالت تک الگوریتم و چه به صورت ترکیبی دارد. مدل پیشنهادی به غیر از داده های اعتباری بر روی داده های مانند داده های پزشکی و مالی مورد ارزیابی قرار گرفته است. نتایج بدست آمده نشان می دهد نه تنها الگوریتم مورد نظر دارای توانایی و دقت بسیار زیاد در دسته بندی داده های اعتباری است بلکه داده های دیگر را نیز با دقت بسیار بالایی طبقه بندی می کند.
جاوید ابراهیمی محمد صنیعی آباده
با گسترش روز افزودن داده های متنی ، بدست آوردن اطلاعات مورد نظر مسئله اساسی در عصر اینترنت است. برای تطبیق با این مسئله فناوریهای جدید که قادر به پردازش داده های حجیم بصورت موثر هستند مورد نیاز است. خلاصه سازهای خودکار یکی از ابزارهای مهم در این راستاست که در حوزه های گوناگون مثل اسناد پزشکی ، مقالات علمی و آرشیو اخبار مورد استفاده قرار می گیرد. این پایان نامه به خلاصه سازی چند سندی در زبان انگلیسی می پردازد که در آن مجموعه ای از اخبار بهم مرتبط به عنوان ورودی دریافت می شود و تعدادی جمله به صورت فشرده به عنوان خروجی تحویل داده می شود.. در حالیکه اغلب رویکردهای موجود ، جملات را انتخاب کرده و سپس افزونگی را بصورت حریصانه حذف می کنند، اخیرا رویکردهای مبتنی بر بهینه سازی در تعیین کیفیت خلاصه بصورت کلی و بهره گیری از ویژگیهای جمعی جملات موثر واقع شده اند. در برخی از این روشها ، خلاصه سازی به یک مسئله بهینه سازی p-median تبدیل می شود. ما نشان میدهیم که این تقریب نادقیق است و برای رفع مشکل آن یک تابع بهینه سازی فازی جدید معرفی می کنیم که از اطلاعات موجود در خوشه های جملات مرتبط یا همان موضوعات ، استفاده می کند. برای این مقصود یک الگوریتم خوشه بندی مبتنی بر گراف معرفی می شود که خروجی آن یک ماتریس عضویت فازی است که میزان تعلق هر جمله به موضوعات درمتن را مشخص می نماید. برای بهینه سازی تابع هدف از یک الگوریتم ژنتیکی استفاده شده است که به کمک عملگرهای هوشمند بهبود یافته است و برای ارزیابی کار از مجموعه داده های duc2001 و duc2004 استفاده شده است. رویکرد ما در معیار rouge-1 بر روی این داده ها به ترتیب به دقت 0.36389 و 0.39826 می رسد.
داوود عبداله زاده نصراله مقدم چرکری
امروزه با فراگیر شدن اینترنت و دسترسی آسان وسایل ضبط تصاویر رقمی، حجم تصاویر رقمی به شدت افزایش پیدا کرده است و در حال رشد است. بنابراین چگونگی بازیابی و جستجوی تصاویر مسئله ی مهمی است که تحقیقات زیادی در مورد آن انجام شده است. یک راه حل مناسب برای این مسئله حاشیه نویسی خودکار تصاویر است که در سال های اخیر مورد توجه بسیاری از محققان قرار گرفته است. حاشیه نویسی خودکار تصاویر فرایند انتساب خودکار کلمات به تصاویر است. در این پژوهش یک چارچوب بر مبنای روش های یادگیری ماشین برای این مسئله پیشنهاد کرده ایم. حاشیه نویسی خودکار تصاویر به عنوان یک مسئله ی دسته بندی چند برچسبی مدل شده است و با توسعه ی الگوریتم knn وزن دار و knn فازی به ترتیب دو دسته بند چند برچسبی dwml-knn و fuzzyml-knn ارائه شده است. خروجی این دسته بندها برای هر تصویر یک بردار امتیاز است که برای ترکیب دسته بندها مناسب است. همچنین این دسته بندها تصاویر مربوط به هر کلمه را رتبه بندی می کنند، همبستگی بین کلمات را نادیده نمی گیرند، نسبت به پارامتر k حساسیت کمی دارند و می توان برای کاربردهای دیگر دسته بندی چند برچسبی از آن ها استفاده کرد. در این پایان نامه بر آنیم تا از هر دو نوع ویژگی های محلی و سراسری به منظور بهره بردن از مزایای آن ها استفاده کنیم. بنابراین چندین بردار ویژگی شامل ویژگی های محلی و ویژگی های سراسری از تصاویر استخراج شده است. برای هر بردار ویژگی یک دسته بند استفاده شده و خروجی دسته بندها با هم ترکیب می شوند. همچنین برای حذف ویژگی های اضافی و بهبود کارایی روش، الگوریتم ژنتیک را برای انتخاب ویژگی بکار برده ایم. برای ارزیابی روش، دو مجموعه داده ی شناخته شده corel5k و iapr tc-12 انتخاب شده اند. در ارزیابی عملکرد حاشیه نویسی (معیار f1) روی مجموعه داده corel5k بهبودی نسبت به بهترین روش نداشته ایم و روی مجموعه داده iapr tc-12 ، 5 درصد بهبود حاصل شده است. همچنین از نظر کیفیت رتبه بندی تصاویر (معیار میانگین دقت متوسط) روی مجموعه داده corel5k و iapr tc-12 به ترتیب 9 و 38 درصد بهبود نسبت به بهترین روش حاصل شده است.
حمید مسعود سعید جلیلی
طراحی نرمافزارهای بزرگ، فعالیتی بسیار پیچیده و مشکل است. در واقع طراحی یکی از سختترین وظایف در فرآیند توسعه نرمافزار میباشد. محققین در فرآیند تولید نرم افزار به دنبال افزایش سطح خودکارسازی می باشند، دلیل این امر این است که خودکارسازی سبب می گردد تا انجام فرآیند طراحی بدون نیاز به طراحان متخصص صورت گیرد. خودکارسازی طراحی نرمافزار با روش های معمول رایج امکانپذیر نیست زیرا در طراحی با فضای جستجوی بزرگی شامل نمونههای مختلف طراحی روبرو هستیم. مهندسی نرم افزار مبتنی بر جستجو (sbse) به معنی کاربرد روش های جستجو در حل مسائل مهندسی نرم افزار است که استفاده از آن در زمینه طراحی نرم افزار، از دهه 2000 میلادی به صورت قابل توجهی آغاز شده است. روش های جستجوی مختلفی برای این منظور استفاده شده اند. در این پایان نامه برای اولین بار از روش جستجوی بهینه سازی گروه ذرات (pso) برای این منظور استفاده شده است. طراحی هر سیستم نرم افزاری شامل دو فاز است: طراحی معماری و طراحی تفصیلی عناصر معماری. در این پایان نامه دو مدل به منظور طراحی تفصیلی نرم افزار پیشنهاد شده است: مدل مبتنی بر بهینه سازی و مدل مبتنی بر خوشه بندی. ورودی هر دو مدل نیازمندی های سیستم در قالب موردهای کاربری و خروجی آن نمودار کلاس می باشد. مدل مبتنی بر بهینه سازی دارای سه مرحله اصلی است. در مرحله اول مسئولیت های سیستم در قالب متدها و خصیصه ها، و وابستگی های بین آنها جمع آوری می شوند، در این مرحله برخی راهنمایی ها و مکاشفه ها جهت استخراج مسئولیت های سیستم از سناریوهای موردهای کاربری پیشنهاد شده است. در مرحله دوم از الگوریتم pso به منظور تخصیص مسئولیت ها بین کلاس ها استفاده می گردد، برای این منظور یک الگوریتم جدید با نام الگوریتم ترکیبیاتی بهینه سازی گروه ذرات (cpso) پیشنهاد شده است. الگوریتم پیشنهادی قابلیت استفاده در سایر مسائل ترکیبیاتی را نیز دارد. در مرحله سوم روابط بین کلاس ها تنظیم می شود. برای استخراج روابط ار ث بری، یک روش نیمه خودکار جدید پیشنهاد شده است. این روش بر اساس حذف کد تکراری و بازخوردهای دریافتی از کاربر عمل کرده و سلسله مراتب های وراثت مخفی در ساختار سیستم را کشف می کند. مدل مبتنی بر خوشه بندی دارای چهار مرحله اصلی است. مراحل اول و آخر آن به ترتیب مرحله جمع آوری داده و مرحله تنظیم روابط می باشند که با مراحل اول و آخر مدل مبتنی بر بهینه سازی یکسان می باشند. در مرحله دوم از این مدل، برخی ویژگی ها با توجه به وابستگی های بین مسئولیت ها استخراج می شوند. در مرحله سوم، با استفاده از یک روش خوشه بندی، ویژگی های استخراجی خوشه بندی می شوند. خروجی این مرحله مجموعه ای از خوشه ها است که هر خوشه آن به عنوان یک کلاس از نمودار کلاس در نظر گرفته می شود. برای تخمین تعداد کلاس ها توسط روش خوشه بندی، دو معیار جدید پیشنهاد شده است. برای ارزیابی مدل های پیشنهادی از چهار سیستم به عنوان مورد مطالعه استفاده شده است: سیستم کشتیرانی، بازی مونوپول و دو سیستم خانه الکترونیکی. نتایج ارزیابی نشان می دهد که مدل مبتنی بر بهینه سازی از لحاظ طراحی نمودار کلاس با انسجام بالا و اتصال و پیچیدگی پایین موفق تر از مدل مبتنی بر خوشه بندی بوده است، در مقابل مدل مبتنی بر خوشه بندی نمودارهای کلاس نزدیک تری به نظر متخصص تولید کرده است.
هادی لفظی قاضی محمد صنیعی آباده
پیش بینی بازار سهام به عنوان یک کار پر چالش در حوزه پیش بینی سری های زمانی مالی در نظر گرفته شده است. علت مهم این امر عدم وجود قطعیت در نحوه حرکت بازار سهام می باشد. همچنین تحلیل داده های سری زمانی قیمت های سهام به علت غیر خطی بودن و وجود نویز زیاد مشکل می باشد. در این پژوهش از دو رویکرد متفاوت برای پیش بینی کوتاه مدت بازار سهام استفاده شده است. در رویکرد اول هدف این است که با استفاده از قوانین انجمنی میان تراکنشی یک دسته بند انجمنی ساخته شود تا به پیش بینی حرکت آینده قیمت سهام های مختلف بپردازد. در این رویکرد با استفاده از ضریب همبستگی با تأخیر زمانی میان دو شرکت تنها شرکت هایی در فرایند پیش بینی شرکت می کنند که ضریب همبستگی آن ها از حد معینی بیشتر باشد. همچنین با استفاده از دو شاخص تکنیکی، اثر گذشته قیمت هر سهام را بر آینده قیمت آن در نظر می گیریم. با استفاده از معیار فاصله اقلیدسی میان دو زیر دنباله الگوریتم ارائه شده این قابلیت را دارد که بر اساس میزان فاصله اقلیدسی بین دو زیر دنباله وزن متفاوتی برای تراکنش ها در نظر بگیرید. در رویکرد دوم هدف استخراج قوانین انجمنی میان تراکنشی با استفاده از قیمت های مختلف یک سهام می باشد. در این رویکرد ما از نظریه فازی به همراه نمودار شمعی برای استخراج قوانین انجمنی استفاده کرده ایم. همچنین با مدل کردن نمودار شمعی و سپس بدست آوردن الگو های تکرار شونده با استفاده از قوانین انجمنی میان تراکنشی به پیش بینی بازار سهام و مدیریت سبد سهام پرداخته ایم. معیار ارزیابی کارایی الگوریتم های ارائه شده میزان سود بدست آمده در دوره آزمایش می باشد. دو دیتاست متفاوت مورد مطالعه قرار گرفته اند که متعلق به بازار سهام ژاپن و آمریکا می باشند. نتایج بدست آمده نشان دهنده این است که الگوریتم های ارائه شده سود بیشتری را در مقایسه با استراتژی خرید و نگهداری و سایر روش ها بدست آورده اند.
آرش لرکی محمدی هدیه ساجدی
بهینه سازی توابعی از دسته مسائل np-hard، در سال های اخیر بسیار مورد توجه قرار گرفته است. بسیاری از مسائل بهینه سازی در مهندسی، پیچیده تر از آن هستند که با روش های مرسوم بهینه سازی نظیر روش های تحلیل ریاضی قابل حل باشند. بنابراین برای اینکه بتوان در فضای پیچیده اینگونه توابع، بهینه سراسری را یافت، بایستی از روش های ترکیبی یا فرامکاشفه ای استفاده کرد. در این پایان نامه دو روش بهینه سازی جدید ارائه می شود، بطوری که در روش laga، پارامتر های الگوریتم ژنتیک و در روش lakh، پارامتر های الگوریتم بهینه سازی گروه میگوها توسط اتوماتای یادگیر، به صورت بهینه تنظیم خواهد شد. ترکیب این روش ها که از الگوریتم های محاسبات نرم به شمار می روند، به روش هایی کارا برای حل مسائلی نظیر بهینه سازی تابع آزمون griewank، در شرایطی که تعداد ابعاد تابع بسیار بالا است، می انجامد. بدلیل اینکه پارامترهای الگوریتم ژنتیک و الگوریتم بهینه سازی گروه میگوها به دقت توسط اتوماتای یادگیر تنظیم می شوند، نسبت به زمانی که از روش های دیگر بهینه سازی استفاده می کنیم، به جواب بسیار بهتری دست پیدا می کنیم. برتری این دو روش ترکیبی، نسبت به سایر روش ها این است که از کارایی بالای اتوماتای یادگیر در محیط های تصادفی و ناشناخته و همچنین قابلیت بالای الگوریتم ژنتیک و الگوریتم بهینه سازی گروه میگوها در حل مسائل بهینه سازی، بهره می برد. نتیجه آزمایشات نشان می دهند که روش laga بهینه سراسری تابع griewank را در 100 بعد و روش lakh بهینه سراسری این تابع را در 200 بعد به طور دقیق می یابد. این در حالی است که سایر روش های بررسی شده در این پروژه، حداکثر در 20 یا 40 بعد، به صورت تقریبی موفق به بهینه سازی این تابع شده اند. روش های بهینه سازی ارائه شده در این پروژه، برای مسائل بهینه سازی تک هدفه و با محدودیت طراحی شده اند. در ضمن تابع هدف باید یک تابع ثابت باشد. برای تعمیم این روش ها به بهینه ساز توابع چند هدفه یا توابع بدون محدودیت و یا توابع پویا، با تغییراتی در اتوماتای یادگیر روش های پیشنهادی، می توان بهینه سازی را انجام داد.
فرید قره محمدی محمد صنیعی آباده
نهانکاوی تصاویر هنر و مهارت تشخیص تصاویر نهان نگاره از تصاویر پوشش یا میزبان براساس ویژگیهای استخراج شده می باشد. دو نوع روش نهانکاوی وجود دارد: نهانکاوی خصوصی و عمومی . نهانکاوی خصوصی براساس الگوریتمهای نهاننگاری ارائه شده است در حالی که نهانکاوی عمومی وابسته به الگوریتمهای نهاننگاری نمی باشد. در این پایاننامه تلاش شده است تا با استفاده از الگوریتم کلونی زنبور روشی برای نهانکاوی عمومی تصاویر ارائه شود. با توجه به اینکه موضوع این پایاننامه ترکیبی از دو حوزه داده کاوی و پردازش تصویر است تلاش شده است تا در هر دو حوزه نوآوری ارائه شود. بدین منظور از روش تکاملی جدیدی بنام کلونی زنبور برای بهبود نتایج روشهای پیشنهادی استفاده شده است. در حوزه داده کاوی مبتنی بر الگوریتم کلونی زنبور یک الگوریتم به نام ifab برای انتخاب بهترین مجموعه ویژگیها از میان ویژگیهای موجود پیشنهاد شده است تا مجموعهداده های جدیدی به ترتیب برای spam با80 ویژگی و cc-pev با 250 ویژگی ایجاد شود. در حوزه پردازش تصویر یک روش riab برای پیدا کردن بهترین منطقه تصویر برای نهانکاوی و استخراج ویژگیهای مورد نظر ارائه شده است. برای ارزیابی کارایی الگوریتم ها از چندین مجموعهداده تخصصی استفاده شده است. همچنین، دقت استخراج شده برای روش نهانکاوی spam توسط هر الگوریتم نسبت به دقت اولیه به ترتیب 08/8 درصد و 22/10 درصد بهبود ثبت شده است و همچنین برای روش نهانکاوی cc-pev توسط هر الگوریتم نسبت به دقت اولیه به ترتیب 06/4 و 14/5 درصد بهبود ثبت شده است.
دانیال جلال نوری محمد صنیعی آباده
امروزه با افزایش حجم اطلاعات تحقیقات فراوانی بر روی داده کاوی در بخش های مختلف انجام می شود و محققان از روش های متفاوت برای کاوش مجموعه داده ها استفاده می کنند. برخی محققان تلاش در طراحی روش هایی برای استخراج دانش از انواع متفاوت مجموعه های داده دارند. در مواردی حجم مجموعه داده بسیار بزرگ بوده و امکان استفاده از روش هایی که بر روی مجموعه داده های کوچک به درستی عمل می کند وجود ندارد. برای نمونه اخیراً داده های توصیف ژنی برای تشخیص بیماری سرطان بکار گرفته شده اند که این نوع داده ها از آزمایشات میکروآرایه استخراج می شوند. تعداد زیاد ژن ها و تعداد نمونه های کم به دلیل محدودیت در انجام آزمایشات، موجب پیچیدگی استخراج دانش از این نوع مجموعه داده ها شده است. در این پژوهش یک دسته بند فازی برای حل مسئله ی استخراج مجموعه قوانین به همراه برقراری موازنه میان دقت و تفسیرپذیری بر روی انواع مجموعه داده های بزرگ و کوچک ارائه شده است. در این دسته بند، دانش خروجی به صورت قوانین فازی نمایش داده می شود. توانایی سیستم های فازی در مدل کردن ابهام و قابل تفسیر بودن دانش خروجی کمک می کند تا راهکار پیشنهادی توسط متخصصان قابل فهم باشد. اما مفهوم قابلیت تفسیر و کارایی با یکدیگر نسبت عکس دارند که یکی از چالش های این پژوهش می باشد. یک سیستم فازی متشکل از مولفه های مبدل فازی، یادگیرنده ی قانون و مفسر فازی می باشد. در مبدل فازی ویژگی های مجموعه داده ای برای سادگی نرمال می شوند. مولفه ی یادگیرنده ی قانون از الگوریتم ژنتیک و رقابت استعماری در قالب یک الگوریتم ترکیبی برای استخراج قانون بهره می برد. در ارزیابی دقت 70.03 برای پایگاه داده 14_tumors و 85.38 بر روی pima به دست آمد که نشان می دهد راهکار پیشنهادی توانسته است به نتایج قابل قبولی در مقایسه با دیگر الگوریتم ها دست یابد.
اسامه حورانی نصر اله مقدم چرکری
تهیه نماد کروموزومی فرآیند آرایش تصاویر کروموزومی به یک فرم استاندارد جهت تشخیص بیماری ها و ناهنجاری های کروموزومی است. رویکرد تهیه نماد کروموزومی خودکار یک ابزار کمکی به متخصصان ژنتیکی است که در راستای صرفه جویی در زمان و متخصصان و حل مشکلات تهیه دستی نماد کروموزومی طراحی می شود. انجام این فرآیند بصورت سنتی در آزمایشگاه های پزشکی ژنتیکی زمان طولانی می برد، بطور مثال هر تست نماد کروموزومی حدود 3 روز طول می کشد. انواع مختلفی از تصاویر کروموزومی در اشکالی مانند g-banding، q-banding و m-fish در آزمایشگاه های ژنتیکی برداشته می شوند. معمولا کروموزوم ها در تصاویر کروموزومی بصورت تصادفی ریخته می شود، همچنین این کروموزوم ها مشکلاتی از جمله خمیدگی، نویز، چسبندگی و روی هم افتادگی می توانند داشته باشند. همه این مشکلات کار دسته بندی تصاویر کروموزومی را سختر و پیچیده تر می کند. این پایان نامه یک رویکرد خودکار تهیه نماد کروموزومی را ارائه می دهد، که بر روی دو گام استخراج ویژگی و دسته بندی تمرکز بیشتری می کند، بطور ویژه قصد داریم یک روش نیمه نظارتی جهت دسته بندی تصاویر کروموزومی اعمال کنیم، به منظور محقق سازی این دو هدف، اول تعامل یا حالت هایی را که تعداد ویژگی های برچسب دار کم است، در نظر می گیریم. دوم، بر عهده گرفتن ناهنجاری های کروموزومی که از حالت های سرطانی، جهش ها یا هر عامل بیرونی ناشی می شوند در نظر گرفته خواهند شد. الگوریتم پیشنهادی یادگیری مشارکتی مبتنی بر دو دیدگاه طرح شده است. در این راستا از ماشین بردار پشتیبان بعنوان یادگیرنده پایه استفاده شده است. الگوریتم یادگیری مشارکتی به صورت مستمر مراحل زیر را انجام می دهد: 1) دو دسته بند ماشین بردار پشتیبان بر روی هر دیدگاه از داده های برچسب دار جداگانه یاد گیری را انجام می دهد. 2) مقدار مشخص از داده های بدون برچسب دسته بندی، و برچسب خروجی را با بیشترین اعتماد در هر تکرار انتخاب می کنیم. 3) داده های انتخاب شده به مجموعه ی برچسب دار را اضافه کنید. 4) تکرار کنید تا زمانی که داده های بدون برچسب تمام شود، دسته بند ها همدیگر را یاد می دهند. الگوریتم پیشنهادی بر روی دو مجموعه ی داده های تصاویر کروموزومی g-banding و تصاویر q-banding امتحان شده است. که مجموعه داده اول کپنهاگن است، و دومی ایتالیا که از آزمایشگاه پردازش تصویر در دانشگاه پادوا فراهم شده است. خروجی دقت تشخیص نهایی 97.3% برای مجموعه ی کپنهاگن و 98.5% برای مجموعه ی ایتالیا، نتایج بدست آمده نشان می دهد که الگوریتم پیشنهادی دارای کارایی مناسبی در مقایسه با روش های برتر دیگر در این زمینه می باشد
زهرا محمودآبادی محمد صنیعی آباده
بیماری گرفتگی عروق کرونری (cad ) روی بسیاری از مردم دنیا تأثیر می گذارد. با وجودی که پیشرفت های چشم گیری در زمینه های پزشکی صورت گرفته است، اما تشخیص زودهنگام این بیماری به منظور پیشگیری، هنوز چالشی بزرگ می باشد. هدف این پایان نامه توصیف روشی است که با استفاده از سیستم خبره فازی و الگوریتم رقابت استعماری (ica ) منجر به بهبود تشخیص بیماری قلبی می شود. سیستم بر اساس مجموعه داده های بیماری قلبی cleveland و hungarian طراحی شده است. در این پایان نامه، از یک الگوریتم دو مرحله ای برای استخراج قوانین اگر-آنگاه با دقت بالا، برای مسئله گرفتگی عروق کرونری، استفاده شده است. در مرحله اول، از یک الگوریتم مبتنی بر درخت تصمیم برای استخراج قوانین اگر- آنگاه استفاده شده است. در مرحله دوم یک الگوریتم فرامکاشفه ای جدید، الگوریتم رقابت استعماری، جهت تنظیم توابع عضویت قوانین فازی استخراج شده، ارائه شده است. روش پیشنهادی، با تعداد 11 قانون فازی و میانگین طول قوانین 4، صحت طبقه بندی 93.22% را نتیجه می دهد. مهم ترین مزیت این روش در مقایسه با دیگر روش ها، قابلیت تفسیر تصمیم های گرفته شده از سیستم خبره فازی است. منظور از قابلیت تفسیر تعداد و طول قوانین فازی استخراج شده می باشد. جهت مقایسه ی الگوریتم رقابت استعماری با دیگر الگوریتم های فرامکاشفه ای، روش پیشنهادی با الگوریتم pso نیز پیاده سازی شده است. نتایج حاکی از آن است که الگوریتم رقابت استعماری، از نظر کارایی و سرعت همگرایی نسبت به الگوریتم pso برتری دارد.
حمید محسنی محمد صنیعی آباده
همگام با رشد شبکه های کامپیوتری، حملات و نفوذها به این شبکه ها نیز گسترش یافته و به شکل های متعددی صورت می پذیرد. به این ترتیب معمولا یک سیستم تشخیص نفوذ می¬تواند نقش مهمی را در حفظ امنیت و جلوگیری از دسترسی نفوذگرها به شبکه ایجاد کند. هر سیستم تشخیص نفوذ برای تشخیص حمله ممکن است از دو رویکرد تشخیص سوءاستفاده و یا ناهنجاری استفاده کند. تشخیص ناهنجاری نفوذ فرآیندی شامل فراهم کردن پروفایل¬هایی از عملکرد عادی کاربران و سپس مقایسه آن با سایر اعمال آنها است. این روش توانایی کشف حمله¬های جدید را دارد. تشخیص سوء-استفاده بر اساس الگوهای شناخته شده عمل می¬کند. هدف این پایان نامه ارائه یک سیستم تشخیص نفوذ ترکیبی جدیدی با نامdc-cfs&dm است. در سیستم تشخیص نفوذ پیشنهادی، موتور تشخیص ناهنجاری وظیفه تشخیص حملات جدید و ناشناخته را دارد و موتور تشخیص سوءاستفاده وظیفه حفاظت سیستم تشخیص ناهنجاری را بر عهده می گیرد. با این کار این تضمین به وجود می آید که اطلاعات و الگوهای جمع آوری شده برای سیستم تشخیص ناهنجاری امن باشند. در تشخیص ناهنجاری نفوذ با استفاده از روش همبستگی آماری که از روش¬های همبستگی داده¬ها می¬باشد رفتار عادی شبکه به کمک مجموعه داده nsl-kdd-cup99 مورد تحلیل آماری قرار می¬گیرد. در ادامه ایده¬ گراف رابطه همبستگی داده¬ای به جهت نشان دادن تخطی رفتارها از رفتار نرمال مطرح شده است. در تشخیص سوءاستفاده نیز از روش همبستگی به جهت کاهش ابعاد مسئله ورودی استفاده گردیده است که در اینجا علاوه بر رفتارهای نرمال، رفتار همه کلاس¬های حمله نیز مورد تجزیه و تحلیل قرار خواهد گرفت. در ادامه یک روش دسته¬بندی به کمک روش¬های تجمیعی با استفاده از دسته¬بند پایه درخت تصمیم c4.5به جهت دسته¬بندی معرفی می¬شود. در پایان روش پیشنهادی با نتایج روش های دیگر در این زمینه مورد مقایسه قرار گرفته و دقت و کارایی مطلوبی از خود نشان داده است.
مهدی صبور محمد صنیعی آباده
حجم بالای هشدارهای تولید شده توسط سیستم های تشخیص نفوذ سطح پایین، مدیریت این هشدارها را تبدیل به یک مسئله چالش برانگیزی کرده است. یک پاسخ مناسب برای این مسئله همبسته سازی هشدارها به صورت اتوماتیک می باشد. این روشها با استخراج روابط علیتّی و شباهت بین هشدارها، اطلاعات واضح تری را به مدیر شبکه ارائه می دهند. هر چند از نظر دقت و وفق پذیری روشهای خوبی مطرح شده است اما فقدان روشی که بتواند به صورت بلادرنگ یا نزدیک به بلادرنگ هشدارها را همبسته کرده و دارای وفق پذیری و دقت بالایی باشد به چشم می خورد. در این پایان نامه یک چارچوب برای همبسته سازی هشدارها ارائه می کنیم که از یک مدل جدید برای تبدیل هشدارها به دنباله ها و سپس کاوش الگوهای ترتیبی از این جریان دنباله ها استفاده می کند. مدل ارائه شده از خصیصه های هشدارها برای تولید دنباله های هشدار استفاده می کند. در هسته این چارچوب یک الگوریتم جدید به نام asps وجود دارد که الگوهای ترتیبی موجود در هشدارها را استخراج می کند. سپس این الگوها به کمک دانش گراف حمله به درخت الگو اضافه شده و به صورت تدریجی و با استفاده از اطلاعات آماری مبتنی بر زمان نگهداری می شوند. همچنین این روش این قابلیت را دارد که، نقص های موجود در گراف حمله را گزارش کند. نتایج آزمایش روش پیشنهادی بر روی مجموعه داده darpa2000 و داده های synthetic به ترتیب نشان داد که الگوریتم ما دارای نرخ کاهش هشدار 94% و زمان اجرای خطی از اندازه مجموعه داده می باشد. همچنین سناریو استخراجی از مجموعه داده darpa2000 مشخص می کند روش پیشنهادی از دقت و وفق پذیری خوبی برخوردار می باشد.
طاهره متکان محمد صنیعی آباده
همراه با پیشرفت در فن آوری اطلاعات و کانال های ارتباطی، تقلب در سراسر جهان در حال گسترش است که منجر به ضرر و زیان مالی عظیمی می شود. موسسات مالی و پولی به شدت به دنبال راهکار هایی سریع برای شناخت فعالیت های کلاه برداران و متخلفان می باشند. این امر به دلیل اثر مستقیم آن روی خدمت رسانی به مشتریان این موسسات، کاهش هزینه های عملیاتی و باقی ماندن به عنوان یک ارائه دهنده خدمات مالی معتبر و قابل اطمینان است؛ بنابراین تشخیص تقلب از ابزار ضروری است و احتمالاً بهترین راه برای جلوگیری از این نوع تقلب است. از طرفی با رونق و گسترش بانکداری الکترونیک و پرداخت الکترونیک، کلاه برداری در کارت اعتباری نیز در حال گسترش است؛ بانک ها و سازمان های صدور کارت های اعتباری تلاش می کنند با استفاده از تمهیدات امنیتی، حتی الامکان از سوءاستفاده از حساب های مشتریان جلوگیری کنند. با این حال گسترش روش های خرید و پرداخت اینترنتی و تلفنی، وجود پایگاه های ارائه دهنده نرم افزارهای مخرب نظیر کشف رمز، پایگاه های فروش اطلاعات کاربران و گاهی عدم دقت کافی از طرف مشتریان در نگهداری اطلاعات حساب، هنوز هم راه های تقلب را باز گذاشته است؛ بنابراین علاوه بر اقدامات پیشگیرانه، لزوم استفاده از روش های کشف و جلوگیری از وقوع تقلب قبل از ثبت تراکنش واضح است. بدین منظور در این پایان نامه کشف تقلب کارت های اعتباری هدف قرار داده شده است. در دهه گذشته با رشد داده کاوی، محققان الگوریتم های متنوعی که اغلب ماهیت دسته بندی را دارا هستند برای تشخیص کلاه برداری بکار بردند. بسیاری از این روش ها بر افزایش نرخ تشخیص کلاه برداری تمرکز دارند، درعین حال با افزایش نرخ تشخیص تعداد اشتباه افزایش می یابد. از جمله راه کارهای کاهش خطا به کارگیری منطق فازی است. بر این اساس، در این پایان نامه یک روش مبتنی بر الگوریتم ممتیک برای استخراج قوانین فازی به منظور تشخیص کلاه برداری کارت اعتباری ارائه شده است. الگوریتم پیشنهادی در سه مرحله عمل می کند. در مرحله اول با استفاده از الگوریتم ممتیک مجموعه ای از قوانین فازی که بیانگر الگوی حاکم بر داده های آموزشی است استخراج خواهد شد. در مرحله دوم الگوریتم بهینه سازی میگوها هماهنگ سازی قوانین را انجام می دهد و در نهایت در مرحله سوم با استفاده از یک موتور استنتاج فازی نمونه های آزمون دسته بندی می شود. نتایج ارزیابی روی مجموعه داده های واقعی نشان می دهد که روش پیشنهادی توانسته است مصالحه ای قابل قبول بین هشدارهای اشتباه و نرخ تشخیص کلاه برداری برقرار کند.
جابر علوی رشکلایی محمد صنیعی آباده
امروزه بیش از ?? درصد از دانش ما به صورت متن، مستندات و دیگر صورت¬های رسانه ای نظیر ویدیو و صدا نگهداری می شود. اگر از دید علوم کامپیوتری به این مستندات نگـاه کنیم هـمه آن ها به طبیعتی غیر ساخت یافته وابسته¬اند. یک فرد برای دریافت دانش از اطلاعات یک متن، باید ابتدا آن را درک کند و سپس آن را پردازش کند تا بفهمد چه معانی و مفاهیمی در آن موجود است، چه ارتباطی میان مفاهیم وجود دارد و از میان این مفاهیم کدامیک جدید و کدامیک قدیمی است. حال اگر فردی سوالی هرچند ساده داشته باشد بار دیگر باید همان روند طولانی قبلی را طی کند. سیستم های پرسش و پاسخ (qas) به کمک یک مجموعه داده که در اختیار آن است (اینترنت یا داده های متنی و یا هر داده مورد نیاز) پرسش را تحلیل می کند و برای آن سوال مناسب ترین جواب را پیدا می کند. از اولیه ترین کارها پردازش سوال برای پیدا کردن پاسخ و پیدا کردن بهترین پاسخ در بین مجموعه ای پاسخ ها مورد نظر می باشد که مقالات بسیاری با الگوریتم های اکتشافی متفاوتی ازجمله ژنتیک و ماشین بردار پشتیبان و یا حتی روش آماری (پیشنهاد داده شده است) در این زمینه کار کرده اند که همه با درصد های خوبی به نتیجه مطلوب رسیده اند. ما سعی بر آن داریم در صورت امکان برای بهبود بیشتر پاسخ درست از الگوریتم فاخته (coa) برای دسته بندی های موجود در سیستم پرسش و پاسخ استفاده کنیم. الگوریتم فاخته برای دسته بندی پاسخ ها و برای استخراج بهترین پاسخ و در آنتولوژی یک کلمه که دارای چندین معنای مختلف می¬باشد، معناهای مختلف را از wordnet استخراج و انتخاب معنای درست در حوزه خاص از الگوریتم های بهینه سازی فاخته بهره ببریم.
ایمان خدادی محمد صنیعی آباده
سیستم¬های پرسش و پاسخ، موتورهای جستجویی هستند که توانایی¬ ارائه¬ی پاسخی یکتا، کوتاه و دقیق، به یک پرسش را دارند. به عبارتی دیگر، پرسشی که یک موتور جستجو، با مجموعه¬ای از سندها پاسخ می¬دهد، یک سیستم پرسش و پاسخ، با یک پاراگراف، جمله، کلمه و ...، پاسخ می¬دهد. در این پایا¬ن¬نامه، یک فراسیستم با دامنه¬ی باز و مبتنی بر وب، برای پاسخ¬گویی به پرسش¬های انگلیسی¬ تعریفی و حقایق، ارائه شده است. چارچوبی که برای این فرآیند طراحی شده است، شامل سه مرحله ارزیابی است. در مرحله¬ی اول، پاراگراف¬های متن¬های بازیابی شده توسط یک موتور جستجو، ارزیابی شده و امکان پاسخ¬گویی به یک پرسش تعریفی، فراهم می¬شود. برای پاسخ¬گویی به یک پرسش حقایق، باید دو مرحله ارزیابی دیگر نیز اعمال شود که شامل ارزیابی جملات پاراگراف¬های برتر ارزیابی قبلی و ارزیابی کلمات استخراج شده از جملات برتر، می¬شود. در مراحل ارزیابی پاراگراف و جمله، می¬بایست تمامی موارد را برای یافتن اعضای نزدیک به پرسش، بررسی کرد. اما اگر تعداد متن¬های بازیابی شده، زیاد باشند، بررسی تمام موارد زمان¬گیر خواهد شد. به همین دلیل، یک روش جستجوی تکاملی برای این فرآیند ارائه شده است که مبتنی بر الگوریتم ممتیک است. محدوده¬ی تعداد پاراگراف و جمله¬ای که الگوریتم ممتیک با آن آزمایش شده است، حدودا 1000 الی 2000 است. دقت به دست آمده برای پاسخ¬گویی به پرسش¬های تعریفی، برای مجموعه¬ای از 100 سوال تعریفی و داده¬های وب، با الگوریتم ممتیک برابر 76%، و بدون الگوریتم ممتیک، 81% بود. دقت پرسش¬های حقایق نیز، برای پرسش¬های trec qa track 2007 و داده¬های وب، با استفاده از الگوریتم ممتیک، برابر 0.55 و بدون الگوریتم ممتیک، 59% بود. این نتایج با مقالات مشابه و نتایج trec نیز مقایسه شده است. در راستای افزایش دقت در سه مرحله¬ی ارزیابی، روشی مبتنی بر الگوریتم برنامه¬نویسی ژنتیک، برای تولید ویژگی¬ جدید از ویژگی¬های موجود و عملگرهای ریاضی، ارائه شده است. در ارزیابی¬ها این نتیجه حاصل شده که ویژگی¬های ترکیبی ساخته شده، دقت بهتری نسبت به ویژگی¬هایی دارند که از آن¬ها تشکیل شده¬اند. ارزیابی پاراگراف¬ها، جملات و کلمات، نیازمند یافتن وزن ویژگی¬های آن¬ها است و برای این فرآیند، از سه روش¬ دسته¬بندی مبتنی بر تفکیک، استفاده شده است. به منظور استخراج اطلاعات از جملات برای پاسخ¬گویی به سوالات حقایق، مجموعه¬ای از عبارات منظم ارائه شده و جزئیات تطابق این الگوها با سوالات trec 2004 و trec 2007، بررسی شده است.
رضا ظهوری آرام نصرالله مقدم چرکری
پروتئین¬ها از حیاتی¬ترین ماکرو مولکول¬ها در طبیعت هستند که کلیه اعمال موجود زنده به عملکرد آن ها بستگی دارد. پروتئین¬ها در سوخت و ساز سلول¬ها و رشد و ترمیم بدن نقش بسیار مهمی دارند. تمام آنزیم¬هایی که در بدن باعث انجام واکنش¬های مختلف می¬شوند از جنس پروتئین هستند. پروتئین¬ها ساختاری سلسله مراتبی دارند که شامل چهار ساختار اول، دوم، سوم و چهارم می¬باشد. پیش¬بینی ساختار پروتئین¬ها از روی توالی اولیه¬شان در بیوانفورماتیک بسیار مهم است. منظور از توالی اولیه در حقیقت همان ساختار اول پروتئین است که به صورت آزمایشگاهی به دست می آید. از آنجا که ساختار سوم پروتئین تعیین کننده نحوه عمل آن است، بنابراین شناخت ساختار آن برای شناسایی عملکرد یک پروتئین ضروری است. از طرفی شناسایی این ساختار در طراحی داروها نیز بسیار موثر است. برای شناسایی ساختار سوم پروتئین نیازمند تشخیص تاخوردگی پروتئین هستیم. تاخوردگی پروتئین که یکی از بزرگترین چالش¬ها در بیوانفورماتیک است به معنی به دست آوردن ساختار سوم یک توالی پروتئین داده شده بدون تمرکز بر شباهت توالی¬ها است. به دلیل پر هزینه بودن روش¬های آزمایشگاهی، از روش¬های محاسباتی برای تعیین ساختار سوم پروتئین کمک می¬گیرند. در این پژوهش نیز با استفاده از روش¬های محاسباتی و به کمک الگوریتم¬های یادگیری ماشین به پیش¬بینی تاخوردگی پروتئین پرداخته¬ایم. به این منظور یک چارچوب دسته¬بندی دو لایه برای تشخیص تا خوردگی پروتئین ارائه شده است. در لایه اول از این چارچوب، چهار دسته ساختاری پروتئین¬ها که شامل α، β ، α/β و α+β است، شناسایی می¬شود. سپس نتایج پیش بینی لایه اول به عنوان ویژگی¬های جدید به مجموعه داده¬ اضافه می¬شود. در نهایت در لایه دوم با استفاده از یک دسته بند دیگر تاخوردگی¬های پروتئین پیش¬بینی می¬شود. با تکیه به همین چارچوب چندین مدل مختلف برای حل مسئله پیشنهاد شده و نتایج خوبی نیز در مقایسه با دیگران حاصل شده است. نتایج آزمایشات روی مجموعه ویژگی¬های دینگ و دوبچاک نشان می¬دهد که حدود 2 تا 14 درصد بهبود دقت نسبت به پژوهش¬های قبلی حاصل شده است.
سمانه بهرامی محمد صنیعی آباده
با رشد گسترده تکنولوژی های مرتبط با اینترنت، تصاویر و ویدئوها به سرعت در حال توسعه بر روی بستر اینترنت هستند. چگونگی ساماندهی و مدیریت این اطلاعات حجیم، بحث داغی شده است که نیاز به راه حل های فوری دارد. بازیابی اطلاعات چندرسانه ای، گامی موثر جهت حل مشکل بیان شده و حاشیه نویسی خودکار تصاویر گامی مهم و کلیدی در بازیابی اطلاعات چندرسانه ای می باشد. حاشیه نویسی خودکار تصاویر به ایجاد خودکار برچسب های متنی مطابق با محتوای بصری تصاویر دلالت دارد. در این پژوهش روشی بر مبنای روش های تکاملی برای این مسئله پیشنهاد شده است. الگوریتم ژنتیک هم به عنوانی گامی در پیش پردازش داده های تصویری و کمک به کاهش ابعاد بردارهای ویژگی درفضاهای گوناگون بصری و نیز در ترکیب نتایج حاشیه نویسیِ فضاهای ویژگی گوناگون پیشنهاد شده است. در این پژوهش بر آنیم تا از هر دو نوع ویژگی های محلی و سراسری به منظور بهره بردن از مزایای هر دو نوع شیوه توصیف تصاویر استفاده کنیم. بنابراین چندین بردار ویژگی شامل ویژگی های محلی و ویژگی های سراسری از تصاویر استخراج شده اند. از آنجا که با چندین بردار ویژگی و در هر بردار با ابعاد بالایی از ویژگی ها مواجه هستیم، الگوریتم ژنتیک جهت انتخاب زیرمجموعه ویژگی های موثر به کار گرفته شده است. جهت دسته بندی تصاویر بدون برچسب به گونه ای که تنها تصاویر مرتبط به هر تصویر جدید در دسته بندی آن تصویر دخالت داده شوند، طی یک فرایند خوشه بندی دولایه بر مبنای محتوای بصری و هم چنین فضای معنایی، تصاویر مرتبط به هم در یک خوشه قرار می گیرند. الگوریتم ژنتیک جهت ترکیب معنایی و کارای نتایج فضاهای ویژگی مبنی بر این که هر فضای ویژگی در شناسایی بعضی برچسب های خاص سرآمد سایر فضاهای ویژگی می باشد و سپس ارائه نتیجه نهایی که همان برچسب های انتخاب شده برای تصویر بدون برچسب است پیشنهاد شده است. جهت ارزیابی روش، دو دادگان شناخته شده ی corel5k و iapr tc-12 استفاده شده اند. روش پیشنهادی برای دادگان corel5k سبب افزایش کارایی سامانه با در نظر گرفتن معیار f1 از 0.25 به 0.333 و برای دادگان iapr tc-12 از 0.3 به 0.364 شده است. در ارزیابی عملکرد حاشیه نویسی، روش پیشنهادی در مقایسه با سایر روش ها روی دادگان corel5k عملکردی معادل با بهترین روش و برای دادگان iapr tc-12 بهبود داشته است. هم چنین روش پیشنهادی از نظر کیفیت رتبه بندی تصاویر (معیار میانگین دقت متوسط) در مقایسه با سایر روش ها روی دادگان corel5k بهبودی نداشته است ولیکن در دادگان iapr tc-12 نسبت به بهترین روش بهبود حاصل شده است.
مصطفی سالاری سعید جلیلی
برخی داده ها برای اهدافی چون استخراج دانش یا بهبود خدمات با دسترسی عمومی منتشر می شوند. در اثر این انتشار، حریم خصوصی صاحبان داده ها می تواند نقض شود. بنابراین داده ها باید پیش از انتشار طوری بی نام سازی شوند که ضمن سودمند ماندن برای استفاده های مجاز، حریم خصوصی صاحبان داده ها حفظ شود. یکی از روش های پُراستفاده برای این منظور ریزتجمیع است که برای تضمین k-بی نامی مناسب است. این روش در اصل برای داده های عددی طراحی شده است. در پیشینه ی پژوهش، الگوریتم های ابتکاری بسیاری برای ریزتجمیع ارائه شده است. می توان با اعمال تغییراتی در روش محاسبه ی فاصله ی میان رکوردها و روش یافتن مرکز چند رکورد، بسیاری از آن الگوریتم ها را برای داده های غیرعددی توسعه داد. تلاش هایی برای ریزتجمیع داده های دسته ای و مختلط در پژوهش های گذشته انجام گرفته است. محاسبه ی فاصله و یافتن مرکز مقادیر دسته ای با توجه به معنای آن ها، حجم محاسبات و زمان ریزتجمیع را افزایش می دهد. داده های دنیای واقعی در بسیاری از مواقع مختلط و حجیم می باشند که در این حالت مدت زمان بی نام سازی نیز علاوه بر سودمندی و حفظ حریم خصوصی، اهمیت پیدا می کند. در این پایان نامه روشی نوین به نام tbm برای ریزتجمیع داده های مختلط حجیم ارائه شده است که در مدت زمان مناسب، داده ها را برای مقادیر متفاوت k ریزتجمیع کرده به طوری که مصالحه ی خوبی میان حریم خصوصی و سودمندی ایجاد می نماید. الگوریتم tbm ابتدا برای داده های مختلط، داده های معادل عددی تولید کرده و سپس مرحله ی خوشه بندی فرآیند ریزتجمیع را بر روی داده های معادل انجام می دهد. نتیجه ی خوشه بندی به منظور تجمیع بر داده های مختلط اصلی اعمال شده و k-بی نامی به دست می آید. در این پایان نامه همچنین الگوریتم خوشه بندی مبتنی بر ترتیب به نام nfpn_imhm ارائه شده است که نسبت به روش های پیشین اتلاف اطلاعات کمتری دارد. ارزیابی ها بر روی مجموعه داده های مختلط adult نشان می دهند که به طور متوسط روش tbm نسبت به سایر روش های ریزتجمیع مختلط، مصالحه ی سودمندی-حریم خصوصی را از یک الی چهل درصد (با افزایش k) بهبود داده است. زیرا این روش از امکانات ریزتجمیع عددی برای بی نام سازی داده های مختلط استفاده نموده و خوشه بندی منسجم تری به دست می آورد.
محمدمهدی حامد محمد صنیعی آباده
پیش بینی بازار سهام از گذشته تا به حال به عنوان یک کار پر چالش در نظر گرفته شده است. یکی از دلایل مهم این امر عدم وجود قطعیت در نحوه حرکت بازار سهام می باشد. از جمله عوامل تأثیرگذار در قیمت سهام می توان به وضعیت کلی اقتصاد یک کشور، انتظارات سهام داران و خریداران و فروشندگان سهام نسبت به وضعیت آینده بازار و همچنین تحولات سیاسی اشاره کرد. از نقطه نظر فنی قیمت های سهام در روند زمان یک سری زمانی را تشکیل می دهند که تحلیل این سری زمانی به علت غیرخطی بودن و وجود نویز زیاد در آن دشوار است. این پژوهش به دنبال استفاده از شاخص های تکنیکی بازار سهام برای پیش بینی آینده قیمت های سهام است. به علت فضای بزرگ جستجو، در این پژوهش از الگوریتم های تکاملی برای کاوش الگوهای ترتیبی شاخص های سهام کمک گرفته می شود. در این پژوهش دو روش برای پیش بینی کوتاه مدت قیمت های بازار سهام ارائه شده است. در روش اول این پیش بینی با استفاده از قیمت های گذشته یک شرکت و با هدف پیش بینی قیمت های آینده همان شرکت صورت می گیرد و در روش دوم از قیمت های سایر شرکت هایی که از همبستگی بالایی با شرکت مورد نظر برخوردارند نیز استفاده می شود. روش های پیشنهادی روی مجموعه داده ای متشکل از 29 شرکت حوزه فناوری اطلاعات بازار بورس نیویورک آزمون شده است و با دو روش به عنوان روش های محک به نام روش خرید و نگهداری و روش خرید و فروش تصادفی مقایسه شده است. نتایج به دست آمده نشان می دهد که روش های پیشنهادی با بکارگیری یک روش هوشمندانه مدیریت سبد خرید بهتر از دو روش محک مذکور عمل می کنند. همچنین در انتها پنچ روش دیگر نیز با روش های پیشنهادی مقایسه شده اند که روش اول پیشنهادی با کسب سود 13.5% و روش دوم پیشنهادی با کسب سود 17.2% از روش های مقایسه شده بهتر عمل کرده اند.
ولی طاوسی سعید جلیلی
طراحی تفصیلی در سیستم های نرم افزاری وظیفه ی بسیار مهمی است که لازم است به نحو مطلوبی انجام شود. علاوه بر طراحی تفصیلی توسط متخصص که نیاز به تجربه و دانش انسانی دارد، تا کنون رویکردهای خودکار و نیمهخودکاری برای این مسئله پیشنهاد شده است. دو رویکرد عمده برای خودکار سازی طراحی تفصیلی نرمافزار، استفاده از پردازش زبان طبیعی به همراه روشهای مبتنی بر الگو و رویکرد مهندسی نرمافزار جستجو محور هستند. در این پایاننامه از رویکرد مهندسی نرم افزار جستجو محور استفاده شده است که خود متکی بر روش های جستجوی فرامکاشفه ای است. از روش بهینه سازی کلونی مورچگان تکهدفی و چندهدفی به عنوان روش های جستجوی فرامکاشفه ای استفاده شده که علاوه بر سرعت همگرایی بالا، با ذات انتخابی بودن مسئله نیز سازگار است. ورودی روش پیشنهادی، مدل تحلیل یک سیستم است که در قالب مستندات متنی استفاده میشود و خروجی آن طراحی تفصیلی سیستم است که در قالب یک یا چند دیاگرام کلاس پیشنهادی در اختیار متخصص قرار می گیرد تا وی بر اساس نیاز مسئله و محدودیت های موجود، بهترین طراحی را انتخاب کند. برای جبران دانش طراح، و تخصیص مسئولیتها به کلاسهای مرتبط، دانش زمینهی مسئله به شکل یک هستان نگار در روش حل وارد شده است. از این هستان نگار برای تشخیص نام کلاسها و ارتباطات ساختاری و رفتاری بین آنها از قبیل وابستگی، ترکیب، تجمیع و ارثبری نیز استفاده شده است. علاوه بر روش بهینهسازی، روش دیگری با استفاده از رتبهبندی گرهها در شبکهی معنایی معرفی شده است که کلاسها را از بین مفاهیم دیگر تشخیص میدهد، سپس مسئولیتها را به آنها تخصیص میدهد و روابط بین کلاسها را تنظیم میکند. استفاده از هستان شناسی برای رسیدن به دیاگرام کلاس بهتر، برای اولین بار در این پایاننامه استفاده شده است. دو سنجندهی جدید نیز برای استفاده در تابع هدف روش بهینهسازی، معرفی شدهاند. روش پیشنهادی با استفاده از چند مورد مطالعاتی مورد ارزیابی قرار گرفته است و نتایج حاصل نشان میدهد که این روش توانایی تولید دیاگرام کلاس خوب را دارد.
مهدیس بنای دزفولی هدیه ساجدی
سرطان ریه از جمله سرطان های شایع است که دیرآگاهی از آن سبب فوت می شود و اگر بتوان بقای این سرطان را پیش بینی کرد، می توان جان افراد زیادی را نجات داد. هدف از این مطالعه کشف ارتباطات و الگوها با استفاده از داده های بالینی در داده کاوی می باشد که می تواند به دانش جدیدی در پزشکی بیانجامد و در پیش بینی بقای بیماران مبتلا به سرطان ریه مورد استفاده قرار بگیرد. برای عملی کردن این پروژه از داده های پزشکی که در ارتباط با این بیماری توسط سایت seer طی سال ها جمع آوری شده است، استفاده می کنیم. ویژگی ها با استفاده از سه الگوریتم داده کاوی درخت تصمیم، شبکه ی بیزیان و شبکه های عصبی مورد بررسی قرار می گیرند و میزان تأثیر هر ویژگی در پیش آگهی بقای بیماران سرطان ریه مورد مطالعه قرار می گیرد.
علی اکبر فخیمی کامران انوشیروان کاظم نژاد
مقدمه: سرطان ریه، شایع ترین سرطان تشخیص داده شده و همچنین شایع ترین علت عمده مرگ ومیر ناشی از سرطان در مردان، در سال 2008 در سطح جهانی بود. در میان زنان، چهارمین سرطان شایع از نظر تشخیص و دومین علت مرگ ومیر ناشی از سرطان بود. اخیراً داده های بیان ژنی برای تشخیص بیماری سرطان بکار گرفته شده اند. فناوری میکرو آرایه، امکان اندازه گیری همزمان سطح بیان هزاران ژن را می دهد. روش پژوهش: در این پژوهش به تشخیص سرطان ریه با استفاده از داده های بیان ژنی و یک رویکرد تکاملی مبتنی بر ماشین بردار پشتیبان خواهیم پرداخت. برای این پژوهش از مجموعه داده معیار برای سرطان ریه، شامل ?? نمونه و ????? ژن استفاده کردیم. استفاده از الگوریتم تکاملی ژنتیک به بهبود پارامترها و دقت دسته بندی الگوریتم svm اقدام کردیم. نتیجه گیری: بالاترین دقت در بین دسته بندهای این پژوهش را ترکیبی از مدل پیشنهادی (ga-svm) و انتخاب ویژگی درخت تصمیم با دقت معادل ??.??? به دست آورد.