نام پژوهشگر: بیتا شادگار
آزاده هراتیان نژادی بیتا شادگار
وب معنایی با هدف ایجاد ارتباط و تعامل مستقیم ماشین ها و بدون دخالت بشر طرح شد، ولی هم اکنون با چالش بزرگ تعامل آنتولوژی ها روبه رو است. این رساله درپی یافتن تناظر بین موجودیت های آنتولوژی، با استفاده از روش های یادگیری ماشین است. بدین ترتیب که، ابتدا معیار شباهت را در سطوح مختلف برای آنتولوژی های واقعی انتخاب و تولید می کند، و سپس از معروف ترین دسته بندی کننده های تحت نظارت، مثل ماشین بردارهای پشتیان (svm) ، نزدیک ترینk همسایه (knn)، درخت تصمیم گیری (dt) و روش adaboost برای دسته بندی موجودیت ها استفاده می کند. البته هر یک از دسته بندی کننده های مذکور با پارامترهای مناسب تنظیم می شوند. مدل نهایی بدون نیاز به بازخورد کاربر و کاملاً خودکار است. هم ترازی تنها برمبنای اطلاعات موجود در اسناد owl است، و نیازی به نمونه های آنتولوژی نیست. از svm برای کاهش معیارهای مشابهت استفاده شده، و نتایج حاصل از آزمایش مدل، بیانگر انتخاب روش مناسب و تنظیم صحیح پارامترهاست. به طوری که قادر به تامین نتایج قابل قبول همراه با کاهش قابل ملاحظه ی هزینه ی محاسباتی است. نتایج حاصل از روش adaboost بالاترین کارایی را داراست. نتایج حاکی از میانگین مقدار 92 درصد برای معیار f است.
محمد صبری علیرضا عصاره
در این تحقیق مدلی ساده و انعطاف پذیر بر مبنای تکنیک مدل توزیع شده نقطه ایی به منظور بیان تغییرات شکل و ظاهر ریه ارایه شده است. در این راستا، محدوده مرزی ریه در تصاویر پزشکی سی تی توسط مجموعه ایی از نقاط راهنما مشخص شده و پراکندگی تغییرات از تفاوت نحوه-ی توزیع این نقاط راهنما بین میانگین اشکال و شکل ریه در هر تصویر تعیین شده است. همچنین در این تحقیق، توصیفی از سطح خاکستریِ پیکسل های اطراف هر نقطه راهنما نیز به مدل توزیع شده نقطه ایی اضافه شده است. در ادامه از این مدل به منظور سگمنت سازی ریه در تصاویر سی تی با به کارگیری الگوریتم مدل پویای شکل استفاده شده است. روش ارایه شده بر روی مجموعه ایی نسبتاً بزرگ، شامل 247 تصویر سی تی از قفسه سینه آزمایش گردیده است. نتایج بدست آمده کارایی مناسب روش ارایه شده را اثبات می نماید. همچنین بر اساس نتایج بدست آمده، به منظور بهبود هرچه بیشتر عملکرد الگوریتم مدل پویای شکل، مقادیر بهینه پارامترهای آزاد این الگوریتم تحلیل و معرفی گردیده است. روشی که در این تحقیق به منظور سگمنت سازی ریه معرفی گردید، ساده، بهینه و در عین حال قابل انعطاف است. کلاس نسبتاً بزرگی از تصاویر سی تی از قفسه سینه توسط میانگین محل قرارگیریِ مجموعه ایی از نقاط راهنما و نحوه ی پراکندگی تغییرات حول این میانگین، مدل شده اند. در مدل پویای شکل تغییر جداگانه هر پارامتر ، نقاط مدل را در یک خط مستقیم جابجا می کند. لذا این مدل برای بیان تغییرات غیرخطی نظیر خمیدگی یا چرخش دو زیرمجموعه نسبت به هم موثر و کارا نمی باشد. امّا همانطور که واضح است شکل ریه، هیچ زیر مجموعه خاصی ندارد و برای بیان آن یک مدل خطی ساده کافی است و احتیاجی به ساخت مدل های پیچیده تر نمی باشد. لازم به یادآوری است مزیت اصلی این مدل دارا بودن پیچیدگی محاسباتی خطی از مرتبه o(n) است.
سمیرا لویمی بیتا شادگار
در حاشیه نویسی تصاویر پزشکی معمولاً تولید چهار بخش اطلاعاتی در مورد تصاویر لازم است. این بخش ها، شامل اطلاعاتی درباره ی تکنیک تهیه تصویر، اندام، جهت عکس برداری و سیستم بیولوژیکی است. حاشیه نویسی خودکار تصاویر با استفاده از سیستم یادگیری ماشین برای دسته بندی تصاویر به کلاس های مختلف انجام می شود، به طوری که هر کلمه معرف یک دسته است. ورودی سیستم یادگیری ماشین ویژگی های مستخرج از تصویر است. در حاشیه نویسی تصاویر پزشکی اگر تنها از یک دسته بندی کننده برای تولید هر چهار بخش اطلاعاتی تصویر استفاده شود، برای رسیدن به کارایی مناسب باید از تعداد بیش تری ویژگی مستخرج از تصویر استفاده کرد. این موضوع منجر به بالا رفتن طول بردار ورودی دسته بندی کننده می شود. در این رساله از چهار سیستم یادگیری ماشین مجزا برای تولید چهار حاشیه (بخش) برای هر تصویر استفاده شده است. بردار ورودی هر سیستم تنها شامل ویژگی های مناسب برای یک بخش است. استخراج ویژگی ها از طریق عمل گر الگوی باینری محلی، روش های مبتنی بر شکل، فیلتر گابور، ماتریس وقوع وsift انجام شده است. به منظور تولید سیستم بهینه برای هر بخش ابتدا ویژگی های مناسب هر بخش انتخاب شده است. این انتخاب براساس تأثیر ویژگی یا مجموعه ویژگی ها در تشخیص بخش مربوطه با استفاده از دسته بندی کننده های svm و adaboost انجام می شود. در مرحله ی بعد به منظور بهبود نتایج از دسته بندی کننده های ترکیبی با معماری پیشنهادی و بردارهای ورودی انتخاب شده، استفاده شده است. بنابراین برای هر بخش تنها ویژگی های مرتبط به کار رفته است. نتایج حاصل گویای تولید سیستمی کارا است که در مقایسه با کارهای انجام شده، با وجود استفاده از بردارهای ویژگی با طول کم تر (حداکثر 331) دقتی معادل 715/92 درصد دارد.
سعید سعادتی علیرضا عصاره
امروزه بخش عظیمی از تصاویر پزشکی به فرم دیجیتال تولید و ذخیره می شوند، این امر سبب شده است مدیریت پایگاه های داده پزشکی بزرگ، به صورت یک چالش در علم پزشکی نمایان شود. رشد روزافزون پایگاه داده های با حجم بزرگ در زمینه های مختلف پزشکی همچون تشخیص به کمک کامپیوتر، تحقیقات و آموزش کادر پزشکی، نیاز به سیستم های بازیابی تصویر بر اساس محتوا را بیش از پیش مشخص می-کند. در این تحقیق، یک چارچوب برای بازیابی تصاویر از یک پایگاه داده خیلی بزرگ تصاویر اشعه x ، شامل تصاویری از نواحی آناتومی مختلف بدن، با جهت ها و سیستم فیزیولوژی متفاوت، ارایه شده است. در این بررسی با استفاده از مجموعه ای از ویژگی های سطح خاکستری ، شکل و بافت ، اطلاعات با ارزشی از محتویات تصویر استخراج می شود. ویژگی ها با الگوریتم انتخاب رو به جلو انتخاب شده اند، و سپس با یک الگوریتم بهینه سازی و کاهش ابعاد ویژگی مبتنی بر الگوریتم ژنتیک، وزن هر ویژگی در بردار ویژگی مشخص شده است تا ویژگی های ضعیف از بردار ویژگی حذف شود. یکی از مهم ترین مراحل در بازیابی تصاویر، دسته بندی تصاویر است، که سبب کاهش زمان بازیابی تصویر می شود. در سیستم ارایه شده برای دسته بندی تصاویر، از یک دسته بندی کننده ترکیبی کارا استفاده شده است، که ازترکیب دسته بندی کننده های ماشین بردار پشتیبان چند کلاسه و دسته بندی کننده شبکه عصبی ، بهره گرفته است. جهت افزایش کارایی بازیابی، از بازخورد ربط استفاده شده است. سیستم ارایه شده در این تحقیق تحت یک پایگاه داده بزرگ، شامل 11000 تصویر اشعه x در 116 کلاس مختلف، مورد ارزیابی قرار گرفته است. نتایج به دست آمده کارایی بالای این سیستم را اثبات می نماید
صفورا ذاکری بیتا شادگار
پیش نیاز وب معنایی که با هدف ایجاد ارتباط و تعامل مستقیم ماشین ها بدون دخالت بشر طرح شد، وجود مقدار زیادی آنتولوژی و داده های حاشیه نویسی است. با وجود پیشرفت های قابل توجه در ابزارها و راه حل های نیمه خودکار، به میزان کافی از نیروی انسانی و هوش افراد برای ساخت آنتولوژی، حاشیه نویسی داده ها در انواع بعدها و قالب ها و تنظیم کردن اجزای مفهومی در آنتولوژی های متعدد، نیاز است. سری بازی های هدف دار برای استفاده ی مجانی از وقت، هوش و توانایی افراد برای نخستین بار به وسیله ی لوئیس ون آهِن (در سال 2002) ارائه شد. ایده ی استفاده از بازی های هدف دار در درست کردن وب معنایی، به وسیله ی کاترینا سیورپائس (در سال 2006) مطرح شد. سیورپائس، چند بازی را برای حاشیه نویسی معنایی در دامنه های مختلف، ارائه داده است. این رساله، به دنبال آن است که به طور گسترده تری از بازی های هدف دار در ساخت وب معنایی استفاده کند؛ بنابر این، به بررسی آنتولوژی و آنتولوژی فازی، حاشیه نویسی داده ها بر اساس آنتولوژی های موجود و تنظیم اجزای مفهومی در آنتولوژی ها می پردازد. با بررسی مراحل تولید آنتولوژی و آنتولوی متغیر زبانی فازی، مراحلی که انجام شان نیازمند نیروی انسانی بودند، شناسایی و بازی هایی برای انجام برخی از این مراحل، پیشنهاد می شود. در نهایت، یکی از بازی های پیشنهادی با نام واژه معنا (lingogame) که برای پیدا کردن مقادیر متغیرهای زبانی است، پیاده سازی و نتایج حاصل از آن، بررسی می شود.
نیکو ذوالفقارکرهرودی بیتا شادگار
باتوجه به ذات پویای سیستم های چندپیشکاره وب معنایی و وجود پیشکارهای مختلف در آن، شناسایی پیشکارهای قابل اعتماد یکی از چالش های ایجاد ارتباط بین پیشکارها در وب معنایی است. ارزیابی اعتماد در این سیستم ها براساس رفتار گذشته ی پیشکارها انجام می شود. دو منبع اصلی برای کسب اطلاعات از رفتار گذشته ی پیشکارها وجود دارد: ارتباط مستقیم بین پیشکارها و اطلاعات به دست آمده از سایر پیشکارهای اجتماع. باوجود پیشکارها با سلیقه ها و نظرات مختلف، مدل اعتماد پیشنهادی باید بتواند مطابق با نیازهای پیشکارها تنظیم شود. به علاوه برای محاسبه ی اعتبار پیشکارها باید اطلاعات مربوط به رفتار آن ها در گذشته از جامعه ی پیشکارها جمع آوری شود. همچنین اعتماد ابعاد مختلفی دارد و ممکن است میزان اعتماد به پیشکار مفروضی در ابعاد مختلف متفاوت باشد. این رساله برای حل هر یک از این چالش ها راه حلی پیشنهاد می دهد. مدل پیشنهادی این رساله از روش توزیع شده ای مبتنی بر شبکه های اجتماعی برای جمع آوری اطلاعات از محیط استفاده می کند و با بهره گیری از شبکه های عصبی مصنوعی میزان اعتبار را براساس مشاهدات جمع آوری شده ارزیابی می کند. شبکه های عصبی در طول زمان مطابق دیدگاه پیشکار آموزش می بینند، بدین ترتیب میزان اهمیت توصیه های جمع آوری شده باتوجه به دیدگاه پیشکار ارزیابی کننده ی اعتماد تنظیم شود. همچنین مدل پیشنهادی در این رساله برای نمایش میزان اعتماد از آنتولوژی ها بهره می گیرد، بدین وسیله میزان اعتماد در ابعاد مختلف محاسبه می شود. این رساله برای بررسی کارایی مدل پیشنهادی، بستری با استفاده از میان افزار jade پیاده سازی می کند و کارایی مدل به طور عملی در آن آزمایش می شود.
مجید زارع بیتا شادگار
در این رساله، به حل مسأله ی هُل دادن جعبه توسط ربات های متحرک پرداخته شد. هدف از انتخاب مسأله ی هُل دادن جعبه در این رساله، مباحث تئوری و عملی چالش برانگیزی است که در این زمینه ی پژوهشی به عنوان کلاسی از مسائل دستکاری اشیاء وجود دارد. این مسأله، نیازمند رسیدن به یک هدف سطح بالا یعنی قرارگرفتن جعبه در مکان مشخصی از محیط، با درنظر داشتن سطح پایینی از نیازمندی ها مثل اجتناب از مانع و حفظ تماس جابه جاکننده ها با جعبه است. در این رساله رفتارهای ربات در محیط به دو دسته ی کلی رهیابی و اعمال نیروی دسته جمعی تقسیم شد. سیستم رهیابی در دو حالت فواصل دور از جعبه و فواصل نزدیک جعبه بررسی شد. رهیابی ربات ها در فواصل دور از جعبه با استفاده از روش فازی به نام فازی-بریتنبرگ پیاده سازی شد. روش فازی-بریتنبرگ رهیابی نرم و کارایی در محیط های ناشناخته، برای ربات های متحرک با دو چرخ ثابت ارائه داد. از آنجا که این روش در فواصل نزدیک جعبه از کارایی لازم برخوردار نبود برای حل این مشکل نامطلوب، مکانیسم تعویض الگوریتم استفاده شد به گونه ای که در فواصل نزدیک جعبه سیستم رهیابی ربات ها با الهام از الگوریتم حشره پیاده سازی شد. در سیستم رهیابی از بینایی ربات استفاده و از روش پردازش تصویری به نام تشخیص لکه به منظور تشخیص جعبه در محیط استفاده شد. همچنین با کمک روش تشخیص لکه، روشی برای تخمین فاصله ی جعبه تا ربات پیاده سازی شد. در این رساله، جهت انتخاب یک استراتژی اعمال نیرو، روشی بر پایه ی الگوریتم بهینه سازی اجتماع ذرات پیشنهاد شد. ابتدا مسأله ی اعمال نیرو به جعبه به یک مسأله ی بیشینه کردن تبدیل و سپس براساس آن یک تابع ارزیابی برای هر ذره در الگوریتم دسته ی ذرات، بر پایه ی مقدار و جهت نیروی وارد شده توسط ربات ها به جعبه، تعریف شد. در هر بار تکرار الگوریتم، بهترین مکان سراسری ذره به عنوان بهترین استراتژی ربات در اعمال نیرو به جعبه انتخاب و جعبه با این استراتژی به سمت مکان هدف هُل داده شد. ربات ها و محیط با استفاده از نرم افزار ویباتز شبیه سازی شدند تا قوانین و شرایط موجود در دنیای واقعی بر مسأله حاکم شود. ربات استفاده شده در این رساله ربات چمرو است که در دانشگاه شهید چمران اهواز طراحی و شبیه سازی شده است. مشاهدات و تجربه های به دست آمده از سیستم شبیه سازی شده نشان داد که با به کارگیری روش های گفته شده، جعبه با هم کاری ربات ها در مکان مطلوب در محیط قرار گرفت.
عباس رعایایی اردکانی علیرضا عصاره
چهره یکی از مولفه های بیومتریک بسیار مهم انسان به شمار می رود که از طریق آن اطلاعات مفیدی از جمله نژاد، هویت، سن، جنسیت و حالات چهره قابل استخراج است. در این بین تشخیص جنسیت بسیار حائز اهمیت بوده و نقش بسیار مهمی را در ارتباطات اجتماعی ایفا می کند. یک سیستم تشخیص جنسیت خودکار می تواند دارای کاربردهای متعددی در تعامل انسان و کامپیوتر، روانشناسی، مسائل امنیتی، دموگرافی و تجاری داشته باشد. در این پایان نامه یک سیستم تشخیص جنسیت با قابلیت پیاده سازی بلادرنگ پیشنهاد شده است. در این سیستم از تعمیم و بهبود عملگر استخراج مشخصه الگوی باینری محلی استفاده شده است. این عملگر بهبود یافته قادر است اطلاعات مربوط به بافت تصویر را از همسایگی ای با شعاع دلخواه جمع آوری کند. همچنین این عملگر توانسته است مشکلات رایجِ مربوط به افزایش شعاع همسایگی که شامل افزایش بیش از حد تعداد حالات ممکن و یا غیرمعتبر شدن الگو های استخراجی می شود، مرتفع سازد. نتایج به دست آمده نشان دهنده کارایی سیستم و مقاوم بودن آن به نویز بوده و دقت اندازه گیری شده برابر 97.51 درصد است.
محمد الیاسی قوپی بیتا شادگار
در دنیای امروز با توسعه و گسترش سریع تصویرسازی دیجیتال و دردسترس بودن ابزار آن ازجمله دوربین های دیجیتال، حجم بالایی از اطلاعات در قالب تصویر موجودند. مدیریت و بازیابی کارا و موثر این تصاویر به ویژه توسط ماشین ها یکی از چالش های موجود در این زمینه است. بنابراین سیستم هایی مورد نیاز است که بتوانند این اطلاعات با حجم زیاد را، با دقت بالایی مدیریت و بازیابی کنند. در بسیاری از مواقع موتورهای جست وجو نتایجی را برمی گردانند که مورد نظر کاربر نیست. هدف این رساله تولید یک سیستم حاشیه نویسی خودکاری براساس مفهوم است که قادر به افزودن تعدادی متادیتا به تصاویر است، به طوری که موتورهای جست وجو و سایر سیستم های بازیابی، با استفاده از حاشیه های افزوده شده، بازیابی تصاویر را با دقت بالاتری انجام دهند. با این فرض که معمولاً همراه هر تصویر متنی وجود دارد و البته این متن مرتبط با تصویر است، متن همراه تصویر به منظور حاشیه نویسی استفاده می شود. برای افزایش کیفیت حاشیه های تصویر و به دست آوردن روابط بین مفاهیم موجود در متن ضمیمه ی تصاویر، پس از انجام پیش پردازش های لازم بر روی متون، همراه تکنیک های متن کاوی، از آنتولوژی مرتبط با دامنه و مجموعه وردنت استفاده می شود. سپس به کمک تکنولوژی بازی های هدف دار و طراحی بازی آنلاین تصویر -معنا، سعی می شود که دقت حاشیه ها افزایش یابد. برای این کار از یک مجموعه آزمایشی شامل 3121 خبر گردآوری شده از سایت بی بی سی، همراه تصاویرشان استفاده شده است که در نهایت دقت قابل قبولی روی این مجموعه آزمایشی به دست آمد.
آزاده بیرانوندبرجله علیرضا عصاره
امروزه با توجه به فراگیری استفاده از نامه های الکترونیکی مسأله ای به نام هرزنامه ها به وجود آمده که علاوه بر هدر دادن زمان کاربران، مشکلات دیگری از جمله تحت تاثیر قرار دادن پهنای باند و استفاده ی نادرست از فضای ذخیره سازی را به همراه دارد. لذا، طراحی سیستم های کارا جهت فیلترکردن موثر هرزنامه ها از اهمیت فوق العاده ای برخوردار است. در این پایان نامه، هدف تجزیه و تحلیل، طراحی و پیاده سازی یک سیستم کارا و انعطاف پذیر مقابله با هرزنامه ها مبتنی بر روش های آماری و یادگیری ماشین است. در این راستا، با توجه به پیچیدگی های ذاتی مسأله ی فیلترکردن هرزنامه ها و به کارگیری مستمر روش های بدیع توسط تولیدکنندگان هرزنامه ها جهت جلوگیری از تشخیص و شناسایی این گونه ایمیل ها، تاکید بر استفاده از معماری های چند لایه ای ترکیبی به جای دسته بندی کننده های منفرد است. ویژگی های سیستم پیشنهادی? فیلترکردن هرزنامه، عبارت های موجود در متن ایمیل ها بوده و از آنجا که تعداد این ویژگی ها بسیار زیاد است، یک روش ترکیبی انتخاب ویژگی به منظور پیدا کردن زیرمجموعه ی بهینه ی ویژگی ها به کار گرفته شده است. برای دسته بندی ایمیل ها یک روش ترکیبی مبتنی بر الگوریتم های درخت تصمیم، ماشین بردار پشتیبان و پرسپترون چندلایه معرفی شده و روی مجموعه داده ی lingspam پیاده سازی شده است. نتایج به دست آمده نشان دهنده ی کارایی بالای سیستم نسبت به دسته بندی کننده های منفرد است. صحت اندازه گیری شده برابر 99 درصد است.
علی علی فرد بیتا شادگار
مفهوم «شناخت» و «استدلال» هستهی علومشناختی و هوشمصنوعی است. برخی از علوم مانند فلسفه، منطق، روانشناسی، عصبشناسی و غیره همواره بهدنبال این هستند که دریابند این فرآیندها دقیقاً چگونه در ذهن انسان انجام میشوند. آنچه که قطعی است یا دستکم توسط مشاهدات تجربی تایید میشود این است که مفهوم شناخت در طبیعت همواره با مفاهیم «یادگیری» و «تکامل» درآمیخته است. طبق مشاهدات طبیعی، بیشتر جانداران درابتدای زندگی شناخت کمی از خود و دنیای اطراف خود دارند. اما در طول زمان به نوعی تکامل شناختی دست می یابند. این مفهوم بسیار حیاتی است زیرا هیچ مدل شناختی کاملی از جهان در ابتدای زندگی جانداران دراختیار آنان نیست و هیچ راه مستقیمی هم برای دستیابی سریع به آن وجود ندارد. بلکه شناخت باید در طول زمان حاصل شود. این پایاننامه براساس مفهوم تکامل شناختی که در طبیعت وجود دارد، یک مدل/چارچوب کلی برای یادگیری و تکامل شناختیِ پیشکارها/سیستمهای هوشمند مصنوعی پیشنهاد و ارائه می دهد. زیربنای تئوریک مدل چند فرضیهی شناختی است که در این رساله پیشنهاد میشود. هسته مرکزی این چارچوب نیز یک دستگاه مختصاتی مفهومی چندبُعدی است که پیشنهاد شده و ذهن مجازی پیشکار را شکل میدهد. فرآیند یادگیری مفهومی بهصورت بدون ناظر و توسط الگوریتمهای خوشهبندی مفهومی و الگوریتمهای پیشنهادی این رساله جهت ساخت و تکامل آنتولوژی انجام میشود. در نهایت ارزیابیهای عملی مدل/چارچوب نتایج مطلوبی را نشان داد.
راشین رضازاده بیتا شادگار
وب امروزی اطلاعات را به صورت پراکنده و بدون درنظر گرفتن معنایشان در وب سایت های مختلف قرار داده است. اگر شخصی بخواهد به دنبال کالا و یا مفهوم خاصی در وب بگردد، باید به وب سایت های مختلف مراجعه کرده و اطلاعات آن ها را با هم مقایسه کند. اگر بتوان اطلاعات موجود در وب در زمینه ای خاص را به صورت یکپارچه و معنادار در کنار یکدیگر قرار داد، در وقت و هزینه ی کاربر صرفه جویی می شود. برای انجام این کار باید ابتدا اطلاعات موجود در وب استخراج شده و سپس به صورت یکپارچه در کنار یکدیگر قرار گیرند. این رساله برای استخراج اطلاعات، از وب سرویس ها و برای یکپارچه سازی آن ها از وب معنایی استفاده کرده است. این رساله به طور خاص از آنتولوژی استفاده کرده و آنتولوژی کتاب را تهیه کرده است. بدین صورت که ابتدا یک آنتولوژی اولیه ساخته شده است. سپس اطلاعات موجود در وب در مورد کتاب از طریق وب سرویس ها استخراج شده و در قالب یک آنتولوژی ذخیره شده است. در مرحله ی بعد این آنتولوژی ها باید با یکدیگر تطبیق یابند تا یک آنتولوژی یکپارچه ساخته شود. جهت انجام این کار باید مشابهت های معنایی، رشته ای و ساختاری این آنتولوژی ها درنظرگرفته شود. این رساله برای بررسی مشابهت معنایی و رشته ای از اطلاعات زمینه ای (فرهنگ لغت هایی) مثل ویکی پدیا، وُردنِت، گوگل و غیره استفاده کرده و برای بررسی مشابهت ساختاری از درختِ این آنتولوژی ها استفاده کرده است. در نهایت، آنتولوژی یکپارچه ی نهایی ساخته و نمونه سازی می شود.
مهرداد رشیدی علیرضا عصاره
سرطان سینه شایع ترین سرطان در بین زنان است و دومین عامل مرگ و میر آن ها محسوب می شود. در حال حاضر هیچ راه موثری برای پیش گیری از سرطان سینه وجود ندارد اما تشخیص به موقع این سرطان در مراحل اولیه ی پیشرفتِ آن می تواند شانس بیمار را برای درمان و زنده ماندن افزایش دهد. سیستم های شناسایی و تشخیص به کمک کامپیوتر (cad) به رادیولوژیست ها کمک می کنند تا بتواند توده ها را از روی تصاویر ماموگرافی در مراحل اولیه تشخیص دهد. در این پژوهش پس از پیش پردازش به استخراج نواحی مشکوک پرداخته می شود. با استفاده از الگوی باینری محلی ویژگی ها از نواحی مشکوک استخراج می شود. این ویژگی ها به یک ماشین بردار پشتیبان داده می شود تا نواحی مشکوک به دو دسته، بافت نرمال و توده تقسیم شوند. اگر ناحیه مشکوک، توده تشخیص داده شود آن گاه برای تشخیص خوش خیمی و بدخیمی آن، دسته ی دوم ویژگی ها از طریق ماتریس هم اتفاقی استخراج می شوند. ویژگی هایی که از ماتریس هم اتفاقی استخراج می شوند به دسته بندی کننده ی ترکیبی rotation forest داده می شوند. از مجموعه داده mias برای ارزیابی روش پیشنهادی استفاده شده است. دقت 94.17 درصدی این روش نشان دهنده ی قدرت ویژگی های بافت در شناسایی و تشخیص توده ها می باشد.
بنفشه رکابدار بیتا شادگار
ایجاد رفتارهای مشارکتی در سیستم های چندپیشکاره یکی از مسائل مهم در طراحی این گونه سیستم ها است. برای این منظور روش های بسیاری معرفی شده اند که در آنها طراح نیازمند پیاده سازی دستی این گونه رفتارها در پیشکارهاست. برای راحت تر شدن طراحی این گونه سیستم ها می توان از ایده یادگیری از طریق مشاهده استفاده کرد. در این حالت پیشکارها به مشاهده یک تیم خبره می پردازند تا در محیط جدید رفتارهای آن ها را تقلید کنند. مشکل اصلی در این روش ها عدم امکان مشاهده حالت ذهنی افراد خبره است. به همین خاطر رفتارهای یادگرفته شده وابسته به حالت محیط خواهند بود و این رفتارها برای محیط های پیچیده که در آن افراد خبره به صورت هدفمند و هوشمندانه به دنبال تحقق اهداف خود هستند، کارایی بالایی ندارد. برای حل این مشکل و همچنین یادگیری رفتارهای مشارکتی از طریق مشاهده، در این رساله از ترکیب ایده های یادگیری از طریق مشاهده و برنامه ریزی موردی استفاده شده است که در آن پیشکارهای یادگیرنده با دریافت اندکی دانش صریح دامنه می توانند داده های مشاهده شده را تحلیل کنند و به جای رفتارهای ساده وابسته به حالت، برنامه های پیچیده برای انجام وظایف را فرا بگیرند. پیاده سازی و ارزیابی این روش در محیط پیچیده مسابقات شبیه سازی شده ربوکاپ حاکی از موفقیت روش پیشنهادی در یادگیری رفتارهای مشارکتی و هدفمند دارد.
نغمه سهرابیان بیتا شادگار
این رساله روشی را برای نگهداری موثر دادههایپیوندی مبتنیبر آنتولوژی فراهم میآورد؛ بهگونهای که بتوان با کارایی مناسب در حداقل فضای نگهداری این دادهها را ذخیره کرد و مورد پرسوجو قرار داد. این رساله با استفاده از تجزیهی ساختار آنتولوژیهای owl، نگاشتی خودکار بین اجزای ساختاری آنتولوژی و الگوی پایگاهدادهی رابطهای ترتیب میدهد و با تقسیم جدولهای بزرگ شامل سهتاییهای rdf به جدولهای کوچکتر نوعی طبقهبندی روی دادههایپیوندی بهوجود میآورد. این طبقهبندی باعث انسجام دادهها میشود و حاصل آن بهینهسازی پرسوجوهایی است که روی دادهها اجرا میشود. در طراحی پایگاهدادهی متناظر با آنتولوژی تلاش بر انتخاب ساختارهایی است که بتوان دادههایپیوندی را بهسادگی در آنها ذخیره و در مرحلهی بازیابی دادهها با اجرای سادهترین دستورات sql بدون نیاز به انجام پیوند بین جدولهایی با حجم دادهای زیاد، با سرعت و دقّت بالا دادهها را بازیابی کرد. استفاده از شاخصگذاری روی خاصیتهای مورد پرسوجو به افزایش سرعت و بهرهگیری از برخی مکانیزمهای استنتاج، سهم عمدهای در دقّت روش پیشنهادی داشته است. این رساله از بخش جعبهیاطلاعات مربوط به مجموعهدادهی dbpedia نسخهی 3.7 برای ارزیابی روش پیشنهادی خود بهره میگیرد. این مجموعهداده جزء بزرگترین مجموعهدادهها برای دادههایپیوندی است که دارای بیش از 14,000,000 سهتایی rdf است و در آنتولوژی خود بیش از 3.64 میلیون موجودیت، 259 کلاس و 1200 ویژگی دارد.
ژاله نریمی سایی بیتا شادگار
بحث تولید و بازیابی محتوای آموزشی یکی از بحث های مهم در آموزش الکترونیکی است. از طرفی باافزایش محتوا روی وب تلاش برای دسترسی به مفاهیم مرتبط با یک حوزه ی درسی و آموزشی؛ برای مثال مفاهیم مرتبط با حوزه ی سیستم های فازی کاری وقت گیر، هزینه بر و مشکل است و ممکن است جست وجو روی وب، محقق را به نتیجه ی دلخواه نرساند. بنابراین در بسیاری از تحقیقات اخیر سعی بر این است که روش هایی برای دسته بندی و نمایش مفاهیم مرتبط به صورت کلی و یکپارچه ارائه شود. در این تحقیق سعی شده است که با استفاده از پایگاه دانش های عمومی به مفاهیم مرتبط با حوزه ی دلخواه دسترسی پیدا کرده و به صورت دسته بندی شده براساس سطح سختی به دانش ورزان در قالب یک پایگاه دانش ارائه شود. در سال های اخیر به کارگیری تکنیک های وب معنایی برای تولید و نمایش دانش در آموزش الکترونیکی توجه بسیاری را به خود جلب کرده است. این رساله، سیستمی برای تولید و نمایش دانش ارائه می کند که مبتنی بر مفاهیمِ نقشه ی مفهوم، مدل داده ای چارچوب توصیف منابع و آنتولوژی است. از آن جهت که این مفاهیم می توانند دانش مورد نظر را بهتر نشان دهند و معنا را نیز دربرمی گیرند. در روش پیشنهادی از پایگاه دانش عمومیِ dbpedia که مبتنی بر موجودیت های ویکی پدیا است برای استخراج مفاهیم آموزشی، از نقشه ی مفهوم برای ایجاد گرافی از مفاهیم و ارتباطات میان آن ها و از ابزارهای ویرایش گر آنتولوژی مانند پروتگ برای ساخت پایگاه دانش از نقشه ی مفهوم به زبانِ آنتولوژی وب استفاده شده است. همچنین از آن جاکه ساخت مواد آموزشی کاری وقت گیر، مشکل و پرهزینه است، این رساله برای بازیابی مواد آموزشی با استفاده از مدل پیشکارهای وب معنایی از موتورهای جستجوگر وب و وب سرویس های کتابخانه های دیجیتال استفاده می کند. روش پیشنهادی برای ایجاد پایگاه دانش از مفاهیم موجود در حوزه ی سیستم های فازی و بازیابی مواد آموزشی برای هر مفهوم استفاده می کند. ارزیابی سیستم با استفاده از مقایسه ی طرح پیشنهادی با کارهای پیشین و نظرسنجی دانش ورزان انجام می شود. براساس این دو ارزیابی می توان به معنادار بودن، نشانه گذاری ساده، قابلیت پویایی ساده، کامل بودن و قابلیت اشتراک پایگاه دانش حاصل در تمامی سیستم های آموزشی، دسترسی سریع و دسته بندی شده به مفاهیم و سرفصل های آموزشی و دسترسی به منابع بیشتر اشاره کرد.
هادی تجلی زاده علیرضا عصاره
پس از آن که در سال 1996 سشنا تکنولوژی ریزآرایه را کشف کرد، به یک باره حجم انبوهی از داده های مربوط به ژن انسان در اختیار محققین قرار گرفت. همین امر سرآغاز ایجاد شاخه ی جدیدی در علم بیوانفورماتیک برای تشخیص بیماری ها بویژه سرطان گشت. محققین توانستند با تحلیل داده های ریزآرایه و کلاس بندی ژن ها به نتایج مقبولی در زمینه ی تشخیص انواع مختلف سرطان برسند اما همچنان با چالش تعداد بسیار زیاد ویژگی های نامرتبط در داده های ریزآرایه روبرو هستند. از این رو تا به امروز روش های مختلفی برای انتخاب ژن های مرتبط با انواع بیماری ها معرفی و آزمایش شده اند که طبیعتاً هیچ کدام کامل و بدون خطا نبوده اند. علاوه بر انتخاب ژن ها، تکنیک استفاده شده برای دسته بندی داده ها نیز تأثیر مستقیمی بر نتایج نهایی خواهد گذاشت.به طور مثال، تکنیک های منفرد معمولاً در مقابل تکنیک های ترکیبی خطای بیشتری در تشخیص بیماری و دسته بندی داده ها دارند. از این رو این پایان نامه در صدد یافتن تکنیکی ترکیبی برای انتخاب ویژگی و دسته بندی داده ها است که علاوه بر حذف ویژگی های نامرتبط و ارائه ی دسته بندی قابل قبول دارای هزینه ی محاسباتی بالایی نباشد و با حداقل صرف زمان، بهترین نتیجه را فراهم آورد.?بدین منظور، ابتدا با استفاده از یک روش انتخاب ویژگی از نوع هیبرید مرتبط ترین ژن ها انتخاب شده و سپس با استفاده از یک تکنیک پیشنهادی دسته بندی کننده ی ترکیبی بر پایه ی ترکیب جنگل های تصادفی به دسته بندی داده ها پرداخته ایم و در نهایت نتایج اعمال این تکنیک را بر روی ? مجموعه داده ی ریزآرایه ی واقعی بررسی و این نتایج با ? روش دیگر انتخاب ویژگی و دو روش دسته بندی مقایسه گردید که در اکثر حالات، تکنیک پیشنهادی نتایج قابل قبول تری را فراهم آورده است.
وحید محمدی صفارزاده علی رضا عصاره
ساختمان رگی از مهم ترین بخش های شبکیه است که بررسی دقیق ویژگی های آن می تواند در شناسایی بسیاری از بیماری ها به پزشکان کمک کند. آشکارسازی رگ ها در تصویرهای شبکیه ، یکی از فرایند های بسیار مهم در زمینه ی پردازش تصویرهای پزشکی به شمار می آید. چنانچه تصویرهای شبکیه دچار ناهنجاری های روشن و تاریک باشند، این کار پیچیده تر نیز می شود. در این پایان نامه، دو روش برای آشکارسازی اتوماتیک رگ ها در تصویرهای شبکیه های سالم و بیمار پیشنهاد شده است. هر روش دو گام دارد، که گام دوم آن ها یکسان است. در هر دو روش و در گام نخست، روندی برای کاهش ناهنجاری های روشن به کار می رود. در روش ?، این روند براساس الگوریتم جداسازی چندمیانگینه، و در روش ?، با بهره گیری از یک فرایند ترازبندی انجام می شود. در گام دوم، یک عمل گر خط چنداندازه ای برای یافتن ساختارهای خطی رگ و چشم پوشی از ساختارهای نامنظم ناهنجاری های تاریک به کار می رود. روش های پیشنهادی روی دو پایگاه تصویر شبکیه ، به نام درایو و استار، آزمایش شده اند. کارایی آن ها در جداسازی رگ های تصویرهای این دو پایگاه، از دیدگاه دقت و سطح زیر نمودار راک، با بهترین کارهای انجام شده تاکنون مقایسه شده است. نتیجه ی ارزیابی ها نشان از کارایی قابل مقایسه ی روش های پیشنهادی با دیگر روش ها دارد.
سمانه شریفیان علیرضا عصاره
با رشد چشم گیر استفاده از اینترنت، حجم اسناد متنی دیجیتال موجود نیز به صورت نمایی افزایش می یابد. از این رو، یافتن اطلاعات مفید از این اسناد متنی در کاربردهای بسیاری اهمیت پیدا کرده است که رده بندی خودکار متون، تکنولوژی کلیدی برای این منظور است. به ازای هر سند متنی، واژهها نقش ویژگی را در رده بندی ایفا می کنند که با توجه به حجم زیاد واژه در زبان طبیعی، این مسأله منجر به ایجاد مشکل ابعاد زیاد ویژگی می شود. بنابراین، در رده بندی متون علاوه بر انتخاب یادگیرنده ی مناسب، انتخاب ویژگی نیز از اهمیت ویژه ای برخوردار است. در این پایان نامه، هدف طراحی یک سیستم رده بندی کارا است که با حداقل ویژگی، کارایی نهایی یادگیرنده را افزایش دهد. در این سیستم یک روش ترکیبی همگن، مبتنی بر زیرمجموعه های متفاوت ویژگی بررسی می شود که باعث بهبود کارایی رده بند پایه در حداقل تعداد ویژگی می-گردد. به منظور تولید زیرمجموعه ها از تکنیک های فیلتری استفاده شده تا زمان ایجاد کامل مدل نسبت به تکنیک های پوششی به حداقل برسد. در مرحله ی یادگیری، سه رده بند ماشین بردارپشتیبان، رگرسیون لجستیک بیزی و درخت تصمیم بررسی شده اند. نتایج به دست آمده بر روی مجموعه داده ی رویترز-21578، بر اساس دو معیار میکرو-f1 و ماکرو-f1، نشان دهنده ی کارایی بالای سیستم ارائه شده نسبت به رده بندهای منفرد و حتی سیستم ترکیبی ناهمگن است. بالاترین کارایی مربوط به سیستم مبتنی بر ماشین بردار پشتیبان و روش ترکیب کمینه، با مقدار 0.97 برای میکرو-f1 و 0.921 برای ماکرو- f1 است.
رامین محرابی بیتا شادگار
در دنیای امروز سرعت چشم گیر رشد علم و دانش، همچنین تغییر شکل داده به مفاهیم در دانش و افزایش روز افزون مفاهیم و ارتباط بین آنها قابل چشم پوشی نیست. در نتیجه نیاز به ساختاری برای نمایش دانش ضروری است. آنتولوژی یک ساختار بنیادی برای مفهوم دانش است که به خوبی مفاهیم و ارتباط بین آنها را نشان می دهد. از آنجاکه مفاهیم و ارتباط بین آنها روز به روز گسترده تر و بیشتر می شوند و در گذر زمان تغییر می پذیرند و همچنین فراگیرتر شدن استفاده از آنتولوژی در حوزه های مختلف تکامل آنتولوژی تبدیل به یک مسئله مهم شده است. با توجه به اهمیت موضوع هدف این پایان نامه ارائه روشی برای تکامل خودکار آنتولوژی است. همچنین نظر به مزایای استفاده از پیشکارهای هوشمند، در این پایان نامه روشی برای تکامل خودکار آنتولوژی در محیط چندپیشکاره هوشمند ارائه است. آنتولوژی به گونه ای تکامل می یابد که قابل استفاده باشد. پیشکارهای هوشمند با استفاده از دریافت هایی که از محیط دارند تغییرات را احساس می کنند، سپس تغییرات را روی آنتولوژی اعمال می کنند و آنتولوژی تکامل می یابد. پس از ارزیابی آنتولوژی حاصل، ملاحظه می شود که روش پیشنهادی از دقت قابل قبولی برخوردار است.
سیدمحمدباقر ال طیب علیرضا عصاره
یکی از مهم ترین بخش ها در تصاویر شبکیه چشم، دیسک نوری است. با بررسی دیسک نوری، می توان به وجود برخی بیماری های شبکیه پی برد. همچنین، در تصاویر شبکیه، برای شناسایی بخش های دیگر، ابتدا باید دیسک نوری را تشخیص داد. بنابراین، یکی از اعمال ضروری در پردازش تصاویر شبکیه ی چشم، تشخیص و جداسازی دیسک نوری است که برای تولید و توسعه ی برنامه های تصویربرداری از شبکیه استفاده می شود. در این پایان نامه، فرایند تشخیص دیسک نوری را به دو بخش تقسیم کرده ایم. بخش اول، یافتن مکان تقریبی دیسک نوری است که این عمل توسط روشی جدید، با استفاده از کانال های مختلف در فضاهای رنگی متفاوت انجام شده است. بخش دوم، یافتن محدوده ی دقیق دیسک نوری است که برای آن، یکی از روش های کانتور فعال هندسی را به کار برده ایم. برای داشتن نتیجه ی بهتر، تغییری در یکی از توابع کانتور فعال ایجاد کرده ایم. روش ارائه شده را بر روی مجموعه تصاویر مِسیدور به کار برده ایم که نتایج آن در این پایان نامه ارائه شده است.
نجمه بخشنده باورساد علیرضا عصاره
مغز به عنوان پیچیده ترین عضو بدن و ویژگی رهبری کننده آن از دیرباز مورد توجه بسیاری از محققین بوده است. امروزه واسط مغز-کامپیوتر، عنوان کلی از روش هایی است که به منظور برقراری ارتباط مغز با دنیای اطرافش پیشنهاد شده اند. لذا اگر سیستمی بتواند سیگنال های ثبت شده از تعدادی فعالیت ذهنی را از یکدیگر تفکیک کند، آن فعالیت ها یک الفبای ساده را تشکیل می دهند، که فرد می تواند با انجام ترکیب های مختلفی از آن ها، با دنیای اطراف ارتباط برقرار کند. یک سیستم به عنوان واسط مغز و کامپیوتر از قسمت های مختلفی مانند ثبت سیگنال، پردازش، رابط کاربری و غیره تشکیل شده است. در این پایان نامه پیش پردازش و دسته بندی سیگنال های مغزی در زمان انجام برخی از فعالیت های ذهنی با استفاده از روش های یادگیری ماشین مورد بررسی قرار می گیرد. برای تفکیک سیگنال های مغزی، به مراحل متعددی اعم از استخراج، انتخاب و بهینه سازی ویژگی ها، انتخاب و طراحی تفکیک کننده ی مناسب و غیره نیاز است؛ که در این پایان نامه روش های مختلفی برای هر یک از این مراحل به کار گرفته خواهد شد. همچنین به منظور حذف اثر نویزهایی مانند پلک زدن، که بر ثبت سیگنال های مغزی موثرند، از الگوریتم های آنالیز اجزای مستقل مقید سریع و الگوریتم قطری سازی تقریبی ترتیبی به عنوان الگوریتم های پیش پردازش، استفاده شده است. علاوه بر این دسته بندی این سیگنال ها با استفاده از دسته بند ی کننده ترکیبی انجام می شود. روش پیشنهادی به طور میانگین، دقتی در حدود 90 درصد را نتیجه می دهد.
مرتضی جادریان بیتا شادگار
در سال های اخیر، تکنیک های فیلتر محتوایی دانش محور مبتنی بر پایگاه دانش و آنتولوژی به روش هایی کارا و قابل قبول برای فیلتر اطلاعات تبدیل شده اند. در این تحقیق از ساختار آنتولوژی و پایگاه دانش های ویکی پدیا، وردنت و bnc برای عمل فیلتر اسناد، بهبود نمایش اولویت های کاربری و محتوای اسناد و محاسبه شباهت معنایی استفاده می شود. همچنین سامان دهی علایق کاربری و محتوای اسناد در پروفایل ها امکان استخراج دانش درباره ی علایق احتمالی کاربران و محتوای اسناد را با استفاده از آنتولوژی و پایگاه دانش فراهم می آورد. این تحقیق روشی نوین و منحصر به فرد در ساختار ترکیب خبرگان برای فیلتر اسناد ارائه می کند و مجموعه ای از بهترین و کاراترین روش های فیلتر را پیاده سازی و با هم یکپارچه می کند. ارزیابی سیستم در دو مرحله ارزیابی روش های محاسبه شباهت معنایی و روش های فیلتر محتوایی با استفاده از مجموعه داده های میلر- چارلز و 20newsgroup انجام می شود. نتایج ارزیابی، همبستگی زیاد روش های محاسبه ی شباهت معنایی میان مفاهیم را با قضاوت بشر نشان می دهد. روش مبتنی بر ویکی پدیا با میزان همبستگی 0.779 نه تنها از دیگر روش های پیاده سازی شده بهتر عمل می کند بلکه از روش های مشابه و شناخته شده ای مانند codc با میزان همبستگی 0.693 و روش esa با میزان همبستگی 0.58 بهتر عمل می کند. به علاوه در ارزیابی روش های فیلتر دانش محور ملاحظه می شود که روش مبتنی بر آنتولوژی با نرخ صحت و کارآیی 98.9 و 98 درصد و روش مبتنی بر ویکی پدیا با نرخ صحت و کارآیی 98.2 و 96 درصد نتایج بهتری نسبت به دیگر روش های مشابه و شناخته شده مانند nb-svm hybrid دارند. همچنین نتایج ارزیابی روش مبتنی بر ساختار ترکیب خبرگان با نرخ صحت و کارآیی 99.4 و 98.9 درصد نشان می دهد که این روش نه تنها از تک تک روش های پیاده سازی شده کارآیی و صحت بالاتری دارد، بلکه می تواند خطاهای عمل فیلتر را تصحیح کند. براساس این نتایج، سیستم پیاده سازی شده می تواند به عنوان رویکرد جدیدی در فیلتر محتوایی و به عنوان چارچوبی برای استفاده در کاربردهای فیلتر اطلاعات استفاده شود
سجاد فولادوند علی رضا عصاره
با فراگیر شدن استفاده از شبکه های کامپیوتری و همچنین افزایش روز افزون نفوذ کنندگان به این شبکه ها، ایجاد سیستم های تشخیص نفوذ کارا کاملا ضروری به نظر می رسد. در این تحقیق هدف ایجاد امنیت و تشخیص نفوذ در شبکه های کامپیوتری با استفاده از الگوریتم های سیستم ایمنی مصنوعی است. در تحقیق حاضر، نسخه ای جدید از الگوریتم انتخاب منفی برای استفاده در کاربرهای تشخیص نفوذ در شبکه پیشنهاد شده است که الگوریتم انتخاب منفی بر پایه تخمین چگالی نام گذاری شده است. الگوریتم های پیشین انتخاب منفی از مشکل نرخ هشدارهای نادرست بالا و عدم کارایی در کاربردهای واقعی تشخیص نفوذ در شبکه رنج می برند. در الگوریتم پیشنهادی، مرز منعطف تری برای فضای خودی ایجاد شده است و به این ترتیب شناساگرهای کاراتری نسبت به روش های پیشین تولید شده است. ابتدا با استفاده از روش تخمین چگالی مدل ترکیبی گوسی، چگالی فضای خودی مدل شده است و سپس با استفاده از این مدل ترکیبی گوسی از کلاس نرمال، شناساگرهایی برای نمایندگی فضای غیر خودی تولید شده اند. در پایان، این شناساگرها خوشه بندی شده و در مرحله تصمیم گیری مورد استفاده قرار گرفته اند. علاوه بر این، تحقیق حاضر با معرفی یک تابع هدف مناسب، تعداد بهینه شناساگرها برای هر مسئله را به صورت خودکار تخمین می زند. نتایج ارزیابی صورت گرفته بر روی مجموعه داده nsl-kdd نشان دهنده این موضوع است که الگوریتم پیشنهادی با دقت 07/94 قادر است نفوذهای شبکه را کاراتر از روش های مشابه شناسایی کند. همچنین، الگوریتم انتخاب منفی بر پایه تخمین چگالی با استفاده از مجموعه داده های دیگر مورد ارزیابی قرار گرفته است و نشان داده شده است که این الگوریتم بر روی این مجموعه داده ها نیز دقت قابل قبولی دارد و کاراتر از الگوریتم های مشابه است.
علی نبیان خوزانی علی رضا عصاره
امروزه صفحات گسترده وب به بزرگ ترین منبع اطلاعات برای انسان تبدیل شده است. با افزایش تعداد کاربران وب و همچنین وب سایت ها، نیاز به دسته بندی صفحات وب روز به روز بیش تر احساس می شود. در این پایان نامه، ابتدا مجموعه داده مناسبی از چهار گروه از صفحات وب استخراج شده است. در ادامه از اطلاعات موجود در متن، ساختارو آدرس صفحات وب استفاده شده است. پس از پیش پردازش اطلاعات ورودی و حذف کلمات غیر مرتبط موجود در صفحات، فرآیند انتخاب ویژگی و حذف نویز انجام شده است. در ادامه با بهره گیری از روش های استخراج ویژگی، ابعاد مجموعه ی داده کاهش داده شده است.با توجه به اینکه مجموعه داده ورودی یک مجموعه داده ترکیبی است و اطلاعات و ویژگی های این مجموعه داده از منابع مختلفی نظیر آدرس، متن و ساختار صفحات وب استخراج شده اند، از مفهوم ترکیب دسته بندی کننده ها برای ایجاد یک سیستم دسته بندی کننده صفحات وب کارا استفاده شده است. در سیستم ترکیبی پیشنهادی ابتدا دسته بندی کننده مناسب هر مجموعه داده شناسایی شده و در مرحله تصمیم گیری، اطلاعات مرتبط با هر دسته بند به آن دسته بند ارسال می شود. در نهایت، با رای گیری بین این دسته بندی کننده های پایه تصمیم نهایی اتخاذ می شود. نتایج ارزیابی های صورت گرفته نشان دهنده کارایی مناسب و قابل قبول سیستم ترکیبی پیشنهادی است. این سیستم با مقدار میانگین معیارfبرابر با 0.93 کاراتر از سیستم های مشابه عملیات دسته بندی خودکار صفحات وب را انجام داده است.
ساسان اژدرپور ایمان عطارزاده
محاسبات ابری، اخیراً بعنوان یکی از مهمترین موضوعات در زمینه تکنولوژی اطلاعات معرفی شده است و مزایای فرآوانی از جمله کاهش هزینه و سهولت در استفاده دارد اما، به دلیل اینکه در فضای مجازی اینترنت ارائه می شود و اینترنت مکانی نیست که بتوان کنترل کاملی بر روی آن داشت با مسائل بحرانی بسیاری روبرو است که مهمترین آنها امنیت می باشد. نگرانی در مورد امنیت داده ها، اصلی ترین عامل محدودیت توسعه محاسبات ابری می باشد. امنیت داده ها عمل محافظت داده ها از انحراف و دستیابی غیرمجاز است. برقراری امنیت داده ها در سطح قابل قبول، نیازمند توجه به اصول امنیت داده ها می باشد. مهمترین این اصول محرمانگی و تمامیت است. محرمانگی حفاظت از افشای اطلاعات به سیستم ها و اشخاص غیرمجاز و تمامیت تضمین اعتبار و درستی اطلاعات است. مسائل امنیت داده ها، بطور بالقوه در تمامی انواع سرویس های محاسبات ابری، نگران کننده است و نیازمند بکارگیری اصول امنیت و مکانیزیم های تکنیکی امنیت برای برطرف کردن نگرانی های کاربران می باشد. تاکنون روش های مختلفی برای کنترل امنیت محاسبات ابری ارائه شده است اما همچنان امنیت داده ها گلوگاه محاسبات ابری محسوب می شود. روشی ،dicp و بررسی تمامیت داده ها apcc در این تحقیق، با ترکیب تکنیک های احراز هویت برای بهبود امنیت داده ها در محاسبات ابری ارائه شده است. مهمترین ویژگی های روش پیشنهادی، حفظ اصول امنیت داده ها، قابلیت حسابرسی عمومی و پشتیبانی از عملیات پویایی داده ها پیاده سازی شده است. آنالیز مقادیر cloudsim می باشند. روش پیشنهادی با استفاده از شبیه ساز شاخص های ارزیابی استخراج شده از نتایج آزمایشات شبیه سازی به خوبی نشان می دهد که از هزینه ،ssl یک طرف، فرآیند احراز هویت در روش پیشنهادی در مقایسه با پروتکل تصدیق ارتباطی و محاسباتی کمتری به خصوص در سمت سرویس گیرنده دارد و از طرف دیگر، فرآیند بررسی تمامیت با داشتن کمترین هزینه ارتباطات در مقایسه با سایر طرح ها، مصرف پهنای باند شبکه را به حداقل می رساند.
سرور صلواتی علیرضا عصاره
با افزایش سرعت خطوط ارتباطی و نیز مطرح شدن کیفیت سرویسهای ارائه شده توسط شبکه، جدا کردن جریانهای متمایز در مسیریابهای اینترنت به عنوان یکی از راهکارهای بالا بردن سرعت و کارایی مسیریابها همواره مورد توجه بوده که هدف اصلی این تحقیق نیز، هست. در این فرآیند که دستهبندی ترافیک اینترنت نامیده میشود، کلیهی بستههای متعلق به یک جریان مشخص، تحت تأثیر یک قانون خاص قرار گرفته و بهصورت یکسان پردازش میشوند. بهعبارت دیگر، جریانها براساس یک یا چند مشخصه مانند آدرس مبدأ، آدرس مقصد، پورت مبدأ، پورت مقصد و شمارهی پروتکل از همدیگر متمایز شده و با هر کدام براساس قوانین تعریف شده برخورد میشود. در این پایاننامه، هدف بهکارگیری روشهای یادگیری ماشین بهمنظور دستهبندی کارای ترافیک اینترنت است. در این راستا، از مجموعهدادهی جمعآوری شده در مرکز تحقیقاتی دانشگاه کمبریج استفاده شده است. در ابتدا، عملیات پیشپردازش بر روی دادهها اعمال شده و از آنجا که این مجموعهداده نامتوازن است یعنی، نسبت دادهها در کلاسهای متفاوت با هم اختلاف زیادی دارد، از یک الگوریتم انتخاب ویژگی مناسب براساس محاسبهی ضریب بایاس ویژگیها، استفاده شده است. سپس، از یک روش دستهبندی ترکیبی جهت دستهبندی جریانها و تخصیص آنها به کاربردهای خاص، پیشنهاد و پیادهسازی شده که کارایی آن برابر 99.51% ارزیابی شده است.
حمزه فرامرزی بیتا شادگار
وب به عنوان یک منبع بزرگ اطلاعاتی، روز به روز انباشته تر شده و به همین دلیل دسترسی کاربران به اطلاعات دلخواه شان دشوارتر می شود. تاکنون راه حل های متفاوتی جهت جست و جو در وب ارائه شده است که از میان آن ها وب معنایی مقبولیت بیشتری دارد. در وب معنایی نیز همچون وب سنتی، جست و جو به عنوان یکی از اساسی ترین و پرکاربرد ترین نیازمندی کاربران، اهمیت فراوانی دارد. موتور جست و جوی متن باز و معنایی واتسون بستری برای گسترش نرم افزارهایی است که در محیط وب معنایی به بهبود بخش های مختلف می پردازند. علاوه بر بستر فوق واتسون ابزاری برای جست و جوی کاربران نیز فراهم کرده است که کاربر کلمه کلیدی مورد نظر خود را وارد کرده و لینک های معنایی وابسته به کلمه را مشاهده می کند. موتور جست و جوی واتسون بدون پیش پردازش روی کلمه کلیدی (ورودی)، لینک ها (خروجی) را به صورت غیر مرتب به کاربر نمایش می دهد. این امر باعث می شود کاربر در یافتن لینک مفید زمان زیادی را صرف نماید. علاوه بر این اگر کاربر چند کلمه ی کلیدی را به موتور جست و جو دهد، موتور جست و جو بدون درنظر گرفتن درجه ی اهمیت آن ها، صفحاتی را که شامل تمام مفاهیم عنوان شده توسط کاربر است نمایش می دهد. در این پژوهش با استفاده از منطق فازی الگوریتمی جهت بهینه سازی واتسون با قابلیت هایی شامل تعیین درجه اهمیت کلمات کلیدی، اعمال عملگر مکمل گیری، اعمال عملگرهای منطقی، رتبه بندی لینک های خروجی براساس ابرداده های وزن و چگالی کلمه کلیدی و دسته بندی نتایج براساس نام سایت پیشنهاد شده است. خروجی این الگوریتم از نظر تعداد لینک ها، رتبه بندی و اعمال نظر کاربر نسبت به نتایج واتسون بهبود یافته است.
رویا خسروتاج بیتا شادگار
سرویس پست الکترونیک یکی از محبوب ترین سرویس های اینترنت است که بخش مهمی از این ایمیل ها، مورد درخواست و تقاضای کاربر نیست. عدم درخواست این ایمیل ها و یا عدم شناسایی فرستنده هرزنامه تعریف می شود که البته همین تعریف نیز مورد توافق همه افراد قرار نگرفته است. از مهمترین چالش های شناخت هرزنامه، وابستگی آن به سلایق کاربر است. به-عبارت دیگر یک ایمیل ممکن است برای فردی هرزنامه و برای فرد دیگری ایمیل موجه تلقی شود. این موضوع، مفهوم جدیدی را با عنوان شخصی سازی ایمیل ایجاد می کند. عدم ارائه تعریف دقیق هرزنامه و همچنین تنوع سلایق و نظرات کاربران در مورد این¬گونه ایمیل ها، مانع ایجاد مکانیزم مناسبی برای جلوگیری از دریافت و یا ارسال هرزنامه شده است. در این پایان نامه برای مشخص کردن نوع کلاس های ایمیل و طبقه بندی آن، از یک هستان شناسی دامنه استفاده می شود. به علاوه در حین انجام کار با استفاده از مجموعه داده ها ، آنتولوژی پایه تکمیل و درنهایت از آنتولوژی جدید برای کلاس بندی ایمیل استفاده می شود. باید توجه داشت که تغییر سلایق افراد در گذر زمان و فیلتر هرزنامه دارای رابطه مستقیم هستند، این رابطه به¬نحوی است که با تغییر سلایق افراد، آنتولوژی مربوطه باید خود را به¬روز نموده و مکانیزم پویایی برای جلوگیری از ارسال هرزنامه ایجاد کند به طوری که این موضوع در این تحقیق لحاظ می شود. به علاوه نتایج به وضوح برتری 1/99 درصدی روش پیشنهادی را نسبت به روش های پیشین نشان می دهد، به ویژه که هم زمان نسبت به تغییرات سلیقه ی کاربر نیز به صورت پویا عمل می کند.
محمدرضا پورخانی بیتا شادگار
وب مخزن عظیم و رو به گسترش داده هاست و اغلب منابع اطلاعاتی آن توسط پایگاه داده های رابطه ای ذخیره و مدیریت می شود. امروزه ماشین فهم کردن و دسترسی معنایی به این حجم عظیم از داده ها، یک ضرورت است. در این میان فناوری وب معنایی با هدف ایجاد قابلیت پردازش روی داده های وب پیشنهاد شده است. ساخت آنتولوژی نقش محوری را در وب معنایی برعهده دارد، اما استخراج آنتولوژی از پایگاه داده های رابطه ای موجود تحت وب به طوری که امکان پرس و جوی معنایی فراهم شود، با مشکلاتی روبروست. این مشکلات ناشی از تفاوت های بین مدل رابطه ای و آنتولوژی و همچنین عدم دسترسی مستقیم به پایگاه داده های رابطه ای تحت وب است. در این پایان نامه شباهت ها و تفاوت های بین مدل رابطه ای و آنتولوژی به طور دقیق بررسی شده است. همچنین از آن جایی که به طور طبیعی دسترسی مستقیم به پایگاه داده های رابطه ای تحت وب برای ایجاد آنتولوژی مُیسر نیست، بنابراین روشی نیمه خودکار برای ایجاد آنتولوژی مبتنی بر پیمایش صفحات html مرتبط با پایگاه داده های رابطه ای در دامنه ای مفروض پیشنهاد شده است. این روش که «استخراج آنتولوژی با پیمایش صفحات html» نام دارد، ابتدا شبه پایگاه داده رابطه ای براساس الگوی موقعیت داده ها در صفحات html به عنوان مدل میانی ایجاد و سپس توسط خزنده تاپل های این شبه پایگاه داده رابطه ای از صفحات html بازیابی می شود و در ادامه آنتولوژی دامنه و نمونه های آن به کمک قوانین سیستم انتقال از این شبه پایگاه داده رابطه ای استخراج می شود. در روش پیسنهادی به دلیل استفاده از صفحات html مبتنی بر سیستم مدیریت محتوا، مشکلات ساخت آنتولوژی از روی صفحات html مانند تغییر دائمی صفحات، داده های نامرتبط و ساختار گوناگون صفحات html تا حد زیادی برطرف شده است. آنتولوژی دامنه اساتید رشته کامپیوتر دانشگاه های ایران توسط این روش استخراج شده است. دقت و صحت آنتولوژی استخراج شده به ترتیب توسط کارشناس دامنه و استدلالگر ++fact ارزیابی شده و درنهایت پرس و جوهای معنایی به زبان sparql روی آن اعمال می شود. دقت و فراخوانی نتایج حاصل از پرس وجوها روی آنتولوژی استخراج شده، جامعیت قوانین سیستم انتقال، درکنار اجرایی بودن روش پیشنهادی، موفقیت روش پیشنهادی را تأیید می کند.
محمد مروت علیرضا عصاره
ارائه فناوری ریزآرایه در سال های اخیر، امکان مانیتورینگ بیان هزاران ژن را به طور همزمان فراهم نموده است. تحلیل هایی که در زمینه داده های ریزآرایه صورت گرفته است، بیانگر قدرت این فناوری در زمان تشخیص بسیاری از بیماری ها، از جمله سرطان است. چالشی که در این زمینه مطرح است، تعداد بالای ژن ها (ویژگی ها) و ازطرفی تعداد پایین نمونه ها است. در این پایان نامه، دو روش با دو رویکرد متفاوت به منظور ارائه یک سیستم کارای تشخیص سرطان ازطریق تحلیل داده های ریزآرایه ارائه شده است. در روش اول، چندین روش ترکیبی در راستای دستیابی به روشی مقاوم با یکدیگر ترکیب شده اند و درنهایت ترکیب نتایح توسط رأی گیری اکثریت صورت پذیرفته است. روش پیشنهادی دوم به منظور ارتقاء کارایی مرحله انتخاب ژن روش اول، از یک روش ترکیبی در مرحله انتخاب ژن سود جسته است که این روش ترکیبی، از ترکیب فیلترها و راپرها تشکیل شده است. درحقیقت به کارگیری فیلترها در گام ابتدایی این روش، زمینه را برای اعمال راپرها در گام بعدی در راستای بهبود دقت نتایج فراهم نموده است. نتایج حاصل از روش های پیشنهادی بر روی 11 مجموعه داده ریزآرایه، بیانگر کارایی بسیار بالای روش های پیشنهادی در راستای تشخیص دقیق بیماری سرطان است.
بشیر میاحی بیتا شادگار
با گسترش رسانه های اجتماعی در فضای وب (انجمن های وب، شبکه های اجتماعی، بلاگ ها و ...) منابعی غنی و ارزان از نظرات به وجود آمده اند، مردم و تولیدکنندگان برای بررسی نظرات به این رسانه ها روی آورده اند. تحلیل نظرها از دو جنبه کاربرد فراوان دارد. برای صاحبان تجارت، گرفتن بازخورد مشتریان از محصول و سرویس می تواند بسیار مفید باشد تا براساس آن، تصمیم های مناسبی را در محصول و سرویس های بعدی خود دخیل کنند. همچنین برای کاربرانی که قصد تهیه محصول را دارند، استفاده از نظر سایرین برای رسیدن به خریدی مطمئن و مطابق با سلایق خود می تواند کمک کننده باشد. هدف اصلی این تحقیق ایجاد و پیاده سازی سیستم کاوش نظرات در وب و تحلیل این نظرات برای به دست آوردن میزان نظرات مثبت و منفی مربوط به هر یک از ویژگی های محصول است. هدف نهایی این سیستم، مشخص کردن میزان نظرات مثبت و منفی ویژگی های محصول و رتبه بندی (rank) ویژگی های محصولات موجود بر اساس بیش ترین نظرات مثبت و منفی است تا کاربر از بین محصولات موجود، محصولی که دارای بیش ترین نظرات مثبت برای ویژگی های دلخواه است را بتواند انتخاب کند. در تحقیق پیش رو سعی بر آن داریم با استفاده از آنتولوژی و ابزارهای وب معنایی با استفاده از معنای جملات و مفاهیم مستتر در محتویات نتایج بهتری نسبت به روش های سنتی به دست آوریم. در این تحقیق فرض بر این است که در هر نظر، کاربران به ویژگی های مختلفی از موضوع اشاره می کنند و در آن نظر ممکن است برخی ویژگی ها از نظر کاربر مثبت و برخی دیگر از ویژگی ها منفی تلقی شود. با این دید، یک نظر از کاربر را به جای آن که مطلق مثبت یا منفی قلمداد کرد، مثبت، منفی و خنثی را به هر یک از ویژگی هایی که کاربر ذکر می کند اعمال می کنیم.
مرضیه موسویان بیتا شادگار
یادگیری از مهم ترین مسائل مطرح در سیستم های چندپیشکاره است. این سیستم ها شامل چندین پیشکار هستند که با یکدیگر تعامل دارند. در چنین سیستم هایی رفتار پیشکار ها قابل پیش بینی نیست، بنابراین لازم است که پیشکارها از محیط اطرافشان بیاموزند و خود را با آن سازگار کنند. پیشکارها برای یادگیری، نیازمند مدل ها و الگوریتم های یادگیری هستند. در این پایان نامه مدل یادگیری مبتنی بر مشاهده، که با نام یادگیری تقلیدی نیز شناخته می شود بررسی می شود. استدلال مبتنی بر مورد، یکی از معمول ترین روش ها برای پیاده سازی یادگیری تقلیدی است. ملاحظه می شود که در محیط های پیچیده ارائه مدلی از یادگیری ضرورت دارد.این تحقیق ابتدا با استفاده از یادگیری تقلیدی پیشکار را در محیط دو بعدی فوتبال شبیه سازی کرده، سپس به منظور افزایش کارایی در یادگیری، از الگوریتم های تکاملی برای تخمین مقدار بهینه پارامترهااستفاده می شود. برای این منظور از ترکیب مناسبی از الگوریتم های تکاملی، یعنی الگوریتم ژنتیک و تبرید تدریجی استفاده می شود. نتایج نشان می دهد که استفاده از این الگوریتم ها، سبب افزایش سرعت پردازش، کارایی و نرخ همگرایی سیستم می شود.
فاطمه حیدری علیرضا عصاره
افزایش کاربران ایمیل، منجر به افزایش چشمگیر هرزنامه ها در طی سال های اخیر شده است. تولید کنندگان هرزنامه همواره تلاش می کنند که راهکارهای به روزتری به منظور گریز از فیلترهای موجود بیابند. بنابراین ضرورت دارد که فیلترهای جدیدی متناسب با این هرزنامه ها توسعه یابد. عموماَ مهم ترین ابزار به منظور فیلترکردن هرزنامه ها بر اساس طبقه بندی متون کار می کنند. تاکنون روش های زیادی به منظور مقابله با هرزنامه پیشنهاد شده است، اما با توجه به بکارگیری مستمر تکنیک های جدید توسط تولیدکنندگان هرزنامه ها، نیاز بیش از پیش به استفاده از تکنیک های جدید و هوشمند مقابله با این هرزنامه ها احساس می شود. روش های جامع برای مقابله با هرزنامه، معمولاَ چندین روش را به منظور طراحی یک روش قدرتمند، با هم ترکیب می کنند. هدف این پایان نامه بررسی روش های موجود فیلترکردن هرزنامه ها و توسعه و پیاده سازی یک روش جدید و کارای فیلترکردن هرزنامه بر اساس روش های ترکیبی یادگیری ماشین می باشد. این پایان نامه از مجموعه دادهlingspam و spamassassin استفاده کرده است و شامل سه بخش آماده سازی داده، دسته بند های منفرد و دسته بندهای ترکیبی است. در بین نتایج دسته بندهای منفرد، الگوریتم های svm، smo و logistic regression بهترین عملکرد را ارائه نموده اند. در نهایت، با بررسی نتایج دسته بندهای ترکیبی، با توجه به معیارهای صحت، دقت و بازخوانی، مدل پیشنهادی ارائه شده است.
شیرین جمشیدیان علیرضا عصاره
با توجه به استفاده ی روزافزون از شبکه ی اینترنت و لزوم وجود ابزارهایی جهت کنترل و مدیریت ترافیک شبکه ها و نیز پیدایش مداوم کاربردهایی که با استفاده از تکنیک های بدیع و پیچیده ی مبهم سازی قصد فریب این ابزارها را دارند، طراحی دقیق سیستم های شناسایی و دسته بندی کاربردهای مختلف شبکه از اهمیت زیادی برخوردار است. هدف این پایان نامه طراحی و پیاده سازی یک سیستم هوشمند و کارا جهت شناسایی و دسته بندی ترافیک شبکه، مبتنی بر تکنیک های یادگیری ماشین و هوش محاسباتی است. ساخت چنین سیستمی شامل سه مرحله است؛ مرحله ی اول مربوط به ساخت مجموعه داده و مرحله ی دوم شامل اقدامات پیش پردازشی از قبیل انتخاب ویژگی است. در این مرحله انتخاب ویژگی های مناسب به وسیله ی یک مدل سه لایه ی پیشنهادی انجام می شود. در مرحله ی سوم یعنی مرحله ی دسته بندی، روش های ترکیبی پایه شامل بگینگ، آدابوست و استکینگ و همچنین یک روش پیشنهادی روی داده ها اعمال شده اند. نتایج مقایسات، نشان از دقت بالای سیستم پیشنهادشده دارد. روش پیشنهادی، ترافیک udp را با دقت 21/91 و ترافیک tcp را با دقت 64/99، شناسایی و دسته بندی می کند. همچنین این پژوهش از نخستین کارهایی است که روش استکینگ را در زمینه ی دسته بندی ترافیک شبکه به کار گرفته است.
ایمان پورحسین علیرضا عصاره
در این پایان نامه برای بازشناسی کلمات دستنویس فارسی و عربی برون خط، دو مدل ترکیبی جدید پیشنهاد شده است. با داشتن تعداد زیادی از کلمات، رویکردهای کاهش واژه نامه، روش های قدرتمندی برای هرس ابتدایی کلمات محسوب می شوند. دو مدل پیشنهادی، مبتنی بر روش های کاهش واژه نامه اند و مراحل پیش پردازش، قطعه بندی، استخراج ویژگی و طبقه بندی را در بر می گیرند. ویژگی هایی که از تصاویر کلمات استخراج می شوند را می توان به دو گروهخصوصیت نقاط کلمه و خصوصیت بدنه کلمهدسته بندی کرد.غالب مدل هایی که تاکنون ارائه شده است، تنها یک گروه از ویژگی ها را بکار می برند و توانایی کار با گروه دیگر را ندارند،اما مدل هایی که در این پایان نامه پیشنهاد شده، جهت افزایش کارایی، از هر دو گروهویژگی استفاده می کنند. مدل های پیشنهادی بر روی پایگاه داده ifn/enit که متشکل از بیست و شش هزار تصویر کلمه دستنویس است آزمایش شده و با دقت 95%، نرخ کاهش 89.6% و 96.2% بدست آمده است.
پریسا سعیدی پور علی رضا عصاره
یکی از مسائل مهم در زمینه داده کاوی، مسأله دسته بندی مجموعه داده های نامتوازن است. اصطلاح «مجموعه داده نامتوازن»، عموما به مجموعه داده ای گفته می شود که تعداد نمونه ها در کلاس های گوناگون، اختلاف بسیاری داشته باشند. در این نوع داده ها، به کلاس هایی که کم ترین تعداد نمونه ها را دارند، کلاس اقلیت گفته می شود. به دلیل این که اکثر الگوریتم های یادگیری، یک دسته بند را با فرض برابر بودن تعداد نمونه های آموزشی هر کلاس آموزش می دهند، بنابراین زمانی که این الگوریتم ها را به مجموعه داده های نامتوازن اعمال می کنیم، دسته بند آموزش داده شده، غالبا براساس نمونه های کلاس اکثریت آموزش می بیند. این موضوع به پیش بینی بسیار ضعیف نمونه های کلاس های اقلیت منجر می شود، زیرا آموزش کلاس اقلیت به درستی انجام نشده است. در بسیاری از موارد، کاربران تمایل بیشتری به دسته بندی صحیح نمونه های کلاس های اقلیت دارند. در این پایان نامه هدف این است، روش هایی برای دسته بندی ارائه شوند که علاوه بر بهبود دسته بندی در داده های کلاس های اقلیت، قابلیت دسته بندی داده های کلاس های اکثریت نیز، در سطح قابل قبولی حفظ شود. درراستای دسته بندی صحیح نمونه ها، ابتدا یک روش انتخاب ویژگی مبتنی بر الگوریتم ریلیف - اف، برروی مجموعه داده ها اعمال و سپس سه الگوریتم ترکیبی بگینگ، آدابوست و جنگل تصادفی جهت دسته بندی داده ها، مورد استفاده قرار گرفته اند. به منظور آموزش دسته بندها، از روش های حساس به هزینه که این هزینه ها براساس الگوریتم رقابت استعماری تعیین شده اند، کمک گرفته شده است. روش پیشنهادی بهینه ی مبتنی بر الگوریتم ترکیبی بگینگ، کارایی میانگین 84.98 درصد، برروی 8 مجموعه داده نامتوازن تولید نموده است.
ربابه راعی علی رضا عصاره
با گسترش روز افزون کاربرد وب در زندگی امروزی، از یک سو منابع غنی ای از اطلاعات برای کاربران فراهم شده است و از سوی دیگر کاربران را با سربار اطلاعات مواجه می کند. یافتن دانش مرتبط با موضوعی خاص در میان حجم انبوهی از اطلاعات، کاری بسیار وقت گیر و مشکل است. بنابراین وجود یک سیستم هوشمند که بتواند مناسب ترین منابع و محصولات را بر اساس شرایط و سلایق خاص هر کاربر به وی پیشنهاد دهد، امری ضروری به نظر می رسد. برای این منظور از سیستم های پیشنهاددهنده استفاده می شود. این سیستم های از مکانیزمی قوی برای فیلترسازی اطلاعات استفاده کرده و با پیشگویی امتیازات موردنیاز، کاربران را به سمت بهترین محصولاتی که نیازشان را مرتفع می کند، هدایت می کنند. بر این اساس عملکرد سیستم های پیشنهاددهنده نقش مهمی در کیفیت محصولات پیشنهاد شده به کاربر دارد. یکی از مسائل موثر در کارایی سیستم پیشنهاددهنده، مجموعه داده هایی است که سیستم بر اساس آن، پیشگویی های لازم را انجام می دهد. این داده ها عموماً به صورت ماتریسی از امتیازات هستند که ترجیحات کاربر را نمایش می دهند. بر این اساس به منظور داشتن داده های مناسب، سیستم پیشنهادی ابتدا پیش پردازشی روی مجموعه داده انجام می دهد و به شناسایی و تصحیح نویزهای طبیعی موجود در آن می پردازد. از سوی دیگر یکی از مهم ترین مسائل در سیستم های پیشنهاددهنده چگونگی فیلترسازی اطلاعات است. در این پایان نامه به منظور بهره گرفتن از سلایق و تجربه ی دیگر کاربران از الگوریتم فیلترسازی مشارکتی استفاده شده است. همچنین به منظور بهبود عملکرد سیستم پیشنهادی، از شباهت وزن دار جدیدی استفاده شده که علاوه بر در نظر گرفتن عدم تقارن در شباهت بین دو کاربر متناظر، میزان قابلیت اعتماد این شباهت ها نیز در نظر گرفته می شود و تأثیر شباهت هایی با اعتماد بالاتر در پیشگویی امتیازات بیشتر خواهد بود. هر یک از این گام ها در بهبود عملکرد سیستم نقش موثری دارند.
سحر ارهفت بیتا شادگار
ریشه یابی، تبدیل شکل های گوناگون کلمه به یک جوهره مشترک است که آن جوهره را ریشه نامند. ریشه یابی یکی از مباحث مهم در پردازش زبان طبیعی است که به طور گسترده در سیستم های بازیابی اطلاعات، ترجمه ماشین، دسته بندی متن، خلاصه نویسی متن، شاخص گذاری، متن کاوی و غیره استفاده می شود. در این پایان نامه دو ریشه یاب جدید مبتنی بر الگوریتم تنوع جانشینی برای زبان فارسی ارائه می شوند. این ریشه یاب ها دقت تکنیک های آماری را با استفاده از یک فرهنگ لغت و تکنیک ساختاری افزایش داده است.
علی حوری علی رضا عصاره
بیماری تخریب (دژنراتیو شدن) دیسک های بین مهره ای اصلی ترین علت کمر درد و ناتوانی در انسان است. این وضعیت اغلب در میانسالی و بزرگسالی و بر اثر تخریب دیسک بین مهره ای و یا باریک شدن فضا و تغییر شکل دیسک بوجود می آید. پدیدار شدن این بیماری در ناحیه کمری از ستون فقرات باعث بروز درد در پاها و ناتوانی حرکتی می گردد. روش های مختلفی برای تصویربرداری از ستون فقرات و تشخیص این بیماری وجود دارد. تصویربرداری رزونانس مغناطیسی به دلیل داشتن کنتراست بالا در بافت های نرم نسبت به روش های دیگر برتری دارد. با استفاده از این روش تصویر برداری می توان به اطلاعات بیوشیمیایی بافت و شکل دیسک دست یافت. در عملیات بالینی برای تشخیص نوع بیماری دیسک بین مهره ای و شدت پیشرفت آن از ویژگی های شدت سیگنال، بافت، و شکل دیسک استفاده می شود. این مطالعه یک سیستم کمک تشخیص کامپیوتری خودکار برای تشخیص بیماری دژنراتیو شدن دیسک های بین مهره ای ناحیه کمری را با استفاده از تصاویر mr معرفی می کند. سیستم پیشنهادی از سه بخش اصلی بخش بندی، استخراج ویژگی و دسته بندی تشکیل شده است. در فاز بخش بندی از یک الگوریتم مبتنی بر کانتور برای استخراج دیسک های بین مهره ای از تصاویر استفاده شده است. مدل کانتور به کار رفته در این پایان نامه بجای استفاده از اطلاعات سراسری تصویر از اطلاعات محلی استفاده می کند. در فاز استخراج ویژگی هر دیسک بین مهره ای با استفاده از سه دسته ویژگی شدت سیگنال، بافت و شکل دیسک توصیف می شود. در پایان با استفاده از الگوریتم دسته بندی ماشین بردار پشتیبان (svm) دیسک ها به دو دسته سالم و دژنراتیو تقسیم بندی می شوند. این سیستم با استفاده از 400 دیسک بین مهره ای آموزش داده شده است. همچنین برای تست این سیستم از 230 دیسک بین مهره ای استفاده و سیستم دقت 8/97% را در دسته بندی دیسک ها ارائه نموده است.
هادی تابع الحجه بیتا شادگار
آنتولوژی به عنوان مهم ترین ابزار وب معنایی، در پردازش مفهومی اطلاعات نقشی کلیدی دارد. طراحی آنتولوژی های یک حوزه ی دانش توسط افراد و سازمان های مختلف، نوعی ابهام و ناهمگونی را در اطلاعات ایجاد می کند. در این میان فرآیند تطبیق آنتولوژی ها با تعیین مفاهیم متناظر، نقش مهمی در تعامل نرم افزار های مبتنی بر آنتولوژی و یکپارچه سازی اطلاعات دارد. بسیاری از کاربران، تمایل دارند که اطلاعات خود را به زبان محلی ذخیره کنند؛ لذا آنتولوژی ها با زبان های طبیعی مختلف توسعه یافته اند. زبان فارسی به عنوان زبان بیش از صد میلیون نفر نیز، از این قاعده مستثنا نیست؛ ولی متاسفانه تاکنون پژوهشی برای تطبیق آنتولوژی های فارسی انجام نشده است. این پایان نامه با بررسی چالش های پیش روی تطبیق آنتولوژی های فارسی، راهکار هایی را برای رفع آن چالش ها ارائه داده و یک سیستم تطبیق آنتولوژی فارسی را معرفی می کند.
زهرا خزاعی بیتا شادگار
سیستم توصیه گر یک فناوری مبتنی بر شبکه است که به شکل فعالی کالا های مورد علاقه کاربران را بر اساس رفتارهای عینی آن ها، یا آن چه صراحتاً به عنوان اولویت خود بیان می کنند، ارائه می کند. یکی از مهم ترین چالش های پیش روی سیستم های توصیه گر، مشکل شروع سرد است. در این تحقیق مدلی ترکیبی ارائه شده است که به کمک تکنیک های معنایی این مشکل را بر طرف می کند.این روش با سایر روش ها مقایسه و برای اعتبارسنجی از روش kتایی متقابل استفاده شده است. مدل ارائه شده مشکل شروع سرد را با دقت بالایی بهبود می بخشد.
حبیب اله سقاوی بیتا شادگار
مهم ترین چالش سیستم های چند پیشکاره، نحوه ی آموزش پیشکارها به صورت بهینه است. در این پایان نامه مدل یادگیری مبتنی بر مشاهده، که با نام یادگیری تقلیدی نیز شناخته می شود بررسی می شود. برای این منظور از معماری جدید از الگوریتم رقابت استعماری استفاده می شود. سپس برای بهبود، مجموعه ای از قوانین براساس منطق مرتبه اول برای بهینه سازی عملکرد به صورت مستقیم به سیستم اضافه می شود.