سهیلا کرباسی

بهبود کیفیت داده ها در کامل بودن داده با استفاده از قوانین وابستگی

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی 1390
عبدالرحمان نورزاد سهیلا کرباسی

در دنیای امروزی، فعالیت های سازمان ها و شرکت ها بیش از پیش بر اساس داده ها و اطلاعات حاصل از تحلیل آن ها است. بنابراین، کیفیت داده ها مسئله ی بسیار مهمی است، امّا معمولاً در مسائل داده کاوی و کشف دانش از پایگاه داده ها نادیده گرفته می شود و یا توجه زیادی به آن نمی شود. یکی از مهم ترین فاکتورهای کیفیت داده ها کامل بودن داده ها و مسئله ی داده های گمشده است. تاکنون تکنیک ها و روش های بسیار زیادی برای مدیریت بهتر و انتساب مقادیر داده های گمشده پیشنهاد شده اند؛ امّا عیب اصلی چنین تکنیک هایی آن است که فقط به یک تکنیک متکی هستند و چند تکنیک را با هم ترکیب نمی کنند و این دلیلی بر دقت کمتر آن ها در پیش بینی و تعیین مقادیر داده های گمشده است. قانون وابستگی یکی از تکنیک های اصلی داده کاوی است و شاید بتوان آن را مهم ترین شکل از کشف و استخراج الگوهای موضعی در سیستم یادگیری بدون ناظر دانست. در این تحقیق، جهت افزایش دقت انتساب مقادیر گمشده، از رویکرد ترکیبی تکنیک کاوش قانون وابستگی با استفاده از مفهوم تطابق جزئی و مدل تغییر یافته ی تکنیک k-نزدیک ترین همسایگی استفاده می شود. دلیل اصلی استفاده از تکنیک k-نزدیک ترین همسایگی به عنوان مکمل ترکیبی قانون وابستگی برای انتساب مقادیر، مقاوم بودن آن نسبت به نویز و بنابراین قابلیت کارایی آن در مواقعی است که ارتباط بین مشاهدات مجموعه ی داده ها کم می باشد. از نتایج آزمایشگاهی بر روی مجموعه داده های واقعی بر می آید که دقت و کارایی رویکرد انتسابی ترکیبی ارائه شده در مقایسه با رویکردهایی که فقط به یک تکنیک متکی هستند، خیلی بهتر است.

افزایش ضریب حریم خصوصی در طبقه بندی مبتنی بر تبدیل موجک

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی 1390
محمد اموت سهیلا کرباسی

در سال های اخیر، نظر به افزایش میزان داده های جمع آوری شده توسط شرکت ها و سازمان-ها، داده کاوی به عنوان ابزاری مناسب به منظور بهره گرفتن از داده های مذکور و استخراج اطلاعات از داده ها مطرح گردیده است. اما در استفاده از داده کاوی، زمانی که به قابلیت استخراج اطلاعاتی که صاحب داده از آن بی اطلاع است توجه گردد، می توان آن را به عنوان تهدیدی برای حریم خصوصی در نظر گرفت. بنابراین در داده کاوی، حفظ حریم خصوصی افراد از جمله مسائل مهم و پیچیده ای است که در انتشار داده ها به منظور تحلیل، باید بدان توجه داشت. در سال های گذشته تکنیک هایی برای تبدیل یا تغییر داده با هدف حفظ حریم خصوصی پیشنهاد گردیده اند. هدف کلیدی در طراحی این تکنیک ها حفظ کارآمدی داده ها بدون به خطر انداختن حریم خصوصی می باشد؛ لذا مسئله اصلی، چگونگی محافظت از مقادیر داده ای ضمن حفظ الگوهای داده ای موجود در مجموعه های داده می باشد. یعنی صاحبان داده علاوه بر حفظ حریم خصوصی باید قادر باشند صحت نتایج حاصل از داده کاوی را نیز تضمین نمایند. روش های پیشنهادی مرتبط عمدتاً در دو گروه کلی قرار می گیرند که عبارتند از: روش های پریشانی داده، محاسبات چند جانبه امن. حال با توجه به اینکه روش-های فوق قادر به حفظ الگوهای داده ای در مجموعه های داده نمی باشند و استفاده از داده تغییر یافته توسط روش های فوق نیازمند بازسازی توزیع داده اصلی می باشد، امکان به-کارگیری آن ها برای عملیات داده کاوی که نیازمند حفظ الگوهای خاصی در مجموعه های داده می باشند، وجود ندارد. بنابراین روش هایی نیز برای این گروه از عملیات داده کاوی بر پایه تبدیلات داده ای از جمله تبدیل هندسی، فوریه و موجک پیشنهاد گردیدند. در این تحقیق با به کارگیری تبدیل موجک هار، روش تبدیل داده ای پیشنهاد خواهد شد که ضمن پنهان نمودن داده خصوصی، ویژگی های مورد نیاز الگوریتم طبقه بندی k- نزدیک ترین همسایه نیز حفظ می گردد. نتایج بدست آمده از پیاده سازی روش فوق و آزمایشات حاکی از آن است که روش پیشنهادی ضمن افزایش ضریب حریم خصوصی، الگوهای طبقه بندی را نیز در حد قابل قبولی حفظ می نماید.

First 15 pages

بهبود، تعیین شاخص‏ها و مطالعه تطبیقی عملکرد امنیتی سیستم‏های عامل و نرم‏افزارهای محیط سیار

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده مهندسی کامپیوتر 1390
اکبر محمدی سهیلا کرباسی

چکیده محدودیت های ذاتی محیط‏های سیار gsm، طراحی سیستم های عامل و نرم افزارهایی برای تبادل داده ها در این محیط را دشوار می سازد و ما ناگزیر به تجدید نظر در روش های سنتی دسترسی به اطلاعات، به علت پایین بودن سطح امنیت در این محیط می باشیم. یکی از مهم ترین مسائلی که در طراحی الگوریتم‏های عمل‏کننده در مرکز ارائه دهنده سرویس‏های محیط سیار وجود دارد، میزان قابلیت اطمینان به عدم دسترسی افراد غیرمجاز در تبادل داده‏ها در این محیط می‏باشد. هرچند در این زمینه کارهای متعددی صورت گرفته است، اما با توجه به شرایط خاص محیط های سیار gsm راهکارهای امنیتی با قابلیت اطمینان بالا موجود نمی باشد، و کار طراحی الگوریتم یا سیستم عاملی با حداکثر قابلیت‏های امنیتی برای محیط های سیار دشوار می باشد. هدف این پایان‏نامه شناخت جنبه های مختلف راهکارهای امنیتی ارائه شده در بستر نرم افزارها و سیستم‏عامل‏های عمل‏کننده در محیط های سیار gsm و بیان شاخص‏های موجود در طراحی آن ها، به همراه مقایسه این شاخص‏ها برای ارزیابی امنیتی این‏گونه سیستم ها می باشد، و در ادامه با ارائه یک مدل بهبود یافته احراز هویت که از تشخیص چهره به عنوان یکی از پارامترهای اصلی در دسترسی کاربران میزبان‏های سیارgsm به سرویس‏دهنده مورد نظر برای کاربران (عادی، پیشرفته، تخصصی) با توجه به محدودیت ها و شرایط محیط های سیار gsm بهره می گیرد، این مدل احراز هویت پیاده سازی می شود.

ارائه یک مدل کارآمد برای برقراری حریم خصوصی در رایانش ابری

thesis دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد شاهرود - دانشکده مهندسی کامپیوتر 1392
مهدی عراقی حسین مومنی

دراین مدل مرکزتولید گواهینامه به ازای هر کاربر یا مشتری دو گواهینامه مجزا صادر می نماید.یکی را برای مرکز مدیریت و احراز هویت ابر و دیگری را به کاربر ارسال میکند.این دو گواهینامه ها در کنار هم،عامل ورود و استفاده از سرویس های تعیین شده توسط مالک می باشند.در نبود یکی امکان استفاده سرویس وجود ندارد.هر گواهینامه توسط کلیدی براساس نوع ارسال، قفل شده تا امنیت گواهینامه ارسالی حاصل شود.در طرف دیگربعد از ارسال گواهینامه توسط مالک به ابرودریافت پاسخ و محاسبه زمان پاسخ و منطقه زمانی،گواهینامه مشتری اعطاء و زمان اعتبارگواهینامه تعیین می شود.و کاربران برای اتصال به ابر از تکنیک کوبیدن، به ابر متصل می شوند و بعد از احراز ابتدایی، کاربران به سطح بالاتر برای ساخت پروفایل راه پیدا می کنند و ابر براساس کد دسترسی کاربر، کد مجوز کاربران را رمز گشایی و مجوز های دسترسی آن ها را اعمال و پروفایل موقت می سازد و در نهایت این پروفایل ها در فرآیند بعدی به مرکز بلیت برای صادر کردن بلیت و دسترسی به سرویس مورد نظر ارسال می شود و همزمان باارسال بلیت، مرکز کنترل،نظارت بر بلیت را آغاز و دسترسی ها را چک می کند. از ویژگی های این مدل، می توان به مواردی چونکاهش نفوذ کاربران غیرمجازدر ابربرای جلوگیری از حملات سیل آسا و سرقت اطلاعاتکاهش بار پردازشی بروری سرورهاو هزینه دسترسی و اجرای دستورات، نظارت دوطرفه درابر و مالک استفاده از شناسه مستعار به جای شناسه اصلی کاربر واستفاده از گواهینامه دو تکه برای احراز هویت کاربران تا هم در دسترسی محدود شوندوهم نفوذگر شناسایی شود. درپایان ما توانستیم بااستفاده از تکنیک کوبیدن و گواهینامه دو تکه ارسالی به کاربرو ابر برای احرازهویت واستفاده از بلیت ونظارت کاربران بر مبنای بلیتمشکلات امنیتی که به اطلاعات شخصی کاربران ودستیابیویا افشای اطلاعات مهم در ابر را فراهم می سازد را کاهش دهیم و به موازات آن با کاهش این مشکلات، نظارت و اطمینان کاربران به صحت داده هاو اطلاعات شخصی خود افزایش یافته و موجب بهبودحریم خصوصی می شود.

ارائه ی یک مدل توزیع شده انبارداده در محیط محاسبات ابری

thesis دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد شاهرود - دانشکده مهندسی کامپیوتر 1392
بهاره مهاجر حسین مومنی

انبار داده برای ذخیره مقادیر بزرگ داده استفاده می شود که این داده ها اغلب برای پردازش تحلیلی آنلاین olap)) استفاده می شوند. هدف از این مخازن بزرگ داده حمایت از تصمیم گیری های اولیه در کسب و-کار هوشمند جهت رسیدن به یک پاسخ بهینه از پرس و جوهای تحلیلی پیچیده می باشد. بر خلاف پایگاه-داده سیستم های عملیاتی که دارای معماری رابطه ای می باشند و از نرمال کردن برای جداول استفاده می کنند طراحی انبار داده به شکلی خاص و غیر نرمال می باشد که این امر سبب می شود اتصالات بین جداول کاهش یابد و در نتیجه سبب افزایش سرعت گزارش گیری می شود. محاسبات ابری یک تکنیک مبتنی بر وب می باشد که به موجب آن منابع در قالب سرویس ها به اشتراک گذاشته می شوند. توده عظیمی از داده ها می توانند با هزینه اندک در قالب سرویس های انبار داده، در ابر محاسباتی ذخیره و به اشتراک گذاشته شوند، دو تکنیک انبار داده و محاسبات ابری با حداکثر مزایا و کاهش هزینه می توانند به سازماندهی تجارت هوشمند کمک کنند. در این پایان نامه یک مدل انبار داده توزیع شده را در محیط محاسبات ابری ارئه می-نمائیم. برای ذخیره سازی حجم زیادی از داده ها در ابر هنوز چالش هایی وجود دارد که عمده آنها مربوط به مدیریت پردازش etl و داده های غیر ساخت یافته هستند. چارچوب mapreduce که برای سیستم-های توزیع شده و محاسبات ابری طراحی شده است می تواند راهکاری برای غلبه بر این مشکلات باشد. در mapreduce برای داده ها جفت ( کلید/مقدار) در نظر می گیریم و با توجه به آن یک کلید تعریف می-شود که مطابق با آن کلید می توانیم از داده ها گزارش گیری نماییم. در این پایان نامه با استفاده از چارچوب mapreduce، راهکار mrd را جهت پیاده سازی انواع ساختار داده های حجیم در محیط توزیع شده محاسبات ابری پیشنهاد می نماییم. پس از پیاده سازی انبار داده برنامه شمارش کلمات با زبان c#و پایگاه داده sqlserver، زمان اجرای روش پیشنهادی mrd را با دو الگوریتم hadoop و الگوریتم mraproori مقایسه نمودیم و نشان دادیم که متوسط زمان اجرای الگوریتم پیشنهادی mrd بر روی دو گره، 2.88 برابر سریعتر از الگوریتم mraproori و 2.27 برابر سریعتر از الگوریتم hadoop می-باشد.

First 15 pages

خوشه بندی نتایج جستجوی کاربران در وب با استفاده از الگوریتم های هوشمند

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی 1393
مهدی محمدخانی سهیلا کرباسی

افزوده شدن روزانه بیش از یک میلیون صفحه به اطلاعات موجود در اینترنت به تنهایی نشان دهنده این است که در عصر کنونی ما با کمبود اطلاعات مواجه نیستیم بلکه با فقر دانش روبرو هستیم زیرا کشف دانش و آگاهی سودمند که مستتر در انبوه داده هاست روز بروز مشکل تر و پرهزینه تر می شود. و به طبع آن جستجو برای کاربران نیز فقط با صرف هزینه بیشتر امکانپذیر است.در این پایان نامه ما قصد داریم با بررسی روشهای موجود در خوشه بندی داده هایی که در حقیقت همان نتایج حاصل از جستجوی کاربران در وب هستند ،نقاط ضعف آنها را بیابیم .با انجام آزمایشات با داده های متنوع و در محیط های مختلف به این درک رسیدیم که در خوشه بندی داده های کاربر، کیفیت نتایج بدست آمده از الگوریتم مرسوم خوشه بندی k-means بسیار متغیر بوده و این می تواند از جمله مهمترین دلایل پرهزینه شدن جستجو در اینترنت باشد .به منظور حل این مشکل از الگوریتم های فرا ابتکاری و هوشمند در این زمینه کمک گرفتیم که با توجه به معایب الگوریتم k-means مناسبترین الگوریتم برای جایگزین نمودن ،الگوریتم بهینه سازی ازدحام ذرات بود.اما از آنجا که اینکار در عمل در نرم افزارهای داده کاوی تا کنون صورت نگرفته بود جهت انجام آزمایش و بررسی نتیجه میبایست ابتدا پیاده سازی کد الگوریتم پیشنهادی را با استفاده از مفاهیم نرم افزارهای متن باز تهیه و آنرا به نرم افزار مورد آزمایش وارد کنیم. با انجام دادن این اقدامات و ارزیابی نتایج حاصل دریافتیم که الگوریتم پیشنهادی خوشه های مناسبتر و پایدارتری تولید میکند که در نتیجه می توان در زمان جستجو نتایج ارزنده تری را به کاربر ارائه دهیم و هزینه جستجو را کاهش دهیم. و دستاورد ما علاوه بر کیفیت نتایج جستجو تولید شده ، در قدم بعد با توجه به سابقه و علایق کاربر به زمینه های مختلف ، رسیدن به یک سیستم توصیه گر فیدبک دار جهت تعیین احتمال حرکت بعدی کاربر و ارائه پیشنهاد به آن خواهد بود.

ارائه یک راهکار انتساب وظایف آگاه از کیفیت خدمات در محیط محاسبات ابری

thesis دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد شاهرود - دانشکده کامپیوتر و فناوری اطلاعات 1393
وحیده امیری حسین مومنی

الگوریتم های زمانبندی، وظیفه ی توزیع وظایف بین منابع ابر را بر عهده دارند. هدف اصلی زمانبندی در محاسبات ابری کسب رضایت کاربران با پاسخگویی به پارامترههای کیفیت خدمات است. تعداد پارامترهای دخیل در qos بسیار زیاد می باشند. ایجاد یک انتساب بهینه با توجه کردن به پارامترهای qos ، مسئله ایست که محققان بسیاری را از زمان پیدایش محیط ابری تا کنون به جستجو و تحقیق واداشته است. استفاده از الگوریتم های ابتکاری دراین انتساب وظایف بسیار معمول و پاسخگوست. الگوریتم نوظهور بازار بورس که از انواع الگوریتم های ابتکاری است، دارای قابلیت های فراوانی به نسبت انواع دیگر الگوریتم های هم نوع خود است. در این پایان با استفاده از الگوریتم بازار بورس، روشی جدید برای انتساب وظایف در محیط ابری را ارائه نموده ایم.

نام پژوهشگر: سهیلا کرباسی