نام پژوهشگر: محمود نقیب زاده
محبوبه هوشمند کفاشیان محمود نقیب زاده
قابلیت عمل پذیری متقابل، در اجتماع وب معنایی به یک امر بسیار مهم و حیاتی تبدیل شده است. طراحان وب، هم چنان با مشکل قابلیت عمل پذیری متقابل معنایی روبرو هستند، که در مسیر استفاده ازکلیه امکانات بالقوه وب قرار دارد. یک مسأله اصلی در قابلیت عمل پذیری متقابل در وب معنایی، تطابق هستان شناسی هاست. تطابق هستان شناسی ها، به فرآیند یافتن روابط و یا تشابه های بین موجودیت های هستان شناسی های مختلف اشاره دارد. تطابق هستانشناسی ها یک مسأله اصلی در بسیاری از کاربردها، مانند مجتمع سازی داده ها، انبار داده ها، تجارت الکترونیکی، و پردازش پرس وجوهای مفهومی می باشد. در این پایان نامه با الهام از یک روش مشهور قبلی (که +prior خوانده می شود) یک روش نوین برای تطابق هستان شناسی ها ارائه می دهیم. +prior، از معیارهای مختلف شباهت استفاده می کند و آن ها را با یک روش وفقی با یکدیگر مجتمع می سازد و درنهایت در صورت لزوم، یک شبکه تعاملی را برای یافتن پیکربندی که به بهترین شکل قیدهای هستان شناسی را ارضا می کند، به کار می گیرد. روش پیشنهادی ما بهبودهایی درمراحل مختلف +prior انجام می دهد. بهبودهای پیشنهادی شامل تعریف یک معیار شباهت جدید، یک روش جدید برای مجتمع سازی شباهت ها با استفاده از تعریف یک مفهوم نوین، و ایجاد تغییری در مرحله ارضای قیدهای هستان شناسی است. نتایج ارزیابی بر روی مجموعه محک استاندارد oaei نشان می دهد روش پیشنهادی ما، معیارهای استاندارد ارزیابی را نسبت به +prior بهبود می بخشد. مقایسه با دیگر روش های مشهور تطابق نیز نشان میدهد روش ما، نتایج خوبی تولید می کند.
بهاره بهکمال محمود نقیب زاده
حجم زیاد داده ها و منابع اطلاعاتی در وب، یکپارچه سازی داده های وب را به امری ضروری مبدل کرده است. از این رو طراحان وب معنایی به دنبال راهکاری مناسب برای برقراری تعاملات صحیح و کارا بین مفاهیم یکسان در هستان شناسی هایی می باشند که به صورت ناهمگون در وب توزیع شده اند. یکی از راهکارهای مطرح شده برای رفع این مشکل تطبیق هستان شناسی ها است. هدف از تطبیق هستان شناسی ها یافتن شباهت ها و روابط معنایی بین موجودیت های هستان شناسی های مختلف است. تا کنون تطبیق دهندگان زیادی معرفی شده اند که هریک از روش های مختلف برای یافتن این شباهت ها استفاده کرده اند. نتایج حاصل شده از تطبیق دهندگان خودکار به دلیل عدم تعامل با کاربر دارای کاستی هایی می باشد که این امر بعنوان چالشی در زمینه تطبیق هستان شناسی ها مطرح شده است. از این رو در این پایان نامه با ارائه راهکاری مناسب به رفع این چالش در جهت بهبود کیفیت نتایج تطبیق هستان شناسی ها پرداخته شده است. راهکار پیشنهادی افزودن فاز پیش پردازش به-منظور بررسی هستان شناسی های ورودی و تشخیص الگوهای نامتناسب مدل سازی شده در هستان شناسی ها و اصلاح الگوهای تشخیص داده شده است. از این رو در فاز اول، هستان-شناسی های ورودی از بعد لغوی، ساختاری و ... مورد بررسی قرار گرفته اند، سپس با بررسی چگونگی عملکرد تطبیق دهندگان و در نظر گرفتن نقایص و کاستی های آنها در یافتن شباهت-های معنایی، الگوهای مناسب تشخیص داده شده است. در مرحله بعد با اعمال قوانین refactoring بر روی الگوها، هستان شناسی های ورودی اصلاح شده است. در پایان، ارزیابی راهکار پیشنهادی با اعمال دو تطبیق دهنده مشهور asmov و rimom (که دارای بالاترین رتبه ها در آزمون های سازمان ارزیابی هم ترازسازی هستان شناسی ها ( (oaeiبوده اند) انجام شده است. نتایج حاصل از ارزیابی معیاری نشان دهنده بهبود در هم ترازی نهایی پس از اجرای راهکار پیشنهادی است.
سید کاظم شکفته حسین دلداری
امروزه پردازنده های چند هسته ای که دارای واحدهای پردازشی متعددی بر روی یک تراشه ی سخت افزاری می باشند، به طور گسترده ای به عنوان راهی برای رسیدن به افزایش کارایی و موازی سازی درون پردازنده مورد استفاده قرار می گیرند. استفاده ی مناسب از منابع پردازشی در این پردازنده های می تواند در افزایش کارایی برنامه ها بسیار موثر باشد و در نقطه ی مقابل، عدم استفاده ی بهینه و شایسته از آنها نه تنها باعث عدم افزایش کارایی بلکه در مواردی باعث افت شدید کارایی در برنامه ها خواهد شد. در این پردازنده ها برخی منابع به صورت اشتراکی بین هسته های مختلف مورد استفاده قرار می گیرند. مسئله ی رقابت بر سر منابع اشتراکی در پردازنده های چند هسته ای به عنوان یک چالش بزرگ اخیرا مورد توجه بسیاری از محققین در این زمینه قرار گرفته است. زمانبند سیستم عامل می تواند به عنوان یکی از ابزارهای بسیار مهم و کارا به منظور رفع این مشکل مورد استفاده قرار گیرد. در بسیاری از کارهای انجام شده در این زمینه، زمانبند صرفا به یک معیار در تصمیم گیری توجه می نماید: معیار میزان رقابت بر سر حافظه ی نهان. حال اینکه در یک محیط واقعی عوامل تأثیرگذاری دیگری نیز در تصمیم گیری زمانبند دخیل خواهند بود از جمله اولویت نخ ها. چرا که اولویت یکی از ابزار اعمال سیاست های مختلف محیطی بر روی پردازش ها می باشد. در این پایان نامه با معرفی یک روش زمانبندی نخ ها بر روی یک پردازنده ی چند هسته ای میزان کاهش کارایی ناشی از رقابت نخ ها بر سر حافظه ی نهان بسیار کاهش یافته است. در این مکانیزم زمانبندی علاوه بر معیار رقابت، به اولویت نخ ها و نیز این مطلب که اجرای همزمان نخ های همکار تأثیر بسیار مثبتی در افزایش کارایی آنها خواهد داشت توجه شده است. نتایج شبیه سازی روش پیشنهادی نشان دهنده ی میانگین افزایش 4.93 برابر در کارایی سیستم بوده است.
فرهاد رحمانی فرد حسین دلداری
امروزه نرم افزارهای مدیریت ماشین مجازی از فزونی تعهد ماشین فیزیکی پشتیبانی می کنند. فزونی تعهد یک ماشین فیزیکی به این معنا می باشد که بیش از ظرفیت موجود بر روی آن ماشین مجازی قرار گیرد. همچنین، نرم افزارهای مدیریت ماشین مجازی امکان مهاجرت ماشین های مجازی را از یک ماشین فیزیکی به ماشین فیزیکی دیگر فراهم می آورند. با استفاده از این قابلیت ها فراهم آورندگان ابر می توانند برای رسیدن به نرخ فشرده سازی بیشتر، اقدام به قرار دادن تعداد هر چه بیشتر ماشین های مجازی بر روی هر یک از ماشین های فیزیکی موجود نمایند. این کار برای فراهم آورنده ی ابر بسیار سود آور خواهد بود زیرا می تواند بیش از مقدار ظرفیت فیزیکی فراهم آورده شده، ماشین مجازی اختصاص دهد. در مقابل، قرارداد سطح سرویس میان فراهم آورنده ی ابر و کاربر ماشین های مجازی قرار دارد که مفاد آن باید رعایت شوند. بنابراین، فراهم آورنده ی ابر سعی می کند در حالی که نرخ نقض قرارداد را به اندازه ی قابل قبولی پایین نگاه می دارد از قابلیت فزونی تعهد حداکثر بهره ی ممکن را ببرد. هنگامی که بر روی یک ماشین فیزیکی بیش از ظرفیت آن ماشین مجازی قرار داده شود، وضعیت ماشین فیزیکی باید به طور پیوسته مورد نظارت قرار گیرد. به عبارت دیگر، باید نظارت های بیشتری در طول زمان مدیریت بر روی ماشین های فیزیکی انجام پذیرد. در این پایان نامه، مدیریت ماشین های مجازی در محیطی که صریحا از فزونی تعهد منابع فیزیکی پشتیبانی می کند، مورد بررسی قرار گرفته است. تعداد روش های مدیریتی سازگار با محیط های ابری در حال حاضر بسیار کم می باشد. سعی شده است که معماری روش پیشنهادی هرچه بیشتر با معماری استاندارد محیط های ابری سازگاری داشته باشد. همچنین روش پیشنهادی عمومی بوده و قابل ادغام با بسیاری از روش های مدیریتی دیگر می باشد. در روش پیشنهادی سعی شده است با پایین نگاه داشتن نرخ نقض قرارداد ماشین های مجازی به بیشترین مقدار فزونی تعهد ممکن دست یافت. به کمک معیارهای متوسط نرخ بهره وری ماشین های فیزیکی، زمان اجرای الگوریتم نگاشت، مدت زمان غیرفعال بودن ماشین های مجازی به دلیل مهاجرت، تعداد نقض های قرارداد رخ داده، نرخ فزونی تعهد بدست آمده و تعداد مهاجرت ها در کل دوره ی مدیریت روش پیشنهادی مورد بررسی و تحلیل قرار می گیرد.
ملیحه دانش محمود نقیب زاده
خوشه بندی، روش داده کاوی قدرتمندی است که جهت کشف موضوع از اسناد متنی مورد استفاده قرار می-گیرد. در این زمینه الگوریتم های خانواده k-means به دلیل سادگی و سرعت بالا، در خوشه بندی داده هایی با ابعاد بالا، کاربرد فراوانی دارند. در این الگوریتم ها، معیار شباهت cosine، تنها شباهت میان زوج اسناد را اندازه گیری می کند که در مواقعی که خوشه ها به خوبی تفکیک نشده باشند، عملکرد مناسبی ندارد. درمقابل، مفاهیم همسایگی و اتصال با در نظرگرفتن اطلاعات سراسری در محاسبه میزان نزدیکی دو سند، عملکرد بسیار بهتری دارند. چنانچه میزان شباهت دو سند از حد آستانه ای بیشتر باشد آن دو سند همسایه اند و تعداد همسایه های مشترک میان آنها، مقدار تابع اتصال این دو سند را نشان می دهد. بنابراین با توجه به اینکه تنها دو حالت همسایگی و عدم همسایگی داریم که با صفر و یک نمایش داده می شوند، مقداری از اطلاعات را در مورد میزان شباهت میان اسناد از دست می دهیم که منجر به کاهش دقت خوشه بندی حاصل می شود. جهت رفع این مشکل، در گام اول لیستی از مقادیر گسسته را برای تعیین بازه ای از مقادیر آستانه به جای تنها یک مقدار، در نظر گرفتیم که به دنبال آن درجات متفاوتی از همسایگی، بر اساس میزان شباهت میان اسناد خواهیم داشت. همچنین جهت افزایش هر چه بیشتر دقت نتایج حاصل، از منطق فازی نیز بهره برده و مقدار شباهت میان اسناد را با استفاده از مقادیر عضویت فازی نمایش دادیم. به این ترتیب میزان همبستگی میان اسناد را با استفاده از منطق فازی بهبود داده و گام جدیدی در کاربردهای منطق فازی برداشتیم. همچنین در این مدل، روابط معنایی میان کلمات نادیده گرفته شده و تنها اسنادی با واژگان مشابه با یکدیگر مرتبط شده اند. در این پروژه پایانی از آنتولوژی wordnet جهت ایجاد مدل جدید نمایش اسناد بهره بردیم، بدین صورت که در آن از روابط معنایی به منظور وزن گذاری مجدد بسامد کلمات در مدل فضای برداری اسناد استفاده شده است. سپس مفاهیم همسایگی و اتصال را بر روی مدل حاصل اعمال نمودیم. نتایج حاصل از اعمال روش های پیشنهادی و ترکیبات آنها بر روی مجموعه داده های متن واقعی، حاکی از عملکرد موثر و مناسب تر الگوریتم پیشنهادی ما نسبت به روش های پیشین می باشد و می تواند جایگزین خوبی برای الگوریتم های پیشین در امر خوشه بندی اسناد باشد.
حسین سلامی حسین دلداری
در سالیان اخیر محیط های پردازشی توزیع شده مانند گریدهای محاسباتی، به یکی از مهمترین بسترها برای رفع نیازهای پردازشی کاربران مبدل شده اند. این محیط ها دارای توان بالقوه ای برای پاسخگویی به نیازهای کاربران می باشند اما مشکلات خاص خود را نیز بهمراه دارند. یکی از پدیده هایی که در این محیط ها قابل مشاهده است، بالا بودن درصد کارهایی است که علیرغم دریافت منابع درخواستی، به صورت ناموفقی به پایان رسیده و سبب تحمیل صدمات قابل توجهی می شوند. تلاش های متعددی برای چیره شدن بر مسئله ی اجرای ناموفق کارها انجام شده است که تا حدی نیز موثر بوده اند اما یکی از ضعف های عمده ی آنها، توجه به بعضی عوامل اجرای ناموفق کارها (عوامل سمت منابع) و در نظر نگرفتن عوامل دیگر (عوامل سمت کار) می باشد. بدین منظور، در این تحقیق، هدف ما ارائه ی راهکاری برای کاهش صدمات ناشی از اجراهای ناموفق کارها بوسیله ی در نظر گرفتن عواملی است که از سمت کارها ناشی می شوند تا از این طریق نشان دهیم که می توان با توجه به این عوامل نیز صدمات اجراهای ناموفق را کاهش داد. راهکار پیشنهادی، افزودن یک مولفه ی جدید است که وظیفه ی آن پذیرش نکردن کارهایی است که مستعد خرابی می باشند. رفتار این مولفه با استفاده از دو روش مبتنی بر آستانه و مدلی مبتنی بر تئوری بازی به نام قمار ریسکی پیاده سازی شده است. نتایج آزمایشات نشان داد که بکارگیری این مولفه ی جدید می تواند در کاهش صدمات ناشی از اجراهای ناموفق کارها نقش قابل توجهی را ایفا نماید.
مجید سازوار محمود نقیب زاده
در طی سالیان اخیر حجم زیادی از سه گانه های rdf (در حدود چند ده میلیارد) در وب منتشر گردیده است. برای استفاده از این داده های منتشر شده باید الگوریتم استنتاجی داشته باشیم که بتواند روی این حجم عظیم از داده ها استنتاج انجام دهد و همچنین بتواند خود را با این نرخ بالای رشد ، تطبیق دهد. تاکنون راهکارهای مختلفی برای حل این مشکل ارائه گردیده است که برخی از آنها توانسته اند ، مقیاس پذیری خوبی را از خود نشان دهند. متاسفانه اکثر این روش ها برای حل مشکل مقیاس پذیری فرض کرده اند که داده ها ایستا می باشد و از روش استنتاج رو به جلو برای محاسبه بستار استفاده کرده اند. بنابراین تاکنون توجه کمی به مساله پویایی داده ها در وب معنایی شده است. در این پایان نامه ، روش ترکیبی ارائه شده است که تلاش می کند مزایای روش های استنباطی و استقرایی را یکجا جمع کرده و مشکلات آنها را از بین ببرد. در این روش ترکیبی ، از استنتاج رو به عقب برای فراهم سازی مجموعه داده آموزشی جهت یادگیری یک مدل lda استفاده شده است و سپس با استفاده از مدل یادگرفته شده ، صحت سه گانه های دیگر تخمین زده شده است. در راستای عملکرد کارآمد و مقیاس پذیر این روش یک ساختمان داده بیتی فشرده طراحی شده است که سه گانه های rdf را به طور فشرده ای درون حافظه اصلی بازنمایی می کند. نتایج بدست آمده از ارزیابی های مختلف بر روی این روش نشان از موفقیت این روش در راه رسیدن به اهداف خود دارد.
سعید ابریشمی محمود نقیب زاده
اخیرا، سیستم های مشبک عمومی و ابرهای محاسباتی خود را به عنوان یک مدل جدید برای ارائه خدمات در سیستم های توزیع شده مطرح کرده اند. در این سیستم ها، منابع و خدمات توزیع شده مختلف (همچون خدمات محاسباتی و ذخیره سازی اطلاعات)، با کارآیی و کیفیت خدمت متفاوت، و با قیمتهای مختلف به فروش می رسند. مسئله زمانبندی جریان های کاری، یکی از پیچیده ترین مسائل موجود در سیستم های مشبک عمومی و ابرهای محاسباتی است. در این سیستم ها، زمانبندی باید به گونه ای انجام شود که حداقل کیفیت خدمت موردنظر کاربر برآورده شود. برخلاف سیستم های توزیع شده سنتی که در آنها هدف از زمانبندی تنها بهینه سازی یک معیار می باشد (معمولا زمان اجرا)، در این سیستم ها باید چندین معیار به طور همزمان درنظر گرفته شوند (مانند زمان و هزینه اجرا). به همین دلیل به این نوع زمانبندی، زمانبندی چند معیاری یا زمانبندی مبتنی بر کیفیت خدمت گفته می شود. در این رساله، چندین الگوریتم زمانبندی مبتنی بر کیفیت خدمت برای برنامه های جریان کاری، در محیط سیستم های مشبک عمومی و ابرهای محاسباتی ارائه شده است.
صادق صحت بخش محمود نقیب زاده
شبکه عصبی پرسپترون چند لایه یکی از پر کاربردترین نمونه های شبکه عصبی می باشد. کارایی این شبکه عصبی برای حل یک مسئله بستگی به توپولوژی در نظر گرفته شده برای شبکه دارد. چنانچه توپولوژی شبکه ساده تر از حد نیاز باشد امکان یادگیری در شبکه عصبی وجود ندارد و چنانچه توپولوژی پیچیده تر از حد نیاز باشد مشکل overtraining رخ داده و قدرت تعمیم شبکه به دست آمده بسیار کم خواهد بود. یکی از راههای تعیین توپولوژی مناسب به ازای هر مسئله استفاده از الگوریتمهای تکاملی می باشد . در این پایان نامه چند روش مختلف برای تعیین توپولوژی شبکه عصبی پرسپترون چند لایه با استفاده از الگوریتمهای تکاملی ارائه شده است. برای ارزیابی کارآیی روشهای پیشنهادی، این روشها با سایر روشهای موجود از لحاظ میزان خطای شبکه و میزان پیچیدگی توپولوژی مورد مقایسه قرار گرفتند. روش های پیشنهادی علیرغم اینکه از لحاظ میزان خطا نسبت به سایرروش ها پیشرفتی نداشته اند اما تمایل زیادی به ایجاد شبکه هایی با توپولوژی ساده از خود نشان دادند.
محمدتقی غم شکن محمود نقیب زاده
امروزه در اکثر زمینه های صنعت نیاز به برش و بسته بندی محصولات دیده می شود. از برش شیشه و فلزات گرفته تا جادهی تراشه های الکترونیکی به روی فضای ic، همگی کاربردهای مسأله بسته بندی دوبعدی محسوب می شوند. در همه این موارد و غالب موارد دیگر نیاز به بهینگی و کمتر مصرف شدن فضا و مواد مصرفی شرط اول منفعت می باشد. محققان روش های متنوعی را برای حل این مسأله پیشنهاد داده اند اما با بزرگتر شدن اندازه مسأله و توجه به محدودیت زمان برای بدست آوردن جواب بهینه، روش های اکتشافی خودنمایی بیشتری نسبت به سایر روش ها می کنند. یکی از روش هایی که توانسته است در زمان مناسب به جواب قابل قبولی برسد، الگوریتم ژنتیک می باشد. برای حل هر مسأله توسط الگوریتم ژنتیک ابتدا باید روشی برای نمایش جواب های مسأله، انتخاب کرد. یکی از مهمترین اجزای الگوریتم ژنتیک، تابع کارایی می باشد که با محاسبه کارایی جواب های مسأله (افراد جمعیت) و بازخورد آن به الگوریتم، نقش مهمی در هدایت صحیح الگوریتم به سمت جواب بهینه ایفا می کند. این تحقیق با تمرکز روی ساختار الگوریتم ژنتیک و سعی در برطرف کردن نقاط ضعف روش های مشابه، به نتایج مناسبی رسیده است. این روش یک الگوریتم ژنیتک چندجمعیتی می باشد که از تنظیمات فازی برای پارامترهای الگوریتم ژنتیک بهمراه نمایش جدید مناسبی از جواب های مسأله (کروموزوم ها)، تابع جدید ارزیابی کیفیت بسته بندی که پتانسیل کارایی بسته بندی را مورد توجه قرار می دهد، بهره می برد. همچنین از پردازش موازی برای استفاده ی حداکثری از توان پردازنده و یک روش جایگذاری ترکیبی جدید استفاده شده است. در ادامه به بررسی تاثیر عملگرهای تکاملی نش پرداخته شده که نتوانست جواب مناسبی بدست آورد و در نسخه نهایی الگوریتم استفاده نشد. در پایان روش پیشنهادی روی پنج مجموعه داده بنچمارک با چندین روش بسته بندی ارائه شده در سال های اخیر مقایسه شد، که ارزیابی های صورت گرفته که این روش کارایی مناسب تری دارد نشان میدهد. در مجموع برای بسته بندی دوبعدی روی 129 نمونه گزارش شده 42 جواب بهینه جدید و 70 نمونه جواب برابر با بهینه موجود (بهترین جواب بدست آمده از روش های دیگر)، بدست آمد و برای مساله برش نوار نیز از 56 نمونه گزارش شده 12 جواب بهینه جدید و 24 جواب برابر با بهینه موجود بدست آمد در مسایل با مجوز چرخش مستطیل ها نیز از 21 نمونه، سه جواب بهینه جدید و 17 جواب برابر با بهینه موجود بدست آمد.
محدثه دلاوریان محمود نقیب زاده
یکی از مدلهای قدرتمند استنباط، شبکه های بیزی هستند. هدف انجام استنباط احتمالی محاسبه احتمال پسین برای متغیرهای تصادفی شبکه می باشد. در این پایان نامه، تمرکز بر روی این موضوع می باشد. در بسیاری از کاربردها، برای مدل کردن مساله متغیر های تصادفی گسسته و پیوسته به کار می رود. شبکه ی بیزی مورد مطالعه، در این تحقیق شبکه بیزی ترکیبی است که شامل متغیرهای تصادفی گسسته و پیوسته به صورت همزمان می باشد. یکی از چالشها برای استنباط در این شبکه ها، متفاوت بودن توابع توزیع احتمال برای انواع متغیرهای تصادفی در آن است که منجر به پیچیدگی بیشتر محاسبات میشود. بنابراین اغلب شرایطی برای محدود شدن شبکه و در نتیجه سادهتر شدن محاسبات آن در نظر میگیرند. در این پایان نامه با در نظر گرفتن این مساله، الگوریتم استنباطی بر روی شبکه ی ترکیبی ارائه خواهیم کرد، که بر روی شبکه ی ترکیبی استنباط را انجام می دهد که برخی از محدودیتهایی که در نظر گرفته می شود را نداشته باشد. به این هدف به وسیله همشکل سازی شبکه دست می یابیم. برای این منظور تابع توزیع همشکلی برای هر دو نوع متغیر تصادفی ارائه شده است. محاسبات الگوریتم را بر اساس تابع توزیع همشکل، برای الگوریتم استنباط که بر پایه ی یکی از الگوریتمهای استنباط تقریبی که انتشار باور pearl نام دارد، انجام داده ایم. برای بررسی نتایج، دقت در تخمین احتمال پسین پس از استنباط و زمان اجرا را برای ارزیابی استفاده می کنیم. برای بررسی صحت الگوریتم پیشنهادی آن را بر روی شبکه های بیزی گسسته و پیوسته اجرا کرده و نتایج را با الگوریتمهای دقیق مقایسه کرده و برای شبکه های ترکیبی سادهتر با الگوریتم های دقیق و برای سایر شبکههای ترکیبی با روشهای تقریبی مقایسه کرده ایم. نتایج نشان می دهند در حالی که شبکه ی ترکیبی مورد نظر دارای محدودیت کمتری باشد، با توجه به زمان اجرای الگوریتم پیشنهادی نسبت به روشهای نمونه برداری به دقت خوبی دست مییابیم.
مرتضی طامندی سعید عربان
در کنار ظهور مفاهیمی مانند دولت الکترونیک و ارتباطات یکپارچه، موضوع ارتباط سیستم های اطلاعاتی سازمان های مشترک المنافع و یا سازمان های همکار، اهمیت ویژه ای پیدا کرده است. یکی از پرکاربردترین راهکارها در راستای نیل به این هدف، استفاده از زبان xml و ذخیره سازی فراداده ها در قالب مستندات مبتنی بر این زبان است. اما با توجه به ساختار منعطف این زبان، هر سازمان مطابق با نیاز های کاربردی خود اقدام به طراحی ساختار خاصی برای ذخیره سازی فراداده خود می کند و همین تنوع ساختارها، همکاری بین سیستمی را مشکل می کند. تطبیق طرح واره، یکی از روش هایی است که در شرایط فوق، برای تضمین قابلیت همکاری بین سیستم ها، به کار گرفته می شود. روش ها، الگوریتم ها و ابزارهای متنوعی برای حل این مسئله در حوزه های دانشگاهی و تجاری، پیشنهاد و پیاده سازی شده اند اما وابستگی این ابزارها به منابع جانبی از قبیل شبکه واژگان، لغت نامه های اختصاصی و در نظر نگرفتن ضعف طراحی طرح واره باعث می شود که این ابزارها برای تطبیق برخی طرح واره هادر حوزه های عملیاتی، از کیفیت کافی برخوردار نباشند. در این تحقیق، تلاش بر آن است که با ارائه روش های تطبیق محتوا محور طرح واره ها، با تکیه بر اصل مقادیر داده ای، ضعف های اشاره شده تا حدی جبران شود. در این روش، با استفاده از مقایسه تجمیعی مقادیر داده در قالب مستندات متنی و به کارگیری تکنیک های تشابه سند و نمونه برداری آگاه از کیفیت برای هر طرح واره، کیفیت عملیات انطباق بهبود داده شده است. علاوه بر این در ابزار تولید شده با به کارگیری راهکارهای اختصاصی برای زبان فارسی در پردازش متن، انطباق دهنده مناسبی برای طرح واره های فارسی پیشنهاد شده است. آزمایش های عملی بر روی چهار مجموعه طرح واره با داده های فارسی حاکی از بهبود عملکرد روش پیشنهادی (معیار f-measure)تا حدود 18 درصد نسبت به یکی از ابزارهای مشهور این حوزه (coma++) می باشد.
منصوره شریفی محمود نقیب زاده
استدلال مبتنی برمورد روشی برای حل مسأله است که از تجربیات گذشته در حل مسائل استفاده می کند. وقتی سیستم های استدلال مبتنی برمورد به مسائل دنیای حقیقی اعمال می شوند، پاسخ های بازیابی شده از سیستم بندرت می توانند به عنوان یک پاسخ مناسب برای مسأله جدید به طور مستقیم به کار روند. پاسخ های بازیابی شده معمولاً نیازمند مجموعه ای از تطبیق ها می باشند تا بتوانند به مسأله جدید اعمال شوند. بنابراین فاز تطبیق مرحله ای مهم در چرخه سیستم استدلال مبتنی برمورد می باشد. به دلیل مشکلات موجود در روش های تطبیق سنتی، در این پژوهش سعی شده است روش تطبیقی براساس یادگیری ماشین ارائه شود. در روش پیشنهادی پس از خوشه بندی پایگاه موردها، با استفاده از اعضای هر خوشه و اطلاعاتی که از همسایه های آن ها در اختیار داریم یک ماشین بردار پشتیبان رگرسیون می سازیم. با ورود مسأله ای جدید، ابتدا شبیه ترین خوشه به مسأله ورودی انتخاب می شود. سپس بردار های اختلاف مسأله جدید با همسایه های آن در خوشه بازیابی شده محاسبه می شود و از ترکیب این بردارهای اختلاف با بردار ویژگی های مسأله جدید، تعدادی الگو شکل می گیرد. این الگوها به ماشین بردار پشتیبان رگرسیون ارسال شده و برای هر کدام یک خروجی تولید می شود. درنهایت با ترکیب وزن دار این خروجی ها جواب مطلوب به دست می آید. پس از بررسی میزان خطای جواب سیستم، مورد جدید درصورت لزوم به پایگاه مورد افزوده می شود و پایگاه مورد به روز می شود. روش پیشنهادی از نظر میزان خطای جواب ارائه شده با چند روش دیگر بر روی مجموعه داده های استاندارد uci آزمایش و مقایسه شده اند. نتایج حاصل، برتری روش پیشنهادی را در آزمایش ها نشان می دهد.
عالیه alieh محمود نقیب زاده
امروزه استفاده از فن آوری های وب معنایی به سرعت در حال رشد است. از طرفی می توان گفت از مهم ترین کاستی های این فن آوری ها ضعف در مقیاس پذیری و کارایی پایین آن ها است. به منظور جبران این کاستی ها می توان روش های بهینه سازی، مانند نهان سازی که در بانک های اطلاعاتی مورد استفاده هستند، به آن ها اضافه کرد. در این تحقیق، نتایج زیرپرس وجوها و پرس وجوهای sparql در یک مخزن rdf که از زیرساخت hadoop استفاده می کند، ذخیره شده اند و بدین ترتیب امکان استفاده ی مجدّد از آن ها در پرس وجوهای بعدی فراهم شده است. علاوه بر این یک روش نام گذاری برای فایل هایی که حاوی نتایج نهان سازی شده هستند و نیز الگوریتمی ابتکاری برای سیاست جایگزینی حافظه ی نهان و حذف فایل ها پیشنهاد شده است. همچنین، یک الگوریتم تعیین طرح پرس وجو که آگاه از حافظه ی نهان است، ارائه شده که سعی می کند با توجه به نتایج نهان سازی شده، طرحی کم هزینه برای پرس وجو تولید کند. در انتها الگوریتم های پیشنهادی با مجموعه داده ها و مجموعه پرس وجوهای bsbm مورد ارزیابی قرار گرفته اند. نتایج نشان می دهد هر چه وابستگی و اشتراک مجموعه پرس وجوها بیشتر باشد، نهان سازی موثرتر می باشد. با توجه به اینکه پرس وجوهای واقعی که توسط کاربران انجام می شوند، دارای اشتراک زیادی هستند، می توان گفت فن آوری های فاقد نهان سازی در مقایسه با فن آوری هایی که از امکان نهان سازی بهره می برند، دارای سرعت بسیار پایین تری هستند و در نتیجه قادر به پاسخ گویی به تعداد کمتر پرس وجو در ساعت می باشند.
کبری اطمینانی محمود نقیب زاده
یکی از مسایل مهم مطرح در حوزه شبکه های بیزی، فرایند ساخت آنها از داده است که به «تعلیم ساختار» شهرت دارد. هدف از تعلیم ساختار شبکه بیزی، یافتن بهترین ساختار ممکن است بطوری که بتواند به بهترین نحو برای اهدافی که شبکه بیزی طراحی شده است، همچون پیش بینی، طبقه بندی و غیره، مورد استفاده قرار گیرد.تعلیم ساختار شبکه بیزی از داده یک مساله np-hard است. چالش های بسیاری در زمینه ساخت شبکه بیزی از داده وجود دارد. از جمله این چالش ها زمانی رخ می دهد که چندین فرد خبره، داده در حوزه تخصصی خود جمع آوری کرده اند و هدف، یافتن شبکه بیزی واحد از این داده ها است. راه حل چنین چالشی بدین صورت است که ابتدا شبکه های بیزی مجزا از داده در اختیار افراد خبره ساخته شوند. سپس، برای دست یافتن به شبکه بیزی واحد، این شبکه ها در یک شبکه واحد ادغام شوند. برای ساخت شبکه بیزی از داده، ساختار و پارامترها بصورت زیر تعلیم می یابند. از آنجا که داده اغلب ناقص است، ابتدا از یک ساختار تصادفی شبکه بیزی شروع می کنند. سپس پارامترهای بهینه این ساختار از داده ناقص تعلیم می یابند. اکنون یک شبکه بیزی (ساختار و پارامتر) در اختیار است. به کمک این شبکه بیزی، مقادیر ناقص را پر کرده، داده کامل می شود. مجددا ساختار بهینه شبکه بیزی از این داده کامل شده تعلیم داده می شود. فرایند تعلیم پارامتر از داده ناقص، پر کردن مقادیر ناقص از شبکه بیزی ساخته شده و تعلیم ساختار از داده کامل شده آن قدر تکرار می شود تا همگرا شود. پس از ساخت شبکه های بیزی مجزا، این شبکه ها در یک شبکه واحد در دو مرحله ادغام ساختار و ادغام پارامتر، ترکیب می شوند.در این رساله، روشی برای ساخت یک شبکه بیزی واحد از داده چند فرد خبره ارائه شده است. برای این منظور، ابتدا برای بدست آوردن ساختار شبکه بیزی از داده کامل، روشی جدید ارائه می شود. روش پیشنهادی با عنوان pbb، از تکنیک انشعاب و تحدید بهره می برد. بسته به ساختاری از شبکه بیزی که در هر گره از درخت انشعاب و تحدید ذخیره می شود و موقعیت آن گره در درخت، تعاریفی جدید برای این گره ها ارائه داده ایم. به کمک تعاریف جدید، قوانین تحدیدی ارائه داده ایم که درخت انشعاب و تحدید را به میزان چشمگیری هرس می کنند.سپس برای تعلیم پارامترهای شبکه بیزی از داده ناقص، روشی نوین ارائه داده ایم. برای این منظور، مفهوم جدیدی معرفی کرده ایم. به کمک این مفهوم، پارامتر بهینه شبکه بیزی از دیدگاه راست نمایی بدست می آید.در نهایت، پس از بدست آوردن شبکه های بیزی مجزا از داده در اختیار افراد خبره، برای دستیابی به شبکه بیزی واحد، پس از ادغام ساختارها، روشی برای ادغام پارامترهای این شبکه ها، در یک پارامتر واحد، با نام democraticop ارائه داده ایم. این روش، با استفاده از ایده دموکراسی سعی می کند پارامترهای اکثریت موافق را برای بدست آوردن پارامتر واحد ادغام کند. در واقع به جای ادغام کل پارامترهای افراد خبره، با صرف نظر کردن از پارامترهای خارج از محدوده و ادغام پارامترهای اکثریت موافق به پارامتر واحد دست می یابد. بعلاوه این که، بجای ادغام حالات دنیا، پارامترها را ادغام می کند که منجر به کاهش مرتبه زمانی الگوریتم پیشنهادی می شود.
حمید اولیایی محمود نقیب زاده
استنتاج مقیاس پذیر یکی از مهمترین چالش ها در وب معنایی است. با افزایش روز افزون داده های وب، الگوریتم های مرکزی و موازی دیگر جوابگوی حجم عظیم داده ها نیستند و استفاده از سیستم های توزیع شده امری اجتناب ناپذیر می باشد. از طرفی دیگر هرگونه تغییری در این گونه داده ها شامل حذف، اضافه و به روز رسانی حقایق، منتج به تغییرات در پایگاه دانش استنتاج شده یا بستار می گردد. این تغییرات از آن سو لازم هستند که باید صحت و کامل بودن پایگاه دانش حفظ شود. در بسیاری از موارد می توان بستار را پاک کرد و دوباره از نو ساخت اما این کار هزینه زمانی زیادی دارد. در این پایان نامه، با استفاده مدل برنامه نویسی نگاشت/کاهش ، یک روش توزیع شده برای مدیریت تغییراتی از نوع حذف از پایگاه دانش ارائه شده است. در روش مورد نظر، الگوریتم dred را که مربوط به مدیریت تغییرات در یک سیستم مرکزی است برای سیستم های توزیع شده سفارشی می کنیم و برای قوانین بازنویسی شده توسط این الگوریتم راه کاری ارائه می دهیم. برای ارزیابی پایگاه دانش wordnet را به عنوان ورودی در نظر می گیریم و دو حالت وجود پایگاه دانش اولیه و عدم وجود پایگاه دانش اولیه را در نظر می گیریم. در حالت اول امکان پاک کردن بستار و ساخت دوباره از نو وجود دارد. نتایج نشان می دهد که با پیاده سازی فعلی تا زمانی که حداکثر ?% داده ها از بستار پاک می شود، روش ما بهتر عمل می کند.در حالت دوم، در هر آزمایش درصدی از داده ها از بستار پاک می شوند. زمانی که حدودا ??% از داده های بستار حذف شده اند، روال کلی الگوریتم بر روی دو ماشین چیزی حدود ?? دقیقه به طول می انجامد.
محمود نقیب زاده
هم ترازی چندگانه توالی های پروتئینی تکنیکی جهت نمایش رابطه میان اسیدهای آمینه چندین توالی پروتئینی می باشد. بدین معنا که چندین توالی پروتئینی با یکدیگر به گونه ای هم تراز شوند که بیش ترین مشابهت را با هم پیدا کنند. این مسئله یکی از اساسی ترین مسائل در حوزه بیوانفورماتیک می باشد. اهمیت آن به دلیل کاربردش در تخمین درخت تکاملی، پیش بینی عملکرد و ساختار دوم و سوم پروتئین ها و نیز یافتن موتیف میان توالی های پروتئینی می باشد. یافتن هم ترازی چندگانه بهینه، مسئله ای است رام نشدنی و سه دهه می باشد که محققین در تلاش برای بهبود زمان و دقت حل این مسئله هستند. در این پایان نامه، روشی پیش رونده مبتنی بر ساختار دوم پروتئین ها جهت هم ترازی چندگانه آن ها ارائه شده است. در روش پیش رونده، ترتیب هم ترازی توالی ها در دقت نتیجه به دست آمده تأثیرگذار می باشد. از این رو در روش پیشنهادی از شباهت ساختار دوم توالی های پروتئینی جهت تعیین ترتیب هم ترازی توالی ها استفاده شده است. در ابتدا توالی ها بر اساس شباهت ساختار دوم آن ها به گروه هایی تقسیم شده، سپس توالی های موجود در هر گروه با یکدیگر هم تراز می شوند. این هم ترازی به صورت موازی با استفاده از تکنیک برنامه نویسی چند نخی در گروه های تفکیک شده، صورت می پذیرد. در انتها نتایج هم ترازی تمامی گروه ها با یکدیگر هم تراز می گردند. نتایج به دست آمده از آزمایشات انجام شده، نشان می دهد که استفاده از این روش سبب بهبود کیفیت و سرعت هم ترازی می شود.
سمیه خاکی یادگار محمود نقیب زاده
در حوزه ژنومیکس مقایسه ای، با مقایسه اطلاعات ژنتیکی در سطح توالی ژن های موجود در ژنوم(ها)، شناسایی نواحی ژنومیک متشابه امکان پذیر است که برای مطالعه ساختار و نحوه تکامل ژنوم(ها) به کار می رود. برای بخش های ژنومیک متشابه موجود، پروفایل هایی براساس هم ترازی بر روی این بخش های ژنومیک متشابه به دست می آید. از این پروفایل ها برای تشخیص بخش های جدید از ژنوم که متشابه با پروفایل های موجود باشند، استفاده می شود. درهم ترازی فوق الفبای هر توالی ژن ها هستند. به چنین توالی هایی اصطلاحا لیست های ژنی گویند. تاکنون برای هم ترازی لیست های ژنی روش های پیش رونده و حریصانه ارائه شده است که در این بین، روش های حریصانه مبتنی بر روش های ابتکاری نتایج بهتری داشته اند. با این وجود، در روش ابتکاری با دقت بالا، پیچیدگی محاسباتی زیاد و سرعت اجرای الگوریتم بسیار پایین است و در روش های ابتکاری سریع، دقت تاحدی کاهش پیدا کرده است. در این پایان نامه، ابتدا الگوریتمی برای تشخیص نواحی تناقض در لیست های ژنی ارائه شده است. سپس عملیات وزن دهی مجدد روابط تشابه در این نواحی انجام می شود و درنهایت به اجرای الگوریتم هم ترازی پس رو در هر ناحیه می پردازیم. هدف ما افزایش دقت هم ترازی با وزن دهی مجدد و اجرای الگوریتم هم ترازی پس رو در نواحی تناقض است. نتایج ارزیابی نشان می دهد که اجرای الگوریتم هم ترازی پس رو در نواحی تناقض بر مبنای روش های ابتکاری سریع دارای بهبود قابل توجهی در دقت هم ترازی نسبت به روش پایه gg2 است.
عبدالرضا سوادی حسین دلداری
با محدودیت های پیش آمده در توسعه معماری های موازی همچون میزان مصرف انرژی، میزان گرما و مشکلات عدم همراهی سرعت حافظه با پردازنده ها، معماری چندهسته ای طرح گردید. این معماری به سرعت در کامپیوتر های تجاری و خانگی جای گرفته است. گرچه پردازنده های چندهسته ای گونه ای از معماریهای حافظه اشتراکی هستند ولی بعلت بکارگیری حافظه سلسله مراتبی در سطح یک پردازنده، نیاز به یک بازنگری مجدد در مورد نرم افزارها، سیستم عامل و حتی مدلهای مهندسی نرم افزار و نیز مدل های محاسباتی برای آنها احساس می شود. یکی ازمهمترین نیازها، داشتن محیطی مناسب برای برنامه نویسی برای این معماریهاست. اگر این نیاز به صورتی مناسب ارضا نشود عملا حیات این معماری ها در خطرست زیرا برنامه نویسی موجود برای این معماریها مشکل است و عده کمی از پس انجام این گونه برنامه نویسی بر می آیند. این خود به خود نشان می دهد که این معماری جذابیتی برای برنامه نویسان و استفاده کنندگان نخواهد داشت. پس به ناچار اگر این معماریها بخواهند جایی خود را در عرصه سیستم های موازی تثبیت کنند می بایست با محیط ها و ابزارهای برنامه نویسی و مناسب همراه شوند. این رساله در این راستا سعی در ارائه یک مدل برنامه نویسی آسان برای کاربران این معماری ها دارد. برای نیل به این هدف، برنامه نویسی با سطح بسیار بالای اسکلتی مدنظر قرار گرفت. به جهت داشتن یک زیر ساخت تئوریک و قدرتمند، کار بر اساس مدل محاسباتی انجام پذیرفت تا بتوان به مزایایی استفاده از این گونه زیرساخت هایی همچون امکان پیشگویی هزینه ها و امکان تنظیم زمانبندی ها در زمان اجرا دست یافت. با ایجاد مدل های اشتقاقی از این مدل پایه، کار فراگیری این مدل پایه بر روی الگوریتم های پر کاربرد دنیای موازی همچون تقسیم-و-حل و انشعاب-و-تحدید قابل انجام شد. همچنین برای قابل استفاده کردن این مدل های محاسباتی، بحث محک زنی این مدل محاسباتی از طریق اندازه گیری پارامترهایشان، به عنوان آخرین کار اساسی این پژوهش، انجام یافت. نتیجه این پژوهش، دستیابی به یک مدل برنامه نویسی آسان، کارآ، فراگیر و با پشتوانه یک مدل محاسباتی قدرتمند برای معماری های نوظهور چند هسته ای بوده است.
سودابه غفوریان محمود نقیب زاده
پیمانه بندی هستان شناسی راهی مناسب برای استفاده از هستان شناسی های بزرگ است. برای ایجاد پیمانه هایی با کیفیت بالا، باید هم جنبه ساختاری و هم معنایی هستان شناسی در نظر گرفته شود. برای در نظر گرفتن ویژگی ساختاری هستان شناسی کافیست آن را به صورت گراف نمایش دهیم. برای در نظر گرفتن ویژگی معنایی هستان شناسی کافیست به روابط مختلف، وزنهای متفاوتی داده شود. وزندهی به یالها مستلزم شناسایی روابط مختلف و تشخیص میزان مهم بودن آنهاست. بنابراین برای انجام راه حل پیشنهادی گامهای ذیل طی میشود: 1. مشخص کردن نحوه نمایش گراف هستان شناسی از روشی برای نمایش گراف هستان شناسی استفاده میشود که فاعل، مفعول و فعل هر کدام جدا بهصورت گره در نظر گرفته میشوند. البته فقط خصوصیات objectproperty و datatypeproperty را گره در نظر میگیریم و بقیه روابط (خصوصیات) به صورت یال در نظر گرفته میشوند، به علاوه در این نمایش نمونه ها نیز به عنوان گره نمایش داده میشوند. 2. شناسایی روابط و وزندهی به آنها برای وزندهی به روابط مختلف هستان شناسی از یک تابع وزن استفاده میشود این تابع به بعضی از روابط موجود، عددی صحیح نسبت میدهد. وزن دادن یک راه تفاوت قائل شدن بین روابط است. یک راه اولویت دادن به روابط بر اساس پیدایش روابط است و راه دیگر این است که میتوان بر اساس معنا و تعریف روابط اولویت آنها را مشخص کرد. 3. یکسان سازی وزن یالها در صورت لزوم اگر بین گره ها بیش از یک رابطه وجود داشت بین وزن روابط حداکثر وزن در نظر گرفته میشود و سپس بر اساس وزن حداکثر و وزن یک گام بالاتر از این وزن در جدول 1، وزن حاصل به وزن یک گام بالاتر تنظیم میشود. 4. نرمالسازی برای نرمال سازی، وزن یال خروجی از گره مورد نظر بر مجموع وزنهای یالهای خروجی از گره تقسیم میشود. بنابراین وزنها بین صفر و 1 خواهند بود. خروجی این قسمت ماتریسی است که برای ورود به الگوریتم فاصله گام تصادفی آماده است. 5. تخمین نزدیکی رئوس با استفاده از الگوریتم همسایگی فاصله گام تصادفی از الگوریتم همسایگی فاصله گام تصادفی برای اندازه گیری نزدیکی رئوس هستان شناسی استفاده میشود. 6. پیمانه بندی تابع معیار استفاده شده silhouettes coefficient یا s(i) است. میانگین s(i) معیاری است که نشان میدهد چقدر داده ها در یک پیمانه، مناسب گروه بندی شده اند. s(i) را به ازای هر گره مفهوم با توجه به رابطه زیر به دست می آید. کارایی پیمانه بندی بر اساس متوسط امتیاز هر پیمانه به دست میآید. امتیاز هر پیمانه نیز بر اساس متوسط امتیازهای گره های داخل پیمانه یعنی s(i) ها محاسبه میشود. برای پیمانه بندی دو الگوریتم به شرح زیر پیشنهاد شده است: الگوریتم پیمانه بندی تجمعی ورودی الگوریتم تجمعی ماتریس همسایگی فاصله گام تصادفی است. این الگوریتم پیمانه را به صورت تکراری براساس داشتن شباهت زیاد با هم ادغام میکند. یک الگوریتم پایین به بالاست که در ابتدا هر راس را به عنوان یک پیمانه مجزا در نظر میگیرد و در آخر با یک گراف به عنوان یک پیمانه منحصربه فرد پایان میگیرد. در اینجا در هر مرحله به ازای هر دو پیمانه ci و cj، پیمانه ها باهم ادغام میشوند و امتیاز بدست میآید، ترکیبی که بیشترین امتیاز را دارد، لحاظ میشود و در آخر این ترکیب انتخاب شده و به مرحله بعد که یکی از تعداد پیمانه ها کم میشود، میرود و دوباره همین مراحل تکرار میشود تا در نهایت یک پیمانه باقی بماند. الگوریتم پیمانه بندی اکتشافی الگوریتم اکتشافی به منظور پیشتیبانی از هستان شناسی های بزرگ و کاهش زمان اجرا پیشنهاد شده است. ورودی این الگوریتم برای پیمانه بندی ماتریس وقوعی است که از روی ماتریس مجاورت ساخته شده است. هر سطر از ماتریس وقوع یک یال را معرفی میکند که شامل گره اول، گره دوم و وزن بین آن دو میشود. این ماتریس بر اساس ستون وزن به صورت صعودی مرتب میشود. الگوریتم بدین صورت است که اگر گره اول و دوم در یک پیمانه نباشند، باهم ادغام میشوند. سپس دو شرط چک میشود: اول، اگر اندازه پیمانه جدید کمتر از یک سوم کل تعداد گره ها باشد، ادغام صورت میگیرد و شرط دوم چک کردن امتیاز پیمانه بندی است که اگر امتیاز بالاتر باشد الگوریتم ادامه می یابد، در غیر اینصورت الگوریتم خاتمه می یابد. راهکار پیشنهادی هر دو جنبه ساختاری و معنایی هستان شناسی را در نظر می گیرد حال آن که در اکثر کارهای گذشته به هردو جنبه توجه نمیشود. معنا با توجه به اختصاص دادن وزن به روابط متفاوت در نظر گرفته شده است به علاوه نسبت به سایر رویکردها روابط بیشتری در نظر گرفته می شود. در نظر گرفتن روابط بیشتر باعث می شود که یالهای بیشتری در نمایش گراف هستان شناسی وجود داشته باشد که میتوان در پیدا کردن شباهت دو گره تصمیم بهتری گرفت. استفاده از ماتریس همسایگی فاصله گام تصادفی برای ترکیب جنبه ساختاری و معنایی هستان شناسی انجام می گیرد. هر درایه از این ماتریس با توجه به وزن تقریباً همه درایه های ماتریس احتمال انتقال محاسبه می شود بنابراین وزن ها در روش پیشنهادی دقیقتر از سایر روشهایی هستند که فقط از ماتریس وزن استفاده می کنند. به علاوه در روش پیشنهادی یک تابع امتیازدهی جدید معرفی شده است. هدف این تابع بیشینه کردن شباهت داخل پیمانه ها و کم کردن شباهت بین پیمانه هاست. تابع امتیازدهی با توجه به هدفش نشان میدهد که گره ها چقدر در داخل پیمانه مورد نظر مناسب گروه بندی شده اند. و در آخر به عنوان نتیجه میتوان گفت، پیمانه های ایجاد شده در روش ما دارای بار معنایی هستند زیرا در این پژوهش روابط بیشتری نسبت به روشهای مشابه در نظر گرفته میشود و این روابط طوری پردازش میشوند که وزن هر یال یا رابطه روی انتخاب هر پیمانه تاثیر میگذارد.
مریم میرزایی محمود نقیب زاده
در سیستم های بی درنگ سخت، الگوریتم های زمان بندی شبه افراز تلاش دارند تا بتوانند از ظرفیت هدر رفته توسط الگوریتم های افراز با تقسیم کردن تعدادی از وظایف استفاده کنند. مهم ترین چالش در مواجهه با این الگوریتم ها این است که چگونه وظیفه ها به پردازنده ها انتساب داده شوند و کدام وظیفه ها تقسیم شوند تا بهره وری پردازنده بیش تری حاصل شود در حالی که سربار کم تری به سیستم تحمیل شود. در این تحقیق، یک الگوریتم زمان بندی شبه افراز تحت عنوان hsa معرفی می شود. هدف اصلی در الگوریتم hsa، افزایش حداکثر بهره وری پردازنده سیستم در جهت افزایش کارایی سیستم می باشد که برای رسیدن به این منظور، سعی شده تا برخی از وظایف با کاهش صوری دوره تناوب شان با هم هارمونیک شوند. هم چنین هدف دیگر از ارائه الگوریتم hsa ، کاهش بالاسری سیستم با کاهش تعداد بازپس گری وظایف می باشد که این کار با تغییر در نحوه اولویت دهی به وظایف در تخصیص به پردازنده ها و انتخاب وظیفه برای تقسیم کردن، صورت می گیرد. نتایج شبیه سازی برتری hsa را بر الگوریتم rmls از نظر بهره وری سیستم و هم چنین کاهش سربار تحمیلی نشان می دهد.
سعید صنوبری محمود نقیب زاده
طراحی سیستم های بی درنگ همانند صنعت نرم افزار، یک موضوع رو به رشد در پژوهش های امروزی است. یک قسمت مهم از این سیستم ها، الگوریتم زمان بندی آن ها است. زمان بند یک سیستم بی درنگ تعیین می کند که کدام وظیفه در کدام پردازنده اجرا شود، و در عین حال باید تضمین کند که هیچ وظیفه ای، مهلت زمانی خود را از دست ندهد. از جمله این الگوریتم ها، می توان الگوریتم متناسب با نرخ و الگوریتم نرخ یکنواخت تأخیری را نام برد. الگوریتم نرخ یکنواخت تأخیری نوع بهبودیافته ای از الگوریتم متناسب با نرخ است که می تواند دامنه وسیع تری از وظایف را زمان بندی کند. امروزه مفهوم جدیدی تحت عنوان شبه افراز و یا تقسیم وظایف در روش های زمان بندی در سیستم های چند پردازنده ای وجود دارد که هدف آن بهبود بار سیستم ها است. کارهایی در این زمینه با استفاده از الگوریتم متناسب با نرخ انجام شده است. حال در این پایان نامه زمان بندی بر پایه الگوریتم نرخ یکنواخت تأخیری و با استفاده از تقسیم وظایف طراحی و پیاده سازی می شود که در مرحله اول علاوه بر رسیدن به میزان باری برابر با روشی موجود که از الگوریتم متناسب با نرخ بهره می برد، در برابر خطاهای احتمالی مقاوم تر است و سپس راهکاری معرفی می شود که می تواند بار یک پردازنده را تحت شرایطی بهبود بخشد.
مرضیه ارحمی محمود نقیب زاده
یافتن بلندترین زیررشته مشترک چند رشته یک مساله شناخته شده است که در زمینه¬های گوناگون نظیر زیست¬شناسی و ژنومیک کاربردهای بسیار دارد. این مساله توسط محققان زیادی مطالعه شده است و پیچیدگی آن از جنبه¬های مختلف در طی سال¬ها بهبود یافته است. روش¬های مختلفی برای حل مسئله¬ی بلندترین زیررشته مشترک بین چندین رشته (mlcs) وجوددارد. روش¬های کلاسیک مبتنی بر روش¬های برنامه¬نویسی پویا از روش¬های ابتدایی حل مسئله mlcs بوده است. روش¬های مبتنی بر نقاط غالب و روش¬های مبتنی بر الگوریتم¬های موازی از جمله روش¬های دیگری هستند که به¬منظور کاهش پیچیدگی این مسائل از جنبه¬های مختلف توسعه داده شده¬اند. در این پژوهش برخی از روش¬های ارائه شده در این زمنیه بررسی می¬شود، سپس یک الگوریتم به نام parallel-quick-mlcs براساس روش مبتنی بر نقاط غالب مطرح می¬شود. الگوریتم ارائه شده موازی می¬باشد ودرآن تعداد پروسس¬های فعال در ابتدا تعریف شده است. پیچیدگی زمانی الگوریتم محاسبه می¬شودو با استفاده ازیک عملکرد مبتنی برگراف, بلندترین زیررشته مشترک از مجموعه نقاط غالب استخراج می¬شود.
سعید خطائیان خلیل آباد محمود نقیب زاده
پیدا کردن بزرگ ترین زیرتوالی مشترک بین چندین توالی یکی از مسائل np-hard با کاربردهای فراوان در اکثر زمینه ها ازجمله بیوانفورماتیک می باشد. افزایش روزافزون پیچیدگی و اندازه داده های مولکولی، نیازمند روش های کاربردی موثرتری برای توالی های با اندازه های متفاوت است. الگوریتم های موازی برای این گونه مسائل با داده های با اندازه بزرگ بسیار مهم هستند. در این پایان نامه روشی برای حل مسئله mlcs با استفاده از الگوریتم های موازی و بستر سخت افزاری واحد پردازش گرافیکی بر اساس روش های کلاسیک حل این مسائل ارائه شده است. ماتریس امتیاز اساس کار روش های کلاسیک می باشد که هسته های واحد پردازش گرافیکی با پیمایش قطری، هر قطر این ماتریس را در یک لحظه محاسبه می کنند. نتایج ارزیابی در مقابل دو الگوریتم پرسرعت سری و موازی، با وجود پیچیدگی فضای محاسباتی بالا اما زمان اجرای بسیار پایین تر را نشان می دهد، به طوری که در اندازه های بالاتر طول دنباله ها، سرعت در حالت سری حدود 2000 برابر و در حالت موازی حدود 10 برابر الگوریتم های بررسی شده می باشد. تمام روش هایی که با استفاده از واحد پردازش گرافیکی ارائه شده اند در زمینه مسائل lcs که حالت خاصی از مسئله mlcs برای دو توالی هستند، الگوریتم هایی را ارائه کرده اند. واحدهای پردازش گرافیکی با تعداد هسته پردازشی زیاد برای مسائل با حجم انبوه داده که عملیات واحد یکسانی بر روی آن ها انجام می شود بسیار مناسب می باشند. پیدا کردن بزرگ ترین زیرتوالی مشترک بین چندین توالی نیز از این گروه مسائل می باشد.
حمیده محلی سعید ابریشمی
محاسبات تورین یا شبکه های متصل کامپیوتری مدل شبکه ای جدیدی است که با استفاده از پردازشگرهای متصل به هم امکان انجام دادن عملیات محاسباتی را میسر می سازد. از آنجایی که کاربران به سرویس های با کیفیت بالا نیاز دارند، روش های مدیریت منابع و زمانبندی بایستی بکوشند تا تقاضاهای رقابتی را بر روی منابع به طور شایسته برای آنها فراهم سازند. یکی از روش های مطرح شده در زمینه مدیریت منابع و زمانبندی تورین، روش های اقتصادی است که با توجه به ساختار نامتمرکز شباهت زیادی به محیط تورین دارند. نکته مهمی که در مدیریت منابع و زمانبندی نمی توان به راحتی ازکنار آن گذشت، بی توجهی به شبکه دربسیاری از این روش ها است. در این پایان نامه قصد داریم یک روش حراج مضاعف پیوسته آگاه از شبکه برای تخصیص منابع تورین معرفی کرده، که در آن منابع به عنوان عوامل فراهم کننده وکاربران به عنوان عوامل مصرف کننده در نظر گرفته شده اند. در این رویکرد، کاربران و فراهم کنندگان قیمت های پیشنهادی خود را براساس پارامترهایی تعیین می نمایند کاربران براساس، متوسط زمان باقی مانده، تعداد منابع باقی مانده، و اندازی داده ورودی و فراهم کنندگان براساس بار فعلی منابع قیمت پیشنهادی خود را در حراج تعیین می کنند؛ و شبکه نیز به عنوان یک عنصر تاثیر گذار در تورین در نظر گرفته شده است. که سعی می شود عمل تخصیص منابع به صورت آگاه از شبکه و براساس وضعیت جاری سیستم انجام گیرد. سهم اصلی این کار یک ارزیابی جامع برای مقایسه باحالتی که پارامترهای شبکه در آن درنظر گرفته نشده است می باشد
مصطفی قاضی زاده محمود نقیب زاده
یکی از مسائل خیلی مهم دهه های اخیر، تصمیم گیری به کمک مشاهدات می باشد و یکی از مهمترین زمینه های تحقیقاتی تصمیم گیری بر اساس داده های مشاهده شده، شبکه های بیز می باشند. از طرفی برای تطبیق این نوع شبکه ها برای تصمیم گیری بر اساس نیازهای دنیای واقعی، بازه های احتمالی را به آن اضافه کرده اند. از طرف دیگر صحیح به نظر نمی رسد که به تمامی مقادیر احتمالات در بازه های احتمالی به طور یکسان نگریسته شود. به عبارت دیگر امکان صحت هر کدام از مقادیر احتمال را می توان با دیگری متفاوت درنظر گرفت که این ایده به ارائه شبکه های بیز دارای احتمالات فازی منجر شده است. همچنین مشاهدات در دنیای واقعی می توانند فازی باشند که در این رابطه، شبکه های بیز با احتمالات غیر بازه ای برای تصمیم گیری در مورد این نوع داده ها ارائه گردیده است. اما آنچه که ما قصد داریم در این رساله به آن بپردازیم، مطرح کردن یک شبکه بیز بر پایه احتمالات فازی برای مشاهدات فازی است که در آن یادگیری پارامترهای مربوطه، از روی مشاهداتی در قالب اعداد فازی، ارائه خواهد گردید. در این راستا، برای یادگیری مقادیر احتمالات در جداول احتمالات شرطی، توسعه ای از احتمالات فازی بر پایه مشاهدات فازی پیشنهاد گردیده است که برگرفته از ایده "درستی" ارائه شده توسط یاگر می باشد. برای ساخت شبکه بیز توسعه یافته بر پایه ی پارامترهای پیشنهادی نیز الگوریتمی ارائه داده ایم. در این الگوریتم برای همگرایی سریعتر به مدل نهایی از مفهوم "اطلاعات متقابل" در تئوری اطلاعات بهره برده ایم. خصوصیت مهم قابل ذکر در رابطه با این مفهوم این است که هرچه اطلاعات متقابل بین دو ویژگی متغیر کمتر باشد نشان دهنده استقلال بیشتر آنها نسبت به هم است. بعد از حصول یک ساختار تقریبی از مدل نهایی شبکه ی بیز، با استفاده از یک الگوریتم حریصانه مدل نهایی را می سازیم. شرایط کولموگرف و برخی نتایج آن را برای توسعه پیشنهادی در بحث یادگیری پارامترها اثبات خواهیم کرد. همچنین نشان می دهیم که روش پیشنهادی قابلیت کاهش یافتن به حالت دقیق را داراست. یادگیری پارامترها را برای برخی شبکه های موجود که هم دارای متغیرهای فازی و هم غیر فازی هستند محاسبه کرده و نشان خواهیم داد که یادگیری پارامترها بر پایه ی مشاهدات فازی حتی با تعداد داده های کمتر نیز می تواند به نتایج قابل قبولی برسد. این مطلب نشان می دهد که پارامترهای فازی در مقایسه با پارامترهای دقیق اطلاعات بیشتری را در اختیار ما قرار می دهند. سپس به یادگیری ساختار برخی شبکه های بیز به کمک الگوریتم پیشنهادی همت گماشته و ساختار یادگیری یافته را با مدل واقعی آن و همچنین با نتایج رویکرد حریصانه ی دیگری در ساخت شبکه بیز توسط معیارهای مختلف مقایسه نموده ایم. در نهایت برای تکمیل موضوع و بررسی تاثیر روش پیشنهادی در یادگیری پارامترها، برای برخی ساختارهای موجود، یادگیری پارامترها را با در نظر گرفتن دو روش دقیق و فازی انجام داده ایم. سپس به طبقه بندی بر اساس آن ها پرداخته و دقت طبقه بندی را در دو حالت مقایسه کرده و نتایج را در رساله آورده ایم.
امید کیوانی هادی صدوقی یزدی
شبکه بیز کاربرد زیادی در بسیاری از مسائل دارد و یادگیری ساختار آن مهمترین بخش آن میباشد. برای یادگیری شبکه بیز الگوریتمهای زیادی وجود دارند. اما الگوریتم کارآمد و مفیدی برای یادگیری این ساختار در شرایط جریانی بودن دادهها وجود ندارد. دادههای جریانی دارای فرضیاتی میباشند که به شرایط واقعی بسیار نزدیک است و از این رو بسیار حائز اهمیت هستند. در این پایاننامه ابتدا بررسی روشهای ممکن برای یادگیری ساختار شبکه بیز در صورت جریانی بودن دادهها انجام شده است و سپس الگوریتمی ارائه شده که از لحاظ پیچیدگی زمانی و مکانی با فرضیات دادههای جریانی مطابقت داشته باشد. ضمناَ، از آنجا که فرض شده است دادهها ایستان میباشند، همگرایی و حساس نبودن الگوریتم پیشنهادی به نویز نیز اثبات شده است. آزمایشاتی بر روی چندین داده استاندارد شبکه بیز نیز انجام شده که نتایج این آزمایشات، درستی قضایای همگرایی و حساس نبودن به نویز را تایید میکند. در بخش دوم این پایاننامه کاربرد جدیدی برای شبکه بیز در تلفیق نظر چند طبقه بیز معرفی شده است. برتری استفاده از شبکه بیز نسبت به روشهای سابق که اکثراَ مبتنی بر وزندهی هستند این است که، حتی از طبقهبندهایی که دقت پایین دارند به خوبی استفاده میکند و مانند روشهای وزندهی نیاز نیست تا فرض شود که تمام طبقهبندهای پایه دقتی بیش از 5 % داشته باشند. دو مثال شهودی برای درک بهتر مزیت استفاده از شبکه بیز در تلفیق طبقهبندها بیان شده است. در نهایت این سیستم تلفیقگر برای دادههای جریانی نیز استفاده شده است. برای این منظور از الگوریتم ارائه شده در بخش اول پایاننامه استفاده شده. الگوریتم پیشنهادی بر روی چند داده از مخزن uci و چند داده از دادههای استاندارد شبکه بیز بررسی شده که نتایج بهدست آمده حاکی از این است که استفاده از شبکه بیز برای طبقهبندی باعث بهبود دقت و همچنین قابلیت اطمینان طبقهبند میشود.
حمید فدیشه ای حسین دلداری
وابستگی روزافزون زندگی بشر به سامانه های محاسباتی منجر به اختصاص سهم بزرگی از مصرف انرژی الکتریکی دنیا به این سامانه ها شده است. عدم مهار مصرف توان در این محیط ها می تواند اثرات منفی متعددی از جمله تحمیل هزینه های سرسام آور، تهدید دسترسی پذیری خدمات، و تخریب محیط زیست را به بار آورد. از این رو تلاش تحقیقاتی بسیاری بر بهینه سازی مصرف این سامانه ها تمرکز یافته است. یکی از گام های مهم و پایه در تکاپوی تحقیقاتی وسیع در راستای این هدف، دارا بودن درک مناسبی از رفتار مصرف انرژی در این محیط هاست که موجب تمرکز محققان مختلفی بر مسأله مدل سازی (بویژه مدل سازی برخط) جهت تخمین مصرف توان محاسباتی گشته است. اگر چه مدل های برخط می توانند برای مدیریت محلی توان موثر واقع شوند، در سامانه های بزرگ مقیاس نظیر گریدهای محاسباتی، مدل هایی که بتوانند توان مصرفی بار کاری را قبل از اجرای آن پیش بینی کنند می توانند در مدیریت پیشدست این سامانه ها بسیار سودمند واقع شوند. پیش بینی مصرف قبل از اجرا به لحاظ ذاتی مسأله پیچیده تری از تخمین توان در طول اجرا می باشد. چرا که مدل های برخط برای پیش بینی مصرف توان از ورودی هایی نظیر تعداد فقدان دسترسی به حافظه که دارای همبستگی با توان هستند استفاده می کنند؛ اما این ورودی های به خاطر وابستگی به ماشین قابل کاربرد در مدل های پیش بینی قبل از اجرا نیستند. تحقیق حاضر به مدل سازی مصرف توان بارهای کاری چند ریسمانی، جهت پیش بینی قبل از اجرای مصرف توان با توجه به خصوصیات بار کاری و منبع اختصاص دارد. برای رسیدن به این هدف، اقدام به تحلیل و شناخت بارهای کاری و تببین خصوصیات موثر بر توان مصرفی آن ها شده است. برای مهار فضای بزرگ ناشی از پیچیدگی سامانه های مدرن امروز، چارچوب پیشنهادی، پیش بینی توان را در دو گام متوالی توسط دو زیرمدل انجام می دهد. در گام اول، مدلی بر اساس رابطه فیزیکی مصرف توان مدارات سی ماس برای پیش بینی میزان مصرف توان یک ریسمان بار کاری در یک فرکانس مرجع به کار گرفته می شود. این زیرمدل با کمک یادگیری ماشین و بر اساس خصوصیات بار کاری و منبع پردازشی ایجاد می شود. خروجی به دست آمده از گام نخست، توسط زیرمدل دوم که بر پایه تئوری amdahl بنا شده است به تعداد مورد نظر ریسمان اجرایی در فرکانس دلخواه مقیاس می یابد تا خروجی نهایی مدل به دست آید. آزمایشات عملی بر روی بارهای کاری مختلف و ماشین های متفاوت بیان گر دقت بالای این رویکرد با میانگین خطای 3.7% بوده که قابل مقایسه با سایر روش ها (حتی روش های تخمین برخط نظیر روش های مبتنی بر شمارنده های بازدهی) می باشد.
حمید سعادت فر حسین دلداری
نیاز به انجام محاسبات سنگین در دهه های اخیر تمایل به سیستم های محاسباتی با کارایی بالا همانند سیستم های مشبک را افزایش داده است. افزایش مقیاس در این سیستم ها اگرچه توان محاسباتی را افزایش می دهد، ولی باعث بالا رفتن نرخ مصرف انرژی نیز می شود؛ تا جایی که امروزه سیستم های مشبک محاسباتی تبدیل به مصرف کننده های جدی انرژی الکتریکی شده اند. از این رو امروزه مدیریت مصرف انرژی به عنوان یک ضرورت برای محاسبات با کارایی بالا مطرح می باشد. یکی از روش های نرم افزاری کارآمد برای کاهش مصرف انرژی، استفاده از زمان بندها می باشد. در این رساله، زمان بندی آگاه به توان پیشنهاد می شود، که دارای ایده هایی جدید در گام های پذیرش برنامه ها، تنظیم فرکانس، مرتب سازی و نگاشت آن ها است. یکنواخت سازی سرعت پردازشی سیستم به عنوان یک فلسفه که حرکت به سمت آن می تواند باعث کاهش مصرف انرژی شود، پیشنهاد و به صورت تئوری بررسی شده است. برای تحقق این هدف، مفاهیم و روش هایی مثل مفهوم موعد مقرر مجازی و یا روش هاف برای مرتب سازی برنامه ها در صف انتظار پیشنهاد شده است. نوآوری دیگر روش پیشنهادی در دیدگاه آن نسبت به مصرف انرژی است، که آن را تابعی از خصوصیات هر دو بخش منبع و برنامه می داند. برای اعمال این دیدگاه علاوه بر بررسی رابطه بین مصرف انرژی و خصوصیات برنامه و منبع، ویژگی هایی ترکیبی همانند mps تعریف شده اند، که زمان بند را در یافتن منبع مناسب کمک می کنند. زمان بند پیشنهادی همچنین به کمک مولفه تازه تعریف شده jsm و با توجه به پارامترهای مختلفی از سیستم و برنامه همانند میزان بهره برداری از منابع، احتمال خرابی برنامه ها و یا حجم پردازشی مورد نیاز آن ها، سعی در پذیرش آگاه به توان برنامه ها دارد. نتایج ارزیابی در سناریوها و شرایط حقیقی و با استفاده از شبیه سازی نشان می دهد که زمان بند پیشنهادی در مقایسه با سایر روش های مرتبط عملکرد بهتری در کاهش مصرف انرژی سیستم و تضمین کارایی مورد نیاز برنامه ها دارد
مهدیه اقدامی محمود نقیب زاده
صفحات بتا یکی از اجزای مهم و پرتکرار در پروتئین ها هستند. تعیین صحیح آرایش صفحات بتا یکی از مسائل حل نشده در زیست شناسی محاسباتی و گلوگاهی در تعیین ساختار سه بعدی پروتئین است. هر پروتئین می تواند شامل چندین صفحه ی بتا باشد. صفحات بتا شامل تعدادی رشته ی بتا هستند. در مسئله ی تعیین آرایش صفحات بتا، هدف مشخص کردن نحوه ی افراز رشته ها به صفحات و تعیین آرایش آن ها در هر صفحه است، به نحوی که پایدارترین آرایش که بیشینه ی امتیاز را دارا است شناسایی شود. آرایش هر صفحه بر اساس ترتیب قرار گرفتن رشته ها در صفحه و جهت برهمکنش بین هر جفت رشته مشخص می شود.
مصطفی قاضی زاده احسایی حسین دلداری
چکیده ندارد.
محمدرضا میریانی محمود نقیب زاده
زمانبندی اجرای بهینه ی وظیفه ها در اکثر موارد یک مساله از مرتبه ی زمانی غیرچندجمله ای است و در نظر گرفتن وابستگی بین وظیفه ها منجر به افزایش پیچیدگی مساله می شود. این مسایل در برگیرنده ی سیستم های بی درنگ نیز می شوند. از آنجا که در سیستم های بی درنگ مسایل زمانی از حساسیت بیشتری برخوردار هستند، الگوریتم زمانبندی و در نظر گرفتن عامل های موثر بر زمان اهمیت فوق العاده ای دارند. در این پایان نامه، زمانبندی زیربهینه ای برای سیستم های بی درنگ سخت در محیط چندپردازنده ای ناهمگن با توجه به محدودیت های زمانی از جمله زمان بارگذاری دوباره ی حافظه ی نهان پردازنده ها به کمک الگوریتم ژنتیک ارایه شده است، به طوری که هدف آن کمینه کردن همزمان زمان تکمیل کل وظیفه ها و تعداد پردازنده های مورد نیاز برای برآورده شدن تمام ضرب الاجل ها است. همچنین تعمیم مساله زمانبندی سیستم های چندپردازنده به کمک الگوریتم های ژنتیک به نحوی که برای سیستم های بی درنگ اعم از بی درنگ سخت و بی درنگ نرم، و سیستم های بدون محدودیت زمانی مناسب باشد، مد نظر قرار گرفته است.
جواد صدری محمود نقیب زاده
در این پایان نامه روش جدیدی برای بازشناسی حروف مجزا، ارقام و علائم متنی فارسی ارائه شده است . لذا این پایان نامه در هفت فصل به شرح زیر تنظیم شده است : فصل اول : این فصل به مقدمه و آشنایی کلی با روشهای ocr و کاربردهای آن اختصاص دارد. فصل دوم : اصول تشخیص الگو و مراحل آن به صورت کلی مورد بحث قرار می گیرد و دو روش تشخیص الگو بیان شده و با هم مقایسه می شوند. فصل سوم : این فصل به بیان ویژگیهای خط و نوشتار لاتین و فارسی و مقایسه آنها از دیدگاه ocr می پردازد. فصل چهارم: این فصل به بررسی مقالات ، روشها و کارهای انجام شده در مورد ocr فارسی و عربی و ارزیابی پیشرفتهای انجام شده می پردازد. فصل پنجم : این فصل به ارائه روش و سیستم جدید معرفی شده در این پایان نامه می پردازد. فصل ششم : این فصل به طراحی و پیاده سازی سیستم ارائه شده در فصل پنجم می پردازد و قسمتهای مختلف آن را از دیدگاه پیاده سازی بررسی می کند. فصل هفتم: به بررسی نتایج حاصل از آزمایش سیستم و نتیجه گیری کلی اختصاص دارد.