نام پژوهشگر: فرشاد خون جوش

تصدیق سریع svm براساس توقف زود هنگام در الگوریتم تکرار شونده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز 1390
  سید محمود فاموری   زهره عظیمی فر

چکیده

آنالیز، طراحی و پیاده سازی یک سیستم بازاریابی ایمیل جامع بر پایه پلتفرم رایانش ابری
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز 1390
  حامد قادری پور   منصور امینی لاری

تجارت الکترونیک، پیشرفت و توسعه روزافزون فناوری اطلاعات در سطح جهانی باعث تغییر و تحولات بنیادین در ساختار اقتصادی جوامع شده است. بازرگانی، بانکداری، رسانه های گروهی و بسیاری از زیرمجموعه های خدمات فناوری از جمله بخش هایی هستند که بشدت تحت تاثیر این روند بوده اند. تجارت الکترونیکی به دلیل سرعت، کارایی، کاهش هزینه ها و بهره برداری از فرصت ها، عرصه جدیدی را در رقابت گشوده است. تا آنجا که گفته می شود عقب افتادن از این سیر تحول، نتیجه ای جز منزوی شدن از عرصه اقتصاد جهانی نخواهد داشت. رشد اقتصاد جهانی در سال 2000، 3.8 درصد و در سال 2001، 1.3درصد افول داشته است. همچنین نرخ رشد تجارت بین المللی نیز به طور قابل توجهی پایین آمده است. بخصوص صادرات کشورهای در حال توسعه که در سال 2000 با نرخ 14 درصد رشد کرده بود، در سال 2001 تنها به میزان 1 درصد افزایش داشته است. در مقابل این موارد، این حقیقت وجود دارد که تعداد میزبان های اینترنت، تعداد کاربران اینترنت در سراسر جهان و ارزش کالاها و خدماتی که به صورت online مبادله می شوند، به سرعت در حال رشد بوده و عملکرد کسب و کارها، دولت و سایر جنبه های اجتماعی تحت تاثیر اینترنت قرار گرفته است. در این پایان نامه، سعی بر این است که به یکی از کاربردهای تجارت الکترونیک با عنوان بازاریابی ایمیل پرداخته شود. اینکه چرا می بایست از آن به عنوان مکملی برای روش های سنتی بهره جست، بیان خواهد گردید و نقاط ضعف و قوت آن به تفصیل شرح داده می شود. در ادامه به طراحی سیستمی با نام بازاریابی ایمیل جامع خواهیم پرداخت و به طور کامل آن را با استفاده از data flow diagram مدل خواهیم نمود. یکی از نقاط برجسته این نرم افزار در مقایسه با موارد مشابه، استفاده از تکنیک های داده کاوی است. که از آن در تجزیه و تحلیل نتایج ارسال های ایمیل در جهت اصلاح محتوای ارسال شده برای مخاطب و همچنین در یافتن آدرس های ایمیل جدید، استفاده خواهیم نمود. در نهایت معماری سیستم به گونه ای طرح ریزی خواهد شد تا بتواند بر روی سرویس رایانش ابری شرکت مایکروسافت قرار بگیرد.

طراحی و پیاده سازی چارچوب mapreduce تعاونی مبتنی بر کلاستر با استفاده از پردازنده کارت گرافیک
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر 1390
  امین عباسی قلاتی   فرشاد خون جوش

ایجاد مدل های برنامه نویسی جدید برای فراهم کردن تجرید سطح بالا از مهمترین روش های به کار گرفته شده برای کاهش نیاز برنامه نویس به تسلط بر جزییات دقیق معماری و ساده سازی برنامه نویسی موازی می باشند. همانطور که پیشتر گفته شد، از پرکاربردترین مدل های معرفی شده برای برنامه نویسی موازی می توان به مدل mapreduce اشاره کرد. کلیدی ترین فایده این مدل این است که به برنامه نویس اجازه می دهد تا فقط و فقط بر هسته محاسباتی مورد نیاز خود تمرکز کند و مسوولیت مدیریت اجرای موازی برنامه و تمام چالش های برنامه نویسی موازی از جمله تفکیک و توزیع متعادل داده ورودی و تحمل پذیری خطا بر عهده سیستم زمان اجرا گذاشته شده است. این مدل اولین بار، برای برنامه نویسی بر روی سیستم های کلاستری ارایه شد و پر کاربرد ترین پیاده سازی این مدل را بدون شک می توان چارچوب منبع باز apache hadoop [apache, hadoop][zaharian, 2008]دانست. برنامه نویس با استفاده از کتابخانه موجود در hadoop می تواند برنامه هایی منطبق با مدل mapreduce را بنویسد و سیستم زمان اجرای hadoop برنامه را به طور موازی بر روی سیستم های کامپیوتری موجود در کلاستر اجرا می کند. پیاده سازی این مدل برای معماری پردازنده کارت گرافیک [he, 2008] [mokhtari, 2011]و نیز پردازنده های چند هسته ای [ranger, 2007][yoo, 2009] نیز انجام شده است. یکی دیگر از گرایش های مهم در جامعه برنامه نویسی موازی، استفاده از پردازنده های موازی fine-grained به عنوان شتاب دهنده در هر یک از گره های یک کلاستر برای افزایش سرعت محاسباتی نهایی آن بوده است. انواع مختلفی از شتاب دهنده ها وجود دارند که از جمله آنها می توان به کارت های گرافیکی، fpga ها، پردازنده های کمکی simd، و مدارات مجتمع خاص منظوره اشاره کرد. با توجه به اینکه mapreduce برای بسیاری از این محیط ها نیز پیاده سازی شده است، مطلوب است با پیوند انواع چارچوب های موجود mapreduce برای عناصر پردازشی مختلف موجود در یک کلاستر به یکدیگر، یک محیط یکپارچه برای اجرای یک برنامه mapreduce بر روی پردازنده های غیر همگن موجود در یک کلاستر ایجاد کرد. در این صورت با داشتن یک تعریف از یک برنامه ی mapreduce برنامه نویس می تواند از تمامی پردازنده های موجود در کلاستر برای پردازش mapreduce مورد نظر خود استفاده کند. در عمل، تفاوت های معماری بین پردازنده های اصلی و پردازنده های شتاب دهنده، موانع متعددی را بر سر راه اجرای یکپارچه یک برنامه mapreduce ایجاد می کند. اولا، تفاوت هایی بین زبان های برنامه نویسی مورد استفاده برای پردازنده اصلی و شتاب دهنده در هر پیاده سازی وجود دارد. به عنوان مثال، hadoop از جاوا استفاده می کند در حالی که بیشتر پردازنده های شتاب دهنده، از زبان هایی شبیه c مانند [cuda, def] و [opencl, def] استفاده می کنند. متاسفانه، ترجمه برنامه نوشته شده از یک زبان به زبان دیگر نمی تواند به طور کامل به شکل خودکار انجام شود زیرا پیاده سازی های مختلف غالبا باید برای انطباق هر چه بیشتر با مشخصات معماری هر پردازنده، به شکل دستی تنظیم شوند تا آن برنامه کارایی زمان اجرای مناسبی را داشته باشد. علاوه بر این، زمان بندی پردازنده در کلاستر های غیر همگن به مراتب چالش بر انگیز تر از زمانبندی در کلاستر های همگن است. اولا، با توجه به تفاوت های معماری بین پردازنده اصلی و شتاب دهنده ها، هر اندازه بهینه داده ورودی یک وظیفه برای یک نوع پردازنده با نوع دیگر متفاوت است. ثانیا، بعضی از برنامه ها بر روی شتاب دهنده ها بسیار خوب اجرا می شوند، در حالی که برخی دیگر بر روی پردازنده های اصلی سریع تر اجرا می شوند. در نهایت، تاخیر قابل توجه ای برای ارتباط بین پردازنده اصلی و شتاب دهنده (که اغلب از طریق اتصال pci-e بر قرار می شود) وجود دارد، که خود چالش های دیگری برای فراهم کردن داده ورودی برای شتاب دهنده ها در پردازش ناهمگن ایجاد می کند. بنابراین، استفاده ساده اوجانه از شتاب دهنده ها در کلاستر هایhadoop غالبا منجر به میزان بسیار اندکی از به کار گیری منابع پردازشی و در نتیجه، اتلاف بیشینه قدرت پردازشی شتاب دهنده ها می شود و گاها کاهش سرعت محاسباتی نسبت به زمانی که از پردازنده های شتاب دهنده استفاده نمی شود، می گردد. علی رغم گسترش بسیار چشم گیر استفاده از مدل برنامه نویسی mapreduce و به طور خاص پیاده سازی منبع باز آن یعنی hadoop، در پردازش کلاستری، این سیستم ضعف هایی در استفاده بهینه از منابع از جمله پردازنده اصلی، پردازش نا همگن با استفاده از پردازنده های کمکی، به کار گیری بهینه تجهیزات ذخیره سازی داده با پاسخ گویی بالا و مطمئن و نیز مصرف بهینه انرژی دارد. هدف نهایی از اجرای این پروژه، پیاده سازی یک چارچوب برنامه نویسی mapreduce برای سیستم ها کلاستری نا همگن می باشد. تشخیص خودکار و دقیق بهترین ترکیب پردازشی از میان پردازنده های نا همگن موجود در کلاستر و نیز بیشترین استفاده ممکن از پتانسیل پردازشگر های منتخب برای پردازش یک برنامه mapreduce از مهمترین اهداف اجرای این پروژه می باشد. همانگونه که اشاره شد، hadoop امروزه توسط بزرگترین شرکت های کامپیوتری دنیا برای پردازش داده ها و استخراج اطلاعات مورد استفاده قرار گرفته است [hadoop, who]. کارایی چنین سیستمی (hadoop) در هزینه های کلان شرکت های استفاده کننده از آن، بسیار تاثیر گذار است. هر چه عملکرد سیستم به حالت بهینه نزدیک تر باشد، بهره وری بیشتر خواهد بود. به طور دقیق تر، با افزایش سرعت انجام عملیات در چنین سیستم هایی سرعت پاسخگویی و نیز میزان رضایت کاربران افزایش خواهد یافت که این به نوبه خود باعث افزایش تعداد کاربران سیستم خواهد شد. از طرف دیگر، شرکت ها می توانند با کاهش پردازنده های خود به حدی که عملکرد سیستم جدید به حد عملکرد سیستم قبلی باشد، هزینه های خود را کاهش دهند. به طور مثال اگر قبلا برای انجام کاری با استفاده از hadoop در یک مدت زمان معین به تعدادی پردازنده نیاز بوده است، بعد از بهینه سازی مثلا دو برابر عملکرد برنامه، برای اینکه همان کار در همان زمان قبلی انجام شود تعداد پردازنده هایی به اندازه نیمی از آنچه قبل از بهینه سازی لازم بود، نیاز خواهد بود. به این ترتیب در هزینه نگهداری سیستم ها، توان مصرفی و ... به شکل قابل قبولی صرفه جویی می شود. بدیهی است که هر چه میزان بهینه سازی سیستم بیشتر باشد، مزایای بیشتری عاید استفاده کنندگان سیستم خواهد شد. همانگونه که در بخش های آتی نشان داده می شود، hadoop در استفاده بهینه از منابع از جمله پردازنده اصلی، عدم پشتیبانی مناسب از پردازش نا همگن با استفاده از پردازنده های کمکی و به کار گیری بهینه تجهیزات ذخیره سازی داده با پاسخ گویی بالا مشکلاتی دارد. هدف نهایی از اجرای این پروژه، پیاده سازی یک چارچوب برنامه نویسی mapreduce برای سیستم های کلاستری نا همگن می باشد. این سیستم باید بتواند به طور خودکار بهترین ترکیب پردازشی از میان پردازنده های نا همگن موجود در کلاستر را تشخیص داده و تا حد ممکن از پتانسیل پردازشگر های منتخب برای پردازش یک برنامه mapreduce استفاده کند.

زمان بندی پروژه های چند حالته با منابع محدود
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی کامپیوتر 1391
  ندا اکرمی   کورش زیارتی

مسئله ی زمان بندی پروژه های چندحالته با منابع محدود از جمله مسائل np-hard است که توجه محققین بسیاری را به خود جلب کرده است. در این مسئله هدف زمان بندی فعالیت های مختلف پروژه در کمترین زمان ممکن با رعایت قیود اولویت و محدودیت منابع است. هر فعالیت پروژه دارای چندین حالت اجرایی است که هر حالت مدت زمان و مقدار منابع خاص خود را دارد. برای حل این مسئله به صورت دقیق با استفاده از مدل های ریاضی تلاش های زیادی انجام گرفته است که با افزایش تعداد فعالیت ها و منابع این الگوریتم ها موثر نیستند. در سال های اخیر الگوریتم های فرامکاشفه ای زیادی برای حل این مسئله پیشنهاد شده است. در این پایان نامه دو روش بر اساس الگوریتم زنبورها ارائه شده است که عبارتند از: الگوریتم زنبورعسل (ba) و الگوریتم کلونی زنبورهای مصنوعی(abc). الگوریتم های فوق از رفتارهای هوشمند زنبورهای عسل الهام گرفته شده اند که به طور تکراری اقدام به حل مساله یmrcpsp می کنند. در این رساله علاوه بر منطبق کردن مسئله بر الگوریتم-های ذکر شده، روشی برای تولید جمعیت اولیه و روالی نیز برای تبدیل جواب های نشدنی به جواب های شدنی ارائه شده است. کارائی الگوریتم های ارائه شده با روش های موجود دیگر، مقایسه شده است. نتایج به دست آمده نشان می دهد که الگوریتم زنبورها یک روش موثر برای حل مسئله ی mrcpsp می باشد.

شناسایی بدافزارها با استفاده از الگوریتم های گراف کاوی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر 1391
  علیرضا کاظمی   اشکان سامی

یکی از خطراتی که امروزه امنیت سیستم های کامپیوتری را به صورت بسیار جدی تهدید می کنند، بدافزار ها می باشند. با توجه به اینکه این خطرات خسارات جبران ناپذیری را می توانند به سیستم ها وارد کنند؛ لذا تشخیص و مبارزه با بدافزارها امری بدیهی و مهم تلقی می شود. از آنجایی که بدافزارهای امروزی از روش های مختلف مبهم سازی و روش های چند ریختی و ترا ریختی برای مشکل کردن تشخیص ایستای بدافزارها می کنند، باید به دنبال روشی بود که بتوان به این روش ها تا حد امکان غلبه نمود. در این رساله، برای غلبه بر مشکلات مطرح شده روشی ارائه شده است که بر اساس روش های گراف کاوی اقدام به تشخیص بدافزارها می کند. در این روش ابتدا گراف وابستگی غنی شده با فراخوانی های واسط برنامه نویسی کاربردی از کد اسمبلی برنامه ها می سازیم. سپس اقدام به استخراج گراف های پر تکرار موجود در بین برنامه های مجموعه داده کرده و بر اساس این گراف ها مدلی را برای تشخیص بدافزارها می سازیم. برای ساخت این مدل از فایل های اجرایی 435 برنامه بی خطر و 390 فایل اجرایی بدافزارهای مختلف استفاده کرده ایم. ارزیابی ها نشان می دهد که روش ارائه شده دارای دقت بالایی می باشد، به طوری که دقت تشخیص روش حدود 96% می باشد.

ارائه روشی کارا برای کاهش مصرف توان در محیطهای رایانش ابری با در نظر گرفتن توافق در سطح سرویس
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی کامپیوتر 1391
  محمد صادق مظفری   غلامحسین دستغیبی فرد

رشد سریع تقاضا برای قدرت محاسباتی موجب شده است تا تغییر جهتی به سوی مدل رایانش ابری که بر اساس مراکز داده مجازی شده عظیم بنا شده است، صورت پذیرد. چنین مراکز داده ای طبیعتاً انرژی مصرفی بالایی را طلب می کنند. برای پاسخ به تقاضای مشتریان رایانش ابری و به منظور پشتیبانی از محاسبات سبز، ارائه دهنده های سرویس ابری باید هم انرژی مصرفی را کاهش دهند و هم اینکه پارامترهای مربوط به کیفیت سرویس را در سطح مطلوبی نگه دارند. یکی از روش های کاهش مصرف انرژی، پایش مداوم ماشین های مجازی می باشد. در این رساله، برای کاهش مصرف انرژی در محیط رایانش ابری، دو الگوریتم نوین برای ترکیب آگاه از توافق سطح سرویس ماشین های مجازی ارائه شده است که مبنای کار آن بر اساس شباهت های رفتاری می باشد. نتایج بدست آمده از شبیه ساز cloudsim نشان دهنده بهبود پارامترهای کیفیت سرویس و کاهش مصرف انرژی می باشد.

نگاشت پیاده سازی های موازی برنامه های کاربردی پردازش سیگنال بر روی کارت گرافیک
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر 1391
  امین فصحتی   فرشاد خون جوش

امروزه از کارت های گرافیک (gpus) همچون پردازنده های چند هسته ای، پردازش گرهای سیگنال دیجیتال (dsps) و آرایه های دروازه ای برنامه پذیر درمحل (fpgas) برای تسریع کارایی برنامه های کاربردی پردازش سیگنال استفاده می شود. یکی از برنامه های کاربردی موجود در این زمینه، جداسازی سیگنال های منابع متفاوت از بین مجموعه ای از سیگنال های دریافت شده می باشد. دراین تحقیق رویکرد آنالیز اجزای مستقل و به طور خاص الگوریتم jade به عنوان هسته اصلی این نوع برنامه های کاربردی مورد توجه قرار گرفته است. ویرایشی موازی از این الگوریتم بر روی کارت گرافیک پیاده سازی شده است. برای ارزیابی پیاده سازی موازی خود از چهار نوع داده تست واقعی که شامل سیگنال های نوار قلب و مغز می باشند، استفاده کردیم که در بهترین حالت تسریعی برابر با 33.71 برای 23 کانال ورودی به دست آمده است. همچنین با استفاده از قانون امدال، کران بالای تسریع الگوریتم را که با 38.76 برابر است، محاسبه کردیم. در انتها برای اطمینان از دقت و کارایی پیاده سازی، با روش مونت کارلو پیاده سازی ارائه شده آزمایش گردیده است. نتایج بدست آمده حاکی از دقت و سرعت قابل قبولی برای این پیاده سازی می باشد.

امکان سنجی استفاده از gpu با معماری tesla در کاربردهای تجارت الکترونیکی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده آموزشهای الکترونیکی 1391
  علی خوانساری   احسان ملکیان

هدف اصلی این پژوهش، امکان سنجی و استفاده از توان چندپردازشیgpu در کاربردهای تجارت الکترونیکی برای رسیدن به حداکثر کارآیی و ظرفیت گذردهی است. در این پژوهش به ارائه ی مبانی نظری تحقیق از جمله رایانش موازی، ساختار gpu با معماری تسلا و پلتفرم cuda پرداخته ایم. هم چنین با مرور تحقیقات انجام شده و با توجه به نیازمندی های کاربردهای تجارت الکترونیکی، به شناسایی کاربردهایی با استعداد استفاده از توان چندپردازشی gpu پرداخته ایم. طرح های پیشنهادی این پژوهش شامل تعریف و استفاده از معیاری جدید برای توجیه کارآمدی اقتصادی پیاده سازی برنامه های کاربردی در زمینه ی تجارت الکترونیکی روی gpu و پیاده سازی سیستم رمزنگاری کلید عمومی ntru روی gpu در قالب نام ntruda است، براساس سنجش توسط معیار معرفی شده ی ما، این پیاده سازی روی gpu، 51 برابر صرفه ی اقتصادی بیشتر نسبت به پیاده سازی روی cpu دارد.

کارایی انرژی در مراکز داده توسعه یافته بر مبنای تکنولوژی مجازی سازی زن
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر 1391
  الهه حبیب اللهی نجف آبادی   فرشاد خون جوش

امروزه توان یکی از مسائل مهم در زمینه طراحی ریز پردازنده ها است. از این رو مکانیسم های متعددی برای مدیریت توان پردازنده ها معرفی شده تا در صورت لزوم از آن ها استفاده شود. از جمله این مکانیسم ها می توان به dvfs و حالت های بیکار اشاره کرد. در این پژوهش به ارزیابی مکانیسم های مدیریت توان موجود در پردازنده جدید اینتل به نام core i7 پرداخته شده تا بتوان الگوی مصرفی توان پردازنده را برای زمانبندی کارها به منظور مصرف انرژی بهینه بدست آورد. از طرفی مراکز داده از پر مصرف کننده ترین مراکز محسوب می شوند. مدیریت توان در این مراکز هم باعث کاهش برق مصرفی و در نتیجه کاهش هزینه های این مراکز می شود. امروزه مراکز داده برای مدیریت بهتر منابعشان از تکنولوژی های مجازی سازی استفاده می کنند. با بهره گیری از این تکنولوژی ها مدیریت منابع راحت تر بوده و بهره وری سرویس دهنده ها بهتر خواهد بود. یکی از مکانیسم های مدیریت توان در مراکز داده ترکیب-سازی است. در این پایان نامه به ارزیابی این مکانیسم در کاهش توان مصرفی این مراکز پرداختیم و این نتیجه حاصل شد که هنگامی که سرویس دهنده ها به مدت طولانی در بهره وری پایین قرار می گیرند این مکانیسم در کاهش مصرف انرژی بسیار موثر است. همچنین برای برای بهره گیری از این وضعیت چارچوبی طراحی و پیاده سازی شد و نتایج حاصل با سه سیستم آزمایش شد.

مدیریت منابع، آگاه از انرژی مبتنی بر ناحیه در مراکز داده ابری
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده کامپیوتر و فناوری اطلاعات 1391
  رشید الدین صمدزاده   فرشاد خون جوش

رشد سریع تقاضا برای قدرت محاسباتی موجب شده است تا تغییر جهتی به سوی مدل رایانش ابری که بر اساس مراکز داده مجازی شده عظیم بنا شده است، صورت پذیرد. چنین مراکز داده ای طبیعتاً انرژی مصرفی بالایی را طلب می کنند. برای پاسخ به تقاضای مشتریان رایانش ابری و به منظور پشتیبانی از محاسبات سبز، ارائه دهنده های سرویس ابری باید انرژی مصرفی در این مراکز داده را کاهش دهند. انرژی مصرفی در یک سیستم با میزان بهره وری از منابع آن سیستم رابطه مستقیم دارد. در این رساله با توجه به توان استاتیک پردازند ه ها، یک میزان بهره وری بهینه برای سیستم ها معرفی می گردد و نشان می دهیم در صورتی که سیستم ها با این میزان بهره وری فعالیت کنند، انرژی مصرفی توسط سیستم کمینه می شود. همچنین یک الگوریتم زمان بندی ماشین مجازی را ارائه می دهیم که سعی می کند با توجه به میزان بهره وری بهینه انرژی مصرفی را کمینه کرده و همچنین qos را رعایت کند. نتایج بدست آمده از شبیه ساز cloudsim نشان می دهد که با استفاده از این روش میزان انرژی مصرفی به طور میانگین به میزان 30% کاهش یافته است. همچنین زمان برگشت کار ها در محیط های بلادرنگ را حداکثر به میزان 60% کاهش داد. این تکنیک باعث بهبود نرخ پذیرش کارها حداکثر به میزان 35% در محیط های محاسبات ابری می شود.

بررسی و امکان سنجی استفاده از gpumatدراجرای نرم افزارهای مبتنی بر spmv در gpus
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر 1391
  بنت الهدی نیک نهاد   فرشاد خون جوش

صنعت تراشه در جهت مدیریت بهتر تبادل میان عملکرد، بهره وری انرژی و قابلیت اطمینان به سمت طراحی سیستم چندپردازنده ای حرکت کرد. هر چند گوناگونی تراشه های چند هسته ای سوالات مختلفی را ایجاد می کند، از جمله: با این طراحی های مختلف کدام برنامه های کاربردی برای هر کدام از این محیط ها مناسب است و اینکه چطور نرم افزار برای این محیط ها پیاده سازی شود تا اینکه بهترین استفاده از این منابع به وجود آید. در این پژوهش طراحی و پیاده سازی هسته های محاسباتیspmv روی کارت های گرافیک بررسی شده است. هسته های محاسباتی spmv یک مانع پیشرفت در برنامه های محاسباتی علمی می باشند و یک بدنامی برای عملکرد پردازنده هستند، یعنی کسر اندکی از عملکرد پردازنده استفاده می شود. هسته های محاسباتی spmv شامل یکسری محاسبات ضرب ماتریس های پراکنده (تنک) می باشد که این ماتریس پراکنده دارای تعداد زیادی درایه های صفر است که در جواب ضرب بی تاثیر هستند و نیازی نیست که این عناصر صفر در ماتریس ذخیره شوند. در این پژوهش برای آزمایش پیاده سازی موازی خود از 16 نوع داده تست واقعی استفاده شده است که این داده ها 16 ماتریس هستند که پراکنده یا تنک می باشند. با استفاده از زبان برنامه نویسی gpumat و jacket در محیط matlab به صورت سریال و موازی عملیات ضرب برداری ماتریس های پراکنده بر روی این 16 ماتریس بررسی شده است که در بهترین حالت تسریعی برابر با 42.02 برای ماتریس pwtk (wind tunnel) به دست آمده است.

طراحی و پیاده سازی یک معماری نوین برای چارچوب سلسله مراتبی در مدل برنامه نویسی نگاشت کاهش مبتنی بر فایل سیستم توزیع شده hadoop
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی 1382
  مسعود ابراهیمی   فرشاد خون جوش

مدل برنامه نویسی نگاشت کاهش که توسط گوگل معرفی شده است یکی از موفق ترین تلاش ها در راستای اداره کردن تقاضای فزاینده برای پردازش داده های بزرگ مقیاس است. اگرچه مدل برنامه نویسی مذکور رایانش موازی در خوشه های رایانه ای را بسیار ساده، کارآمد و مقیاس پذیر نموده است اما بستر های رایانش توزیع شده در سالهای اخیر دستخوش تغییرات شگرفی شده اند. امروزه بسیاری از مراکز داده و خوشه های رایانه ای با مولفه های پردازشی نوینی چون پردازنده های چند هسته ای، به ویژه پردازنده های برداری به عنوان شتاب دهنده های محاسباتی تجهیز شده اند. متاسفانه چارچوب های پیاده سازی شده کنونی از مدل برنامه نویسی نگاشت کاهش ناتوان از مهار توان محاسباتی این گره ها در خوشه های رایانه ای هستند. در این پایان نامه به ارائه فلسفه ای جدید در طراحی چارچوب های نگاشت کاهش خواهیم پرداخت که با رایانش موازی سلسله مراتبی موجود در مراکز داده امروزی منطبق باشد. ما به معرفی معماری جدیدی با هدف استفاده کارآمد از انواع مختلف پردازنده های برداری در بستر های رایانش توزیع شده پرداخته ایم. آزمایش ها و ارزیابی ها نشان می دهند که پیاده سازی ارائه شده در این پایان نامه نه تنها با خصوصیات برنامه های مدل نگاشت کاهش انطباق دارد بلکه از لحاظ تسریع کار و افزایش توان عملیاتی نیز بهتر عمل می کند.

ارائه و ارزیابی یک مدل پیش بینی کارایی برای پردازنده های گرافیکی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر 1391
  سیدعلی میرسلیمانی   فرشاد خون جوش

پردازنده های گرافیکی دارای معماری بسیار پیچیده ای می باشند. در نتیجه پیش بینی کارایی یک برنامه بر روی این گونه از پردازنده ها کاری دشوار است. روش های آماری ابزارهای مفید هستند که به معماران کامپیوتر کمک می کنند تا کارایی پردازنده های پیچیده را بررسی کنند. در این تحقیق، از این گونه روش ها به منظور ارائه ی یک مدل پیش بینی کارایی کارامد برای یک پردازنده ی گرافیکی دارای معماری فرمی استفاده شده است. پردازنده ی مورد نظر دارای یک فضای طراحی با حدود 8 میلیون نقطه است. همچنین به منظور تولید مدل یک الگوریتم جستجوی فضای طراحی ارائه شده است، که با بهره بردن از آن می توان یک مدل کارایی با کمترین میزان داده ی شبیه سازی شده تولید کرد. در این رویکرد، ابتدا از طراحی پلاکت و برمن برای یافتن مهم ترین پارامترهای تاثیر گذار بر کارایی پردازنده ی گرافیکی استفاده می شود. سپس با استفاده از یک طراحی فاکتوریل کسری برای پارامتر های انتخاب شده، شبیه سازی های بیشتری صورت می پذیرد. مدل تولید شده از روش فوق قادربه انجام پیش بینی با دقتی بین 1 تا 5 درصد است، که این میزان از دقت تنها با نمونه برداری از 0.0003 تا 0.0015 درصد از فضای طراحی پردازنده ی گرافیکی هدف به دست می آید.

بررسی روش های تکثیر پویای داده ها و ارائه روشی کارا در گرید داده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی کامپیوتر 1391
  مسلم ابراهیمی   غلامحسین دستغیبی فرد

گرید نوعی سیستم نامتمرکز و موازی میباشد که امکان به اشتراک گذاشتن و انتخاب منابع ناهمگون و توزیع شده از نظر جغرافیایی را به صورت پویا فراهم مینماید. گرید دارای انواع مختلفی میباشد که یکی از آنها گرید داده میباشد که با دادهها و منابع ذخیره سازی سروکار دارد. در گرید داده برای کارایی و قابلیت اطمینان ، استفاده از پهنای باند و مقیاسپذیری، از تکنیکی به نام تکرار داده (replication) استفاده می شود، که در این تکنیک یک یا چند تکرار از دادهها در ماشینها و موقعیتهای جغرافیایی مختلف قرار داده می شود. تکرار داده دارای مزایای زیادی میباشد که از این مزایا میتوان به قابلیت اطمینان، در دسترس بودن، تحمل پذیری خطا، استفاده از پهنای باند و مهمتر از همه به کاهش زمان پاسخ دهی اشاره نمود. زمان بندی کارا و موثر در گرید از طریق تخصیص دادن کار به گرهی که بیشترین حجم فایل های درخواستی را دارد باعث کاهش حجم انتقال داده بین گره ها می گردد.در این پایان نامه دو الگوریتم برای تکرار داده و الگوریتمی نیز برای زما بندی ارائه شده است که الگوریتم های پیشنهادی با استفاده از شبیه ساز گرید داده، optorsim، که توسط پروژه گرید داده اروپا توسعه یافته است، پیاده سازی شده است. نتایج آزمایشات نشان داد که استراتژی های تکرار داده و زمان بندی پیشنهادی، بهتر از استراتژی های فعلی عمل می نماید.

بهینه سازی حافظه ی کارت گرافیک در پردازش تصویر دیجیتال
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی کامپیوتر 1393
  پویا معمارضیا   فرشاد خون جوش

به کار گیری قدرت فوق العاده ی پردازنده های گرافیکی یکی از راه های تثبیت شده برای افزایش کارایی نرم افزار ها است. اما استفاده ی کارآمد از پردازنده های گرافیکی یکی از بزرگ ترین چالش هایی است که برنامه نویسان با آن مواجه شده اند. کارایی برنامه های پردازنده ی گرافیکی وابستگی شدیدی با کارایی حافظه دارد، تا جایی که می توان حافظه ی پردازنده ی گرافیکی را یکی از گلوگاه های بحرانی به حساب آورد. با افزایش روزافزون حجم داده ها و نیاز به کاهش زمان پاسخ نرم افزارها، اهمیت کارایی حافظه بارزتر شده است. هدف این پژوهش بررسی عوامل موثر بر کارایی حافظه، و یافتن راه های افزایش کارایی آن می باشد. برای رسیدن به این هدف، موضوع کارایی حافظه از جنبه های مختلف مورد مطالعه قرار می گیرد. این موارد عبارتند از: انتقال داده ی میان پردازنده ی مرکزی و پردازنده ی گرافیکی، اجرای برنامه بر روی پردازنده ی گرافیکی و دسترسی به سلسله مراتب حافظه، تاثیر بستر های برنامه نویسی بر کارایی، و تحلیل آماری کد سطح میانه. در این پژوهش، از الگوریتم های پردازش تصویر دیجیتال به عنوان مطالعه ی موردی استفاده شده است. علت انتخاب حوزه ی پردازش تصویر دیجیتال این است که از لحاظ پیچیدگی الگوهای دسترسی و میزان مصرف حافظه، متنوع می باشند. نتایج به دست آمده نشان می دهند که در آزمایش های انتقال داده، کارایی تا 1/2 برابر افزایش می یابد. نتایج آزمایش های سلسله مراتب حافظه حاکی از افزایش کارایی تا 21 برابر نسبت به پیکربندی پایه، و نیز تا 146 برابر نسبت به پیاده سازی پردازنده ی مرکزی است. نتایج آزمایش های بستر برنامه نویسی نشان دادند که در یک مقایسه ی منصفانه، کارایی بستر های cuda و opencl در انتقال داده کاملا مشابه است، و در اجرای کرنل به طور میانگین اختلاف کارایی این دو بستر کمتر از 10% می باشد. از نتایج تحلیل کد سطح میانه ی ptx برای مقایسه ی بستر ها استفاده می شود، و رابطه ی بین تناسب ptx با کارایی نسبی را ارزیابی می شود. سرانجام، نشان داده می شود که چگونه می توان با استفاده از تحلیل آماری ptx، گلوگاه یک کرنل را شناسایی و برطرف کرد. در مجموع، نتایج یک تصویر کلی از عوامل موثر بر کارایی حافظه را ترسیم می کنند.

طراحی مدار های بخش front-end دستگاه آلتراسوند
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1392
  یاسمن مروج   رضا بوستانی

آلتراسوند یکی از روش های تصویربرداری است که هیج ضرری برای بدن ندارد، بنابرین نسبت به سایر دستگاه های پزشکی از محبوبیت و کاربرد بیشتری برخوردار است. طراحی بورد front-end یکی از چالشهای بزرگ در طراحی دستگاه سونوگرافی است که در آن سیگنالهای مدوله شده از بدن با دامنه بسیار کم باز می گردند که می توانند در رنج فرکانسی 2 تا 12 مگاهرتز کار کنند. تکنولوژی روز سعی در کوچک کردن مدارهای الکترونیکی و کمینه کردن تعداد قطعات آن دارد که نویز بسیار کمی را جذب کنند. هدف از این رساله تجزیه و تحلیل بخش عمده ی front-end دستگاه سونوگرافی می باشد که به وسیله ی نرم افزار های orcad و field-ii-matlab مدار های lna, tgc, swept filter, bandpass filter, detector مورد بررسی قرار می گیرند. نویز و بهره آن ها جهت ارزیابی و مقایسه محاسبه می شوند که در مواردی نیاز به بهبود می باشد.

آنالیز برخط و ارتقاء کیفیت داده های بیماری های واگیر معاونت بهداشت
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - پژوهشکده برق و کامپیوتر 1392
  سعید صلاحی   اشکان سامی

وزارت بهداشت دارای تعداد زیادی مرکز شناسایی بیماری میباشد که در صورت وقوع بیماریهای واگیر اطلاعات بیماران را در یک سامانه اینترنتی وارد میکنند. به منظور ورود اطلاعات در این سامانه هزینه های بسیار بالایی برای سخت افزار و خود سامانه شده است. پس از بررسی های ما مشخص شد که داده ها نه تنها دارای کیفیت پایین هستند ، بلکه تعداد آنها از آمار های تجمعی کمتر است.

مطالعه در خصوص طراحی یک سیستم هوشمند پیش بینی سیلاب با استفاده از تکنیک های یادگیری ماشین در استان هرمزگان
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1392
  حمید توزنده جانی   فرشاد خون جوش

مطالعه امکان طراحی یک سیستم هوشمند پیش بینی و هشدار سیلاب در محدوده رودخانه و سد استقلال میناب خواهد بود