نام پژوهشگر: محمدرضا کیوانپور
هاجر همایونی محمدرضا کیوانپور
استفاده از وب یکی از مهمترین، اجتناب ناپذیرترین و در عین حال اقتصادی ترین روش ها برای اطلاع رسانی، تجارت و آموزش می باشد. همزمان با توسعه وب، تولید نرم افزارهای کاربردی تحت وب نسبت به نرم افزارهای کاربردی تحت ویندوز اهمیت بیشتری پیدا کرده است. با توجه به گسترش روز افزون کاربرد این نرم افزارها، بررسی کیفیت این نرم افزارها مسئله ای مهم و اساسی تلقی می شود. یکی از روش های موثر برای سنجش کیفیت نرم افزار، آزمون نظام مند نرم افزار است. این آزمون که در طول چرخه حیات نرم افزار به صورت مکرر انجام می-شود، عملیاتی پر هزینه است. تولید موارد آزمون گامی مهم برای آزمون نرم افزار محسوب می شود. مجموعه این موارد آزمون باید قادر به شبیه سازی کامل و درست اطلاعات ورودی و شرایط کاری واقعی نرم افزار باشد. بر این اساس تولید موارد آزمون با توجه به ضرورت و جامعیت و درستی این موارد، فرآیندی پیچیده و پرهزینه است. یکی از موثرترین رویکردها برای کاهش هزینه تولید موارد آزمون، خودکارسازی این عملیات است. با وجود تحقیقات زیادی که در زمینه تولید خودکار موارد آزمون نرم افزارهای کاربردی تحت وب صورت پذیرفته، این مسئله کماکان دارای چالش هایی می باشد. مهم ترین چالش موجود در این زمینه، عدم ارائه مدل توصیفی کامل از نرم افزار کاربردی تحت وب جهت تولید موارد آزمون توسط رویکردهای موجود می باشد. مدل های ارائه شده تا کنون قادر به بیان کلیه رفتارهای نرم افزار نیستند. از این رو از طریق آن ها نمی توان موارد آزمون کارا با قابلیت پوشش بالای نرم افزار را تولید نمود. در این تحقیق از یک روش یادگیری نوین مبتنی بر شبکه های عصبی فازی جهت استخراج مدل رفتاری کامل به شکل مجموعه ای از قواعد فازی از نسل جدید نرم افزارهای تحت وب استفاده شده است. از این مدل جهت تولید موارد آزمون کارا با پوشش بالای نرم افزار استفاده شده است. مجموعه موارد آزمون تولید شده از طریق روش پیشنهادی حاصل از ترکیب الگوریتم های ژنتیک و خنک سازی تدریجی بهینه سازی می شوند. مجموعه موارد آزمون تولید شده بر روی دو نرم افزار کاربردی تحت وب 2 استاندارد با عنوان های tudulist و blindtextgenerator مورد ارزیابی قرار گرفته و با دو روش استاندارد atusa و us+cr مقایسه می شوند. ارزیابی های صورت پذیرفته میزان کارایی 90%، سطح خودکارسازی 97% و میزان پوشش کد 80% را برای روش پیشنهادی نشان می دهد. این نتایج در مجموع نشان دهنده عملکرد بهتر روش پیشنهادی نسبت به دو روش مورد بررسی با وجود تعداد موارد آزمون کمتر می باشد. کلمات کلیدی: تولید خودکار موارد آزمون، نرم افزارهای تحت وب، شبکه عصبی فازی خودکار مبتنی بر جمعیت
الهه اصغری محمدرضا کیوانپور
به واسطه قالب نیمه ساختیافته و خاصیت خود توصیف بودن، xml به ابزاری مناسب جهت بازنمایی و تبادل داده روی وب تبدیل گشته و امکان مدل کردن انواع مختلفی از داده ها را فراهم کرده است. با توجه به گسترش روزافزون استفاده از اسناد xml روی وب و اهمیت سازماندهی این اسناد، مطالعه و بررسی این موضوع و ایجاد بهبود روش های خوشه بندی اسناد xml جهت استفاده موثرتر از آنها ضروری می نماید. یکی از مهمترین چالش های موجود در این زمینه، کاوش حجم عظیمی از اسناد ناهمگن xml با در نظر گرفتن معنای ساختاری در کنار ساختار و محتوای اسناد می باشد. استخراج ویژگی های مهم، مدل کردن و ترکیب ساختار و محتوای اسناد با در نظر گرفتن معنای ساختاری درون اسناد به منظور کاوش سریع و خوشه بندی کارآمد روی مجموعه اسناد xml ناهمگن در زمانی قابل قبول، به عنوان هدف اصلی این پژوهش تلقی می شود. اساس خوشه بندی اسناد xml بر مبنای استفاده از معیاری است که تعیین کننده میزان شباهت بین اسناد می باشد که این شباهت می تواند از جنبه ساختار، محتوا، مفهوم و یا ترکیبی از هر یک از آنها باشد. سپس با اعمال الگوریتم های خوشه بندی متداول و یا بهبود یافته آنها، گروه بندی اسناد صورت می گیرد. در این تحقیق در راستای رفع چالش های مطرح شده روشی جهت استخراج ویژگی های ساختاری مبتنی بر مفهوم فرکانس مسیر-واژه و با در نظر داشتن معنای نهان در ساختار اسناد، به همراه ضرایبی جهت وزن دهی این ویژگی ها ارائه شده است. سپس دو روش مجزا جهت خوشه بندی اسناد xml ارائه شده است. در روش اول یک الگوریتم خوشه بندی نیمه نظارتی مبتنی بر شبکه عصبی som پیشنهاد گشته و در روش دوم که روشی فاقد نظارت است با تعریف معیار شباهت مبتنی بر برچسب ها و یال ها، الگوریتم های islb و eislb جهت خوشه بندی اسناد ارائه گردید. روش های پیشنهادی به صورت مجزا با استفاده از دو مجموعه داده ی acm sigmod و niagara مورد ارزیابی و با روش های متفاوت فاقد نظارت اعمال شده روی همین مجموعه داده ها مورد مقایسه قرار گرفته است. نتایج بدست آمده از آزمون ها حاکی از آن است که روش اول روشی مناسب در روش های نیمه نظارتی محسوب می شود ضمن اینکه روش دوم علاوه بر اینکه نسبت به روش اول نتایج بهتری بدست آورده نسبت به روش های موجود نیز عملکرد بهتری بدست آورده است.
رکسانا رمضانی محمدرضا کیوانپور
امروزه کاربردهای بسیار متفاوت و متنوعی از طریق اینترنت ارائه می شوند که هر کدام نیازهای ترافیکی منحصر بفردی دارند. به عنوان مثال کاربردهای چند رسانه ای نیاز به تضمین کیفیت سرویس دارند، در حالیکه کاربرهایی که از پروتکل های tcp استفاده می کنند با استفاده از مکانیزم های شناسایی و پیشگیری از ازدحام، کمترین میزان منابع به آن ها اختصاص می یابد. بنابراین لزوم مدیریت و شناسایی کاربردهای موجود در شبکه امری ضروری محسوب می شود. با توجه به حجم کاربردهای موجود در فضای اینترنت استفاده از روش های هوشمند برای انجام این امر مهم اجتناب ناپذیر می باشد. یکی از این روش ها که روز به روز بر محبوبیت آن افزوده می شود روش های مبتنی بر الگوریتم های کلاس بندی می باشند. این روش ها برای کلاسبندی ترافیک شبکه از ویژگی های مختلف مستخرج از جریان های شبکه استفاده می کنند. در راستای این تحقیقات، محققان صدها ویژگی مختلف برای جریان های شبکه ارائه داده اند. با ارائه این ویژگی ها روند کار پژوهشگران تغییر یافت. حالا سوال اصلی تحقیقات شبکه ای به شکل دیگری مطرح می شود: آیا همه ویژگی های ارائه شده برای کلاس بندی لازم هستند؟ آیا زمان صرف شده برای کلاس بندی با توجه به محدودیت های منابع و نیازهای بلادرنگ شبکه با استفاده از این ویژگی ها، قابل قبول است؟ با توجه به آمارهای گرفته شده و نتایج کار پژوهشگران جواب این سوالات منفی هستند و به این نتیجه می رسیم که باید یک مجموعه ویژگی بهینه برای اینکار پیدا کرد. این مجموعه باید طوری انتخاب شود که بین دقت کلاس بندی و منابع (زمان) محاسباتی موجود توازن برقرار کند. مسأله مهم دیگر در این زمینه نمونه برداری می باشد. قبل از انتخاب مجموعه ویژگی بهینه برای الگوریتم یادگیری، انتخاب نمونه های (جریان های ) آموزشی برای ساخت مدل کلاس بندی و همچنین نمونه هایی برای آزمودن مدل ساخته شده اهمیت فراوانی دارد. این جریان ها باید طوری انتخاب شوند که به بهترین شکل، نماینده کل جریان های شبکه باشند. جریان های شبکه از توزیع احتمالی خاصی در ارسال بسته ها پیروی می کنند. نمونه ها باید طوری انتخاب شوند که این توزیع ها را بتوانند حفظ کنند. ماشین بردار پشتیبان یکی از محبوبترین الگوریتم های یادگیری ماشین می باشد ولی به دلیل پیچیدگی و زمان محاسباتی زیاد آن در کلاس بندی ترافیک شبکه محبولیت کمتری داشته است. این تحقیق نشان داده شده است که با استفاده از روش های نمونه برداری و انتخاب ویژگی مناسب، می توان از مزایای این کلاسبند قدرتمند استفاده کرد. با استفاده از ترکیب روش های ارائه شده، ترافیک شبکه با دقت 97% کلاس بندی شده است. دقت جزیی کلاس بندی برای انواع کاربردها نیز به مراتب بهتر از روش های قبلی می باشد.