نام پژوهشگر: محمدرضا فیضی درخشی
پدرام صالحپور محمدرضا فیضی درخشی
در این پایان نامه خلاصه سازی استخراجی متون زبان فارسی مورد توجه قرار گرفته است. با توجه به شیوه های معمول امتیازدهی برای خلاصه سازی، در این پایان نامه سعی بر این است که شیوه lsa را که کمتر در زبان فارسی به آن پرداخته شده است، به کار گرفته شود و نتایج به دست آمده آن ارزیابی گردد. در شیوه lsa با استفاده از ماتریس تکرار واژه ها متن سعی بر این است که ساختارهای مخفی در متن شناخته شود. آزمایش های انجام شده با استفاده از متون پیکره همشهری انجام شدند. این متون شامل ?? متن خبری از روزنامه همشهری بوده است و هر یک از آنها به طور متوسط بیش از ?? جمله داشته اند. این متون در ژانرهای اجتماعی سیاسی و ادبی قرار گرفته بودند. به عنوان ارزیابی میزان عملکرد الگوریتم خلاصه های تولیدی نسبت به خلاصه های دستی تولید شده به وسیله انسان بررسی شدند. در ادامه بهبودهایی برای الگوریتم lsa ارایه و مورد ارزیابی قرار گرفتند. این بهبودها در امتیاز استفاده شده پایه در الگوریتم lsa بوده است. بهبودهای پیشنهادی در این پایان نامه شامل امتیاز لغوی با برقراری ارتباط میان کلمات هم معنی، امتیاز گرامری با در نظر گرفتن طول جملات به عنوان امتیاز تقویت کننده هر جمله و ترکیب امتیاز mmr برای هر جمله در ماتریس تکرار عبارات است که به ترتیب دو تغییر اولی موجب بهبود عملکرد الگوریتم lsa به طور متوسط بیش از ?? و امتیاز mmr آن را در حدود ??.?? تقویت نمود. در ادامه عملکرد الگوریتم در برابر عدم تعیین صحیح مرزها مورد ارزیابی قرار داده شد. خلاصه سازی چند سنده نیز در این پایان نامه مورد بررسی قرار گرفت و عملکرد الگوریتم lsa پایه و الگوریتم lsa بهبودیافته با تمام تغییرات مورد ارزیابی قرار گرفت که عملکرد الگوریتم lsa بهبود یافته با در نظر گرفتن تمام تغییرات بیش از ?? بهتر از الگوریتم lsa پایه بوده است. در ادامه تاثیر جملات تکراری در خلاصه چند سنده مورد ارزیابی قرار گرفت و میزان تاثیر آن به نمایش گذاشته شده است.
مرتضی دولتی محمدرضا فیضی درخشی
طبقه بندی اسنادltrfootnote{text classification, text categorization} عبارت است از نسبت دادن یک سند به یک یا چند موضوع از پیش تعیین شده. در سال های اخیر تولید اسناد متنی دیجیتال با یک رشد نمایی مواجه بوده است، به همین دلیل لزوم طبقه بندی صحیح آن ها برای دسترسی بهتر امری ضروری به نظر می رسد. کاربرد طبقه بندی اسناد می توان بسیار متنوع باشد، طبقه بندی صفحات وب، متون علمی، اخبار، رایانامه، کتاب و ... جستجو برای یک عبارت در google اکنون به چیزی فراتر از یک واقعیت تبدیل شده است. در آینده? نزدیک با پیشرفت روش های طبقه بندی اسناد، نحوه? دسترسی مردم به اطلاعات به نحوی شگرفی تغییر خواهد کرد. طبقه بندی اسناد شامل یک مدل یادگیرنده برای مجموعه ای از کلاس ها و بکار بردن آن ها برای اسناد جدید و انتساب یک کلاس به آن ها می باشد. این امر اکثراً یک کار آموزشی به همراه یک مربی می باشد. به این صورت که یک مجموعه? آموزشی اولیه که شامل تعداد سند و موضوعات از پیش تعیین شده می باشد، به عنوان ورودی به سیستم داده می شود. سپس سیستم برای شناسایی موضوع سایر اسناد آموزش داده می شود. این مراحل شامل پیش پردازش (نمایش سند، کاهش ابعاد و استخراج ویژگی ها) و مراحل آموزش و آزمایش می باشد. عموماً مرحله? پیش پردازش شامل ??? زمان و تلا ش های محاسباتی می شود. با توجه به اینکه روش های مبتنی بر هسته قابلیت های زیادی از خود نشان داده اند، توسعه? یک روش مبتنی بر رویکرد هسته برای زبان فارسی مد نظر قرار داده شد. طبقه بندی متون زبان فارسی به دلیل پیچیدگی ها و مشکلاتی که دارد (اکثر این مشکلات متوجه زبان فارسی نبوده و از آگاهی کم افراد ناشی می شود)، کاری دشوار می باشد. برای انجام طبقه بندی یک سری پیش نیازهایی وجود دارد (همانند سایر زبان ها)، مثلاً وجود یک فهرست از کلمات ایست (همانند فهرست های متنوعی که برای زبان انگلیسی وجود دارد)، وجود یک روش استاندار و قابل قبول برای ریشه یابی (همانطور که زبان انگلیسی وجود دارد). متأسفانه علی رغم اینکه کارهای تحقیقاتی زیادی در این حوزه صورت گرفته است، ولی به دلیل منسجم نبودن کارها و عدم حمایت از سوی یک نهاد واحد، تلاش ها آن طور که شایسه و بایسته است به ثمر ننشسته است و این مسأله انجام کارهایی را که مراحل ذکر شده به عنوان سنگ بنای آن می باشد، دشوارتر نموده است. نگارنده علی رغم پیگیری ها و تماس های مکرری که با فرهنگستان زبان و ادب فارسی داشته است، موفق به جلب نظر آن ها برای همکاری در این پروژه نشده است. حتی اجازه? دسترسی به نتایج تحقیقات گذشته نیز به راحتی مقدور و میسر نبوده است. با توجه به همه? مشکلاتی که برشمرده شد، در نهایت یک روش مبتنی بر هسته برای طبقه بندی متون دیجیتال فارسی توسعه داده شد. متأسفانه به دلیل نبود یک روش و مجموعه? استاندارد (همانند نمونه هایی که برای زبان انگلیسی وجود دارد)، امکان مقایسه? این روش با سایر روش های موجود برای زبان فارسی به صورت کامل محیا نشد. البته تا جایی که مقدور بوده است، از روش های استاندارد ارزیابی استفاده شده است. انجام آزمایش ها با استفاده از متون انتخابی از اخبار خبرگزاری جمهوری اسلامی انجام پذیرفته است (البته آموزش های سیستم نیز با استفاده از بخشی از این اسناد انجام گرفته است).
علی مرادی ورتونی لیلی محمدخانلی
مسئله زمانبندی پروژه، یک زمانبندی را برای تخصیص منابع تعیین می کند تا مدت تکمیل پروژه و یا هزینه کلی پروژه را بهینه سازد. یکی از مسائل زمانبندی پروژه، مسئله زمانبندی پروژه چند حالته با منابع محدود است، به طوری که چندین حالت اجرایی برای هر فعالیتی از پروژه در دسترس می باشد. در طی این سال ها، روش های زمانبندی پروژه به طور پیوسته، برای مدل سازی مسائل عملی مناسب، توسعه یافته اند. در این پایان نامه، علاوه بر مطالعه مفاهیم مسائل زمانبندی و بررسی برخی از این روش ها، روشی را برای مسئله زمانبندی پروژه چند حالته با منابع محدود و با مدت فعالیت های فازی پیشنهاد کرده ایم. فرضیات روش پیشنهادی، مسئله تک پروژه ای با یک هدف واحد و زمانبندی غیرقطعی می باشد. همچنین فعالیت ها می توانند در تعداد نامحدودی از حالت های اجرایی، پردازش شوند. برای این منظور، یک الگوریتم هوشمند ترکیب شده از مجموعه های فازی و الگوریتم ژنتیک طراحی شده تا یک مدل فازی برای حل کردن مسئله زمانبندی پروژه ی مورد نظر ارائه گردد. نتایج شبیه سازی از پیاده سازی این الگوریتم بیانگر کاهش مدت تکمیل پروژه در مثال پیشنهادی می باشد.
سید علیرضا محمدی محمدرضا فیضی درخشی
در این پایاننامه الگوریتمهای تکاملی چند هدفه و روشهای مورد استفاده برای ایجاد همگرایی و گوناگونی در مجموعه جوابهای یافت شده مورد بررسی قرار گرفته است. پیدا کردن این روشها یکی از چالشهای موجود در حوزه بهینهسازی چندهدفه میباشد. هدف اصلی در این کار طراحی روشهایی برای کاستن از نقایص روشهای معمول و تولید جوابهایی با همگرایی و گوناگونی بیشتر است. بزرگترین چالشهایی که در طراحی این الگوریتمها با آن مواجه میشویم کم کردن فاصله جواب پیدا شده با مجموعه بهینه پَرِتو و بیشتر کردن گوناگونی و تنوع جوابهای یافت شده میباشد. هر کدام از الگوریتمها سعی دارند با روش خاص خود بر این چالشها غلبگی یابند. در این پایاننامه سعی شده است با استفاده از تخمین چگالی در بایگانی و استفاده از چگالی محاسبه شده در انتخاب قربانی و رهبر توده زنبورها جوابهای مناسبی به دست آید. در این پایاننامه دو الگوریتم جدید a-moabc و moabc-mf ارائه شده است. الگوریتم a-moabc سعی دارد با استفاده از ادغام دو روش فاصله ازدحام و روش پنجرهگذاری چالشهای مورد اشاره را برطرف نماید. نتایج حاصله نشان میدهد که این الگوریتم نتایج بسیار خوبی را ارائه داده است. الگوریتم moabc-mf نیز با ارائه یک روش جدید مبتنی بر تابع کوه سعی در محاسبه چگالی در اطراف عناصر بایگانی دارد. این روش با توجه به خصوصیاتی که دارد، قابلیت استفاده در الگوریتمها دیگر را دارد. این الگوریتمها به دلیل استفاده از تکنیکهای جدید توانستند گوناگونی و همگرایی بسیار خوبی را در مجموعه جوابهای به دست آمده ایجاد کنند. روشهای جدید معرفی شده در این پایاننامه نتایج بسیار مناسبی را از خود نشان دادند و جبهه پَرِتو مناسب با گوناگونی خوبی را تولید کردند. این الگوریتمها با تعداد زیادی از الگوریتمهای جدید تکاملی چندهدفه مقایسه شدند و توانستند در مسائل با محدودیت و همچنین بدون محدودیت رتبههای بالایی را از آن خود کنند. با توجه به این نتایج الگوریتمهای ارائه شده توانستند مشکلات و چالشهای ذکر شده را تا حدود زیادی بهبود بخشند.
مجید رمضانی محمدرضا فیضی درخشی
با توجه به گسترش روزافزون اطلاعات در دسترس از طریق اینترنت، لزوم استفاده از روش های خلاصه سازی خودکار متن، بیش از پیش احساس می شود. روش هایی که با استخراج مهمترین مطالب موجود در اسناد مانع از مطالعه کامل حجم انبوه از آنها شوند. خلاصه سازی عبارت است از فشرده سازی متن (متون) منبع و تولید یک نسخه کوتاه تر از آن به نحوی که محتوای اطلاعاتی آن حفظ شود. اغلب سیستم های خلاصه ساز با استفاده از روش های سطحی و معیارهای آماری به استخراج مهمترین بخش های متن منبع پرداخته و خلاصه نهایی را شکل می دهند. هدف این پژوهش استفاده از یک روش مبتنی بر پایگاه دانش در فرآیند خلاصه سازی است. در این راستا از پایگاه دانش هستی شناسی فارس نت به منظور دستیابی به مفاهیم موجود در متون و تولید خلاصه آنها استفاده خواهد شد. هستی شناسی یکی از مباحث مربوط به علم فلسفه است که یک ساختار سلسله مراتبی از همه موجودیت های عالم هستی به همراه روابط حاکم بر آنها فراهم می کند. در این پژوهش ابتدا با نگاشت متن مورد خلاصه سازی با پایگاه دانش هستی شناسی، گرافی تحت عنوان گراف موضوعی شکل می گیرد که حامل شمای مفهومی متن منبع است. سپس با استفاده از معیارهای مختلف تعیین اهمیت گرافی، اهمیت نسبی هر یک از گره های گراف ارزیابی می شود. سرانجام از این مقادیر به منظور تعیین اهمیت جملات مختلف موجود در متن منبع و ساخت خلاصه نهایی استفاده خواهد شد. نتایج حاصل از ارزیابی خلاصه های تولید شده، حاکی از برتری روش پیشنهاد شده در این پژوهش نسبت به سیستم های خلاصه ساز موجود است.
رامین نوری زاده حمید خسروی
با رشد اطلاعات و افزایش سایت های اینترنتی، لازم است که متن ها را برای پردازش موثر خلاصه کنیم. به همین جهت در چند سال اخیر سیستم هایی برای خلاصه سازی متن پیشنهاد شده اند تا با کمک آنها، اطلاعات مهم و اصلی متن را استخراج نموده و در اختیار کاربر قرار دهند. در این تحقیق از رویکرد محاسبات نرم استفاده شد و خلاصه سازی متن را به عنوان مساله بهینه سازی معرفی کرده و از الگوریتم ژنتیک خودتطبیق مبتنی بر استنتاج فازی برای حل آن استفاده کردیم. این روش خلاصه سازی، جملات مهم را از متن استخراج نموده و در عین حال افزونگی را کاهش داده و میزان ارتباط خلاصه به متن ورودی را افزایش می دهد. این سیستم پیشنهادی با سایر سیستم های خلاصه سازی متن که جمله ها را رتبه بندی می کنند متفاوت است زیرا در این سیستم خلاصه ها رتبه بندی می شوند. برای ارزیابی سیستم پیشنهادی، خلاصه های بدست آمده از الگوریتم پیشنهادی با خلاصه های تهیه شده به وسیله انسان مقایسه شد. آزمایش هایی بر روی 20 متن اخباری انجام گرفت و نتایج نشان داد که خلاصه های روش ارایه شده به خلاصه های تولید شده توسط انسان نزدیک است. روش پیشنهادی با روش رویکرد انسان شناختی مقایسه شد و نسبت به آن از نتایج بهتری برخوردار بود.
منیژه قایمی دیزجی محمدرضا فیضی درخشی
دادهکاوی یکی از مراحل کشف دانش است و دانش حاصل از دادهکاوی در زمینههای گوناگون از جمله تجارت و پزشکی مورد استفاده قرار میگیرد. امروزه با پیشرفت علم و دانش، اطلاعات ذخیره شده در مورد موجودیتها در پایگاهدادهها نیز در حال افزایش است. مطالعات نشان دادهاند که بیشتر مواقع همهی اطلاعات در مورد موجودیتها نه تنها برای دادهکاوی مفید نیستند، بلکه مشکلاتی را برای دادهکاوی ایجاد میکنند. بنابراین سعی میشود با استفاده از فرایند انتخاب مولفه، مولفههای مفید و مربوط برای یادگیری انتخاب شده و مولفههای زاید و نامربوط کنار گذاشته شوند. ولی همیشه کنار گذاشتن قطعی برخی مولفهها قبل از دادهکاوی مطلوب نیست. در این مواقع سعی میشود اهمیت مولفهها برای دادهکاوی مشخص شود که این روند توسط الگوریتمهای وزندهی مولفه صورت میگیرد. انتخاب و وزندهی مولفه از جمله مسائل غیر چندجملهای سخت هستند که اخیراً استفاده از الگوریتمهای تکاملی برای حل این مسائل نتایج قابل قبولی را نشان داده است. طبیعت همواره مورد الهام بسیاری از افراد بوده است؛ بهطوریکه افراد مختلف سعی کردهاند با استفاده از روندهای موجود در طبیعت به حل مشکلات موجود بپردازند. از جمله الگوریتمهای تکاملی مبتنی بر طبیعت میتوان به الگوریتم ژنتیک و مورچهها اشاره کرد. در این راستا در این پایاننامه با توجه دقیق به روند موجود در جنگل، الگوریتم تکاملی جدیدی به نام الگوریتم جنگل ارائه شده است. به منظور بررسی کارایی الگوریتم پیشنهادی جنگل، 3 تابع آزمون در حالت 5 و 10 بعدی مورد بررسی قرار گرفته است. نتایج بدست آمده نشان دهندهی برتری قاطع الگوریتم جنگل از نظر زمان و تعداد نسل رسیدن به جواب نزدیک به بهینه نسبت به الگوریتم ژنتیک است. در این پایاننامه مسالهی وزندهی مولفه با استفاده از الگوریتم پیشنهادی جنگل حل شده است. نتایج آزمایشها بر روی مجموعه دادههایی با اندازههای مختلف نشان دادند که الگوریتم جنگل میتواند کارایی الگوریتم یادگیری نزدیکترین همسایگی را با استفاده از وزندهی مولفه، در 4 مجموعه داده از 7 مجموعه دادهی انتخابی به خوبی بهبود ببخشد. به منظور بررسی بیشتر کارایی الگوریتم جنگل، مسالهی انتخاب مولفه نیز با استفاده از الگوریتم جنگل حل شده است. نتایج آزمایشها بر روی 6 مجموعه داده نشان دادند که الگوریتم جنگل میتواند کارایی الگوریتم نزدیکترین همسایگی را در 4 مجموعه داده به خوبی بهبود ببخشد. در 2 مجموعه دادهای که الگوریتم جنگل نتوانسته است بهتر از روشهای موجود عمل کند، دارای رتبهی دو است.
سعید حیدرزاده جزی محمدرضا فیضی درخشی
در سامانه های امنیتی برای ساخت کلیدهای رمزنگاری متفاوت برای کاربران مختلف، عموماً از گذرواژه ای که کاربر انتخاب می کند، استفاده می شود. امّا معمولاً گذرواژه های کاربران ضعیف، کوتاه و قابل حدس هستند؛ از این رو کلید حاصله از چنین گذرواژه هایی نیز چندان قدرتمند نخواهد بود. از سوی دیگر امکان دارد این گذرواژه ها فراموش شوند و یا لو بروند. روش دیگر برای ساخت کلیدهای رمزنگاری مختلف تولید گذرواژه هایی طویل و قوی به روش های خودکار می باشد؛ امّا کاربران نمی توانند چنین گذرواژه هایی را به یاد بسپارند و یادداشت کردن نیز مخاطرات امنیتی دارد. یکی از راه های پیشنهادی برای حلّ این مسئله این است که کلیدی قدرتمند را به روش های رمزنگارانه تولید کرد و آن را به صفت بیومتریکی از کاربر مقیّد ساخت. در این حالت کاربر تنها در حالتی می تواند به کلید دسترسی داشته باشد که صفت بیومتریک مورد استفاده بتواند کلید را از قید ایجاد شده برهاند. در این پایان نامه برای انقیاد کلید رمزنگاری به بیومتریک عنبیّه، سامانه ای بر مبنای طرح امانت فازی پیشنهاد شده است. این سامانه به گونه ای طراحی شده است که برای بیومتریک عنبیّه ی نویزی نیز مناسب باشد. نویز موجود در عنبیّه از منابع متعددّی از قبیل تکان خوردن سر، مسدود شدن با پلک ها و مژگان، بازتاب آینه وار ایجاد می شود. برای مقابله با هر یک از این اختلالات راهکاری پیشنهاد شده تا دقّت و کارایی قابل قبول به دست آید. با آزمایش سامانه ی پیشنهادی روی دادگان عنبیّه ی نویزی casia نه تنها به کلیدهای 260 بیتی دست یافته بلکه دقّت و محرمانگی بیومتریک هم حفظ شده است. سامانه توانسته میزان پذیرش نادرست کاربران را به صفر برساند و برای هر نام نویسی به طور میانگین به 4033 بیت پایا دست یابد که افزایش محسوسی نسبت به کارهای پیشین دارد. میزان شکست در نام نویسی نیز به 93/1% کاهش یافته است.
ابراهیم رزمی کندری محمدرضا فیضی درخشی
با افزایش اسناد الکترونیکی و رشد سریع شبکه جهانی وب از یک طرف و اهمیت در دسترس بودن اسناد از سویی دیگر، نیاز به دستهبندی اسناد وجود دارد. کار دستهبندی اسناد به منظور سازماندهی دادهها و دانش و همچنین توسعه تشخیص و تفکیک اسناد متنی صورت میگیرد. برای دستهبندی اسناد به گروههای مشخص شده باید از یک معیار سنجش شباهت یا فاصله بین اسناد استفاده شود. در این پایاننامه ابتدا تحقیق و مطالعهای روی مراحل دستهبندی انجام شد. مهمترین مراحل مورد نیاز دستهبندی، جداسازی کلمهها، محاسبه tf-idf، انتخاب اسناد اولیه دستهها، انتخاب معیار ارزیابی شباهت بین اسناد و در نهایت دستهبندی است. سپس بر روی آزمایش و ارزیابی معیارهای ارزیابی شباهت یا فاصله مورد استفاده در کار دستهبندی اسناد تمرکز شد. پر کاربردترین معیارهای شباهتیاب در مسئله دستهبندی اسناد متنی، فاصله اقلیدسی، شباهت کسینوسی، ضریب جاکارد، ضریب همبستگی پیرسون و میانگین واگرایی کولبک-لیبلر هستند. در این پایاننامه برای انجام آزمایشها از مجموعه آموزشی همشهری به عنوان پایگاه داده استفاده شده است. این مجموعه دارای 12 دسته است که تعداد اسناد موجود در هر دسته از 3758 تا 30924 سند متغیر است. برای ارزیابی دقت دستهبندی از معیارهای ارزیابی خلوص و آنتروپی استفاده میشود. در آزمایشهای انجام شده به بررسی تأثیر تعداد اسناد و دستهها در دقت دستهبندی پرداخته شد. پس از انجام این آزمایشها مشخص شد که افزایش تعداد اسناد و دستهها بر روی دقت دستهبندی به ترتیب تأثیر مثبت و منفی دارد. سپس آزمایشهایی برای ارزیابی و مقایسه معیارهای شباهتیاب صورت گرفت. در طی این آزمایشها مشخص شد که معیارهای همبستگی پیرسون و واگرایی کولبک-لیبلر به ترتیب بهترین و بدترین معیار هستند. پس از مشخص شدن دو معیار شباهتیاب برتر همبستگی پیرسون و جاکارد، دو معیار جدید با ترکیب این دو معیار، با ضرایب مختلف ارائه شد اما باعث افزایش دقت دستهبندی نسبت به معیار همبستگی پیرسون نشدند. سپس دو معیار جدید دیگر هر کدام با تغییر معیارهای همبستگی پیرسون و جاکارد پیشنهاد شدند. دقت دستهبندی با استفاده از معیار تغییریافته جاکارد دارای کارآیی کافی نبود. اما دقت دستهبندی با استفاده از معیار تغییریافته پیرسون افزایش یافت.
مریم میرزایی محمدعلی بادامچی زاده
در این پایان نامه به تجزیه و تحلیل اطلاعات نادقیق، رفتارشناسی سیستم و بررسی گرافهای فازی پرداخته شده است. اطلاعات نادقیق را میتوان بهصورت کارآمد، تحلیل و روابط فازی را با به کارگیری تئوری گراف فازی بررسی کرد. ازگرافهای فازی میتوان در تجزیه و تحلیل اطلاعات نادرست ازقبیل توالی دستور/شناخت، ساختار جامعهسنجی و نظرسنجی استفاده کرد. سنجش افکار اجتماعی یکی از روشهای اندازهگیری و ارزیابی ساختار اجتماعی است که بهطور موثر میتوان با استفاده از نظریه گرافهای فازی تجزیه و تحلیل کرد. یکی از راهکارهای توسعه گرافهای فازی برای تجزیه و تحلیل ساختارهای اجتماعی، پیشبینی اطلاعات ناموجود میباشد.برای این منظور در طی این پایان نامه پرسشنامه ایطراحی گردید و از دانش آموزان دو دبیرستان شهر یزد خواسته شد تا فرمهایمذکور را تکمیل نمایند. در این پرسشنامه، افراد باید برای همگروهی به فرد مورد علاقه خود رای دهند.سپس برای شناخت افراد از مفاهیم فرد محبوب و فرد منزوی استفاده شد.در این پایاننامه سعی شده است تا با استفاده از گرافهای فازی، راهکاری جهت پیشبینی پاسخهای دانشآموزان براساس فرمهای قبلی ارائه شود. در نهایت نتایج بهدست آمده با نتایج واقعی مقایسه میگردد که در این مقایسه هرچقدر میزان اختلافات بیشتر باشد نشاندهنده این است که افراد محبوب از هوش هیجانی و هوش اجتماعی بالاتری برخوردارند و هرچقدر این میزان اختلاف کمتر باشد نشاندهنده این است که افراد محبوب دارای دوستان زیادی میباشند.
کمال دوگوهر محمدرضا فیضی درخشی
امروزه با پیشرفت ارتباط ها، مراکز تحصیلی سعی می نمایند برنامه زمان بندی درسی را برای افراد در حال تحصیل ارائه نمایند که این افراد به کمک آنها بتوانند حضور مفیدتری در این مراکز داشته باشند. موضوع جدول زمانبندی دروس دانشگاهی در سالهای دور به صورت دستی انجام می شد که با مشکلات فراوان و تداخل در ساعات اساتید و دانشجویان مواجه می گردید. اما هم اکنون، این موضوع با استفاده از الگوریتم های تکاملی و الگوریتم های دیگری پیاده سازی شده و نتایج قابل قبولی در برداشته است. اگرچه هنوز هم مشکلاتی در این جدول موجود است که از جمل? این مشکلات باید به محدودیت های آن اشاره کرد. این پایاننامه ابتدا تحقیق و مطالعهای بر روی جداول زمان بندی دروس دانشگاهی انجام می دهد. مهمترین مولفه های مورد نیاز برای ساخت یک جدول زمان¬بندی دانشگاهی را اساتید، ¬دانشجویان و دروس تشکیل داده اند و اساسی ترین مسئله در زمان بندی دانشگاهی نداشتن تداخل در بازه های زمانی موجودیت های استاد و دانشجو است که برای این منظور محدودیت هایی در نظر گرفته می شوند. این محدودیت ها به دو نوع سخت و نرم تقسیم می شوند که در این پایان نامه سعی شده با استفاده از الگوریتم رقابت استعماری و ترکیب آن با جستجوی محلی، ارضاء محدودیت های سخت به حداکثر و نقض محدودیت های نرم به حداقل برسد. در این پژوهش، برای انجام آزمایشها از مجموعه آزمایشی به عنوان پایگاه داده استفاده شده است. این مجموعه شامل 10 استاد و دانشجویان 5 مقطع متفاوت و 19 درس است که این تعداد قابل گسترش نیز می باشد. در گام دیگر این پایان نامه، برای ارتقاء عملکرد الگوریتم رقابت استعماری از الگوریتم جستجوی محلی استفاده شده و به بررسی تأثیر ترکیب جستجوی محلی بر روی الگوریتم رقابت استعماری پرداخته شده است. حالتهایی که امکان دارد در ترکیب این دو الگوریتم رخ دهند شامل مواردی مانند استفاده از جستجوی محلی درحین اجرای الگوریتم رقابت استعماری یا بعد از اجرای الگوریتم رقابت استعماری، استفاده از جستجوی محلی تنها برای کشورهای استعمارگر یا کشورهای مستعمره و انجام جستجوی محلی قبل یا بعد از عملگر جذب در الگوریتم رقابت استعماری می باشد. به طور یقین استفاده از همه حالتها کارایی الگوریتم را از لحاظ برازندگی پاسخ نهایی یافته شده، افزایش میدهد. اما هنگامی که علاوه بر رسیدن به یک پاسخ بهتر، زمان اجرای الگوریتم نیز مهم باشد، باید حالات بهینه استفاده از الگوریتم جستجوی محلی را انتخاب نمود. مکان بهینه استفاده از الگوریتم جستجوی محلی بعد از اجرای الگوریتم رقابت استعماری است و اگر قرار بر این باشد که حین اجرای الگوریتم از الگوریتم جستجوی محلی استفاده شود، بهتر است جستجوی محلی بر روی کشورهای استعمارگر صورت گیرد. همچنین، جستجوی محلی بر روی کشورهای استعمارگر و مستعمره اگر قبل از عمل جذب انجام شود بهتر از جستجوی محلی بعد از عمل جذب می باشد.
زهرا کریمی محمدرضا فیضی درخشی
مسئله ی زمان بندی دروس دانشگاه یک مسئله¬ی بهینه سازی ترکیبی از دسته مسائل np- hard می باشد که هدف اصلی این مسئله، یافتن یک رهیافت برای تخصیص کلیه ی رویدادها به برش های زمانی و اتاق های ثابت می¬باشد، که البته باید همه ی محدودیت های سخت و نرم ذکر شده در مسئله برآورده شود. تعداد زیادی از روش های متنوع در حال حاضر برای حل این مسئله پیشنهاد شده اند. همچنین مطالعات زیادی از الگوریتم های تکاملی برای حل مسئله ی زمان بندی دروس دانشگاه استفاده کرده اند. هدف از این پایان¬نامه، ارائه¬ی راهکاری جدید برای حل مسئله ی زمان بندی دروس دانشگاه که تاکنون برای بهینه سازی این مسئله بکار گرفته نشده است، می باشد. در این راستا پس از بررسی روش های متعدد هوشمندانه در جهت حل مسئله ی ایجاد یک جدول زمان بندی دروس دانشگاهی، از الگوریتم جدید رقابت استعماری، به علت مزایایی که نسبت به دیگر روش های الهام گرفته شده از طبیعت دارد، از جمله سرعت همگرایی بالا، هوشمندانه تر بودن روش و توانایی بهینه سازی توابعی با تعداد متغیرهای خیلی زیاد، برای حل این مسئله استفاده کردیم. در راستای حل این مسئله این الگوریتم را بهبود دادیم، برای این منظور در ابتدای هر نسل از الگوریتم، قبل از عملگر جذب ابتدا استعمارگرها را به کمک الگوریتم جستجوی محلی بهبود دادیم. این ترکیب باعث بهبود کیفیت راه حل بدست آمده به نسبت الگوریتم رقابت استعماری به تنهایی شد. در این پژوهش، یک مسئله ی نمونه توسط الگوریتم رقابت استعماری با در نظر گرفتن پارامترهایی از جمله استفاده از الگوریتم جستجوی تابو درون عملگر جذب به منظور جلوگیری از نقض محدودیت های سخت، استفاده از ضریب تغییر 5/0در این عملگر و احتمال عمگر انقلاب 4/0 بر روی جمعیت 400 تایی و با تعداد نسل 400 تایی بر روی دو مجموعه داده ی کوچک و بزرگ با در نظر گرفتن محدودیت های نرم بیشتر و تابع برازندگی پیشنهادی پیاده سازی شد. مجموعه داده کوچک شامل داده های واقعی یک نیم سال تحصیلی از دانشکده ی برق و کامپیوتر دانشگاه تبریز با 52 رویداد برای برنامه ریزی شدن در 10 کلاس و 50 شکاف زمانی تک ساعته می باشد. مجموعه داده بزرگ نیز شامل داده های یک آموزشکده فنی با 112 رویداد برای برنامه ریزی شدن در 8 کلاس درسی و 50 شکاف زمانی تک ساعته می باشد. نتایج بدست آمده از این الگوریتم با چهار الگوریتم ga معمولی، ga ترکیبی، pso معمولی و pso ترکیبی مقایسه شد. نتایج بدست آمده نشان داد که الگوریتم رقابت استعماری با زمان محاسباتی کم تر، سریعتر از دیگر الگوریتم ها عمل می کند و جداول زمانی با کیفیت بهتری را از نظر میزان نقض محدویت های نرم مسئله، در مقایسه با الگوریتم ga معمولی و pso معمولی ارائه می کند. اما الگوریتم رقابت استعماری ترکیبی پیشنهادی در مقایسه با الگوریتم های ga معمولی، pso معمولی و ترکیبی و حتی الگوریتم ica معمولی، از نظر میزان نقض محدودیت های نرم مسئله توانست جدول زمانی با کیفیت بهتری ارائه دهد.
فرهنگ فیروزی محمدرضا فیضی درخشی
در پردازش زبان طبیعی سعی بر این است که کامپیوتر توانایی استخراج معنی از منابع زبان طبیعی را داشته باشد. به دلیل پیچیدگی پردازش زبان طبیعی و برای سادگی برخورد با چالش های پیش روی آن از ابزارهای مختلف و تخصصی برای مواجهه با هر یک از مشکلات استفاده شود. برچسب گذار نحوی اجزای کلام یکی از ابزارهایی است که می تواند به فرایند پردازش زبان طبیعی کمک کند. وظیفه برچسب گذار مشخص کردن نقش دستوری کلمات در جملاتی است که به عنوان ورودی به کامپیوتر داده می شود. این ابزار پایه ای می تواند در مترجم های ماشینی، غلط یاب ها، خلاصه سازهای متون و سایر موارد استفاده شود. در این پایان نامه ابتدا به معرفی روش های تعیین نقش دستوری برای زبان فارسی می پردازیم. برچسب گذاری به صورت عمده به دو گونه مبتنی بر قانون و آماری تقسیم می شود. در این پایان نامه به بررسی روش های تعیین نقش دستوری در زبان فارسی می پردازیم. با توجه به مشکلات برچسب گذاری مبتنی بر قانون عمده پیاده سازی های انجام شده در زبان فارسی، با استفاده از روش های آماری بوده اند. روش های آماری مدل مارکوف، مبتنی بر حافظه و تخمین احتمال بیشینه پرکاربردترین روش های آماری برای زبان فارسی هستند که سعی شده با انعکاس نتایج، مقایسه ای را بین آن ها انجام دهیم. در پایان نتایج بررسی ها نشان می دهد الگوریتم مدل مارکوف بیشترین اقبال را چه ازنظر تعداد استفاده چه ازنظر درصد موفقیت برای زبان فارسی دارا است. نکته قابل توجه در کارهای پیشین تمرکز بیشتر آن ها بر روی تعیین نقش دستوری کلمات ناشناخته است. برای این کار روش¬های پیش¬پردازش متن، تحلیل¬گر ساخت¬واژی و حدس برچسب کلمات ناشناخته مورد استفاده قرار گرفته بود. دراین بین کمتر اثری را می توان یافت که ضمن ارائه الگوریتمی جدید به موفقیت قابل توجه دست پیداکرده باشد. ما برای ارائه الگوریتم جدید، مدل مخفی مارکوف را با توجه به بررسی کارهای گذشته به عنوان مبنای کار خود قراردادیم. سپس با ارائه روش های مختلف تلاش کردیم درنتیجه به دست آمده توسط این روش بهبود حاصل کنیم. یکی از رو¬ش¬ها بررسی انتقال های پرتکرار و انتقال ها با درصد خطای بالا برای وضع قوانین بهبود دهنده برای آن¬ها است. تغییر نسبت وزنی فاکتورهای اصلی مدل مارکوف به دنبال یافتن نسبت بهینه بین این فاکتورها روش دیگر مورد استفاده بود، که نشان داد نسبت یک¬به¬یک بهترین انتخاب است. بررسی تأثیر نقش کلمات بعدی به جای کلمات قبلی، بر روی تعیین نقش دستوری کلمات انجام گرفت، چرا که تأثیر برچسب¬های قبل و بعد بر روی تعیین نقش دستوری کلمات برای هر زبان قابل توجه است. نتیجه به دست آمده 96.89 درصد است. برچسب¬گذاری دو مرحله¬ای با استفاده از دسته¬بندی اولیه برچسب¬ها روشی است که می¬تواند کیفیت نتیجه را بهبود دهد هرچند نتیجه کمی آن از 95.91 درصد فراتر نرفت؛ اما نقطه قوت این پایان نامه اضافه کردن فاکتورهایی مانند p(t_(i-1) |t_i ) به مدل مارکوف و پیدا کردن نسبت بهینه بین آن ها با استفاده از روش های جستجوی مختلف ازجمله الگوریتم ژنتیک است. این روش توانست با موفقیت 97.06 درصدی نتیجه¬ای بهتر از روش¬های موجود ارائه دهد.
حامد مرادی محمدرضا فیضی درخشی
شناسایی موجودیت های نامدار در پردازش زبان طبیعی به عملیاتی گفته می شود که طی آن کلی? اسامی خاص موجود در متن و متعلّق به مقوله های معنایی مختلف، شناسایی و استخراج می گردند. در واقع، شناسایی موجودیت های نامدار عملی است که در جهت ساختار بخشیدن به متن صورت می گیرد. شناسایی موجودیت های نامدار، بطور کلی با یکی از روش های مبتنی بر قانون و یا مبتنی بر روش یادگیری ماشینی و یا بصورت ترکیبی از این دو روش صورت می گیرد. در این پژوهش نیز با توجه به اینکه کارهای بسیار کمی در خصوص شناسایی موجودیت های نامدار در زبان فارسی صورت گرفته است، سیستمی پیشنهاد شده است که از هر دو روش مبتنی بر قانون(استفاده از فهرست ها، وندها و الگوها) و مبتنی بر یادگیری ماشین(در اینجا مدل مخفی مارکوف) برای شناسایی موجودیت ها استفاده می کند و در نهایت نتایج حاصل از این دو روش را ترکیب می نماید. با توجه به اینکه موجودیت های پایه ای که از زمان پیدایش این مفهوم مورد توجّه قرار گرفته اند، شامل اسامی اشخاص، مکان ها و سازمان ها می باشند، در سیستم پیشنهادی نیز روی این سه نوع موجودیت تمرکز شده است. البتّه در کنار این موجودیت های پایه ای، می توان به موجودیت هایی مانند زمان ها، تاریخ ها و مقادیر کمّی نیز پرداخت که خارج از حیط? این پژوهش می باشد. براساس ارزیابی هایی که با استفاده از مجموعه ای از داده های تست از نوع متن خبری شامل 32606 نشانه صورت گرفته است، سیستم ارائه شده در روش مبتنی بر قانونِ خود که تأکید اصلی این پژوهش می باشد، قادر خواهد بود موجودیت های نامدار را با دقّت(نسبت موجودیت های صحیح یافت شده بر کل موجودیت های یافت شده) حدود 95% و با فراخوانی(نسبت موجودیت های صحیح یافت شده به کل موجودیت ها) حدود 80% شناسایی نماید. این نتایج می تواند موجب بهبود کارایی در سیستم هایی مانند سیستم های پاسخگویی موتورهای جستجو که از نتایج حاصل از سیستم های شناسایی موجودیت های نامدار استفاده می کنند، بشود. شایان ذکر است که عدم وجود لیست های موجودیتی نسبتاً کامل و دشواری تعیین محدود? موجودیت ها از عوامل اصلی افت کارایی سیستم می باشد.
نفیسه شرقی وند ناصر رضوی
استفاده از انواع ربات ها در دنیای امروزی امری غیر قابل اجتناب می نماید، چنانکه امروزه ربات ها در انجام بسیاری از کارها جایگزین انسان ها شده اند. ربات ها جایگزین مناسبی برای انسان در انجام کارهای تکراری و خطرناک و یا استفاده در محیط های غیر قابل دسترس به وسیله ی انسان هستند. در این میان ساخت ربات هایی که توانایی پیمایش سطوح ناهموار را دارند، همواره از جذابیت خاصی در بین متخصصان علم رباتیک برخوردار بوده است. ربات های چرخ دار علی رغم مصرف سوخت کمتر و سرعت بیشتر نسبت به همتایان پادار خود در سطوح هموار ، قابلیت پیمایش سطوح با ناهمواری بالا و عبور از موانع را ندارند. این در حالیست که ربات های پادار به دلیل برخورداری از ویژگی های سینماتیکی خاص و پایداری بهتر، با قرار دادن کنترل شده ی پاهای خود می توانند در سطوح ناهموار کارامد تر باشند. ربات ها چه یک کاوشگر فضایی بسیار پیچیده و یا یک ربات فوتبایست بسیار ساده باشند، همگی برای داشتن عملکردی موفق، نیاز به الگوریتم های کنترلی پایدار دارند. ربات های واقعی در محیط هایی قرار خواهند گرفت که نیمه مشاهده پذیر، تصادفی، پویا، پیوسته، چند عاملی و ترتیبی هستند. همین مسائل باعث می شوند که استفاده از روش های سنتی مثل برنامه نویسی مستقیم به منظور کنترل ربات ها، جز در موارد معدود مورد استفاده قرار نگیرند. در واقع ما امروزه نیاز به ربات هایی داریم که قادر به یادگیری مهارت های جدید باشند و در مواجهه با موقعیت های جدیدی هم که قبلا با آن ها روبرو نشده اند عملکرد موفقی از خود نشان دهند. رباتی که در این پایان نامه به طور خاص مورد بررسی قرار گرفته است، رباتی چهارپاست که قادر به پیمایش سطوح ناهموار، از جمله سطوحی که ربات قبلا با آن ها مواجه نشده است، باشد. یکی از عمده ترین مسائل مطرح در حرکت ربات های پادار بر روی سطوح ناهموار، انتخاب محل مناسب گام هاست. به عبارتی محل گام های ربات باید به گونه ای انتخاب شوند که خطر لغزش ربات بر روی سطح کمینه و پیشروی به سمت هدف بیشینه شود، منجر به تصادم ربات با محیط اطرافش نشود و همچنین در محدوده ی سینماتیک ربات قرار داشته باشد. ژوهشگران حوزه ی رباتیک از دو دیدگاه مکانیک و کنترل کننده ی ربات سعی در بهبود حرکت ربات های پادار بر روی سطوح ناهموار دارند. گروه اول با توجه به مورد کاربرد ربات، از طراحی مکانیکی متناسب با آن نوع کاربرد استفاده می کنند. برای مثال تعداد پاها، نوع طراحی پاها، ساق ها و بسیاری از موارد دیگر را به گونه ای در نظر می گیرند که ربات قادر به انجام وظایف در نظر گرفته شده برای آن باشد. گروه دوم پژوهشگران که بر روی کنترل کننده ی ربات ها متمرکز شده اند، از راهکارهای مختلفی هم چون cpgها و راهکارهای مبتنی بر یادگیری ماشین و بهینه سازی استفاده نموده اند. هدف از این پایان نامه، ارائه ی راه کاری برای انتخاب مناسب گام های ربات چهارپا بر روی سطوح ناهموار با بهره گیری از روش های یادگیری ماشین و بهینه سازی است، طوری که باعث کاهش تعداد تصادم های ربات با محیط و واژگونی آن شود. برای این منظور، ابتدا الگوهای سطح در دو اندازه ی متفاوت از توضیحات خبره برای انتخاب گام بهینه استخراج می شوند. سپس از یک کلاس بند دودویی خطی برای یادگیری یک زیرمجموعه از کل مجموعه الگوهای سطح استخراج شده از این توضیحات استفاده می شود. این الگوهای یاد گرفته شده به همراه یک مجموعه از ویژگی های دیگر، بردار ویژگی را تشکیل می دهند که از آن برای تقریب تابع ارزش الگوریتم یادگیری تقویتی استفاده می شود. به این ترتیب با به دست آمدن تقریبی از تابع ارزش، محل گام بهینه در هر مرحله قابل محاسبه خواهد بود. در نهایت از سینماتیک معکوس برای قرار دادن گام مورد نظر در محل تعیین شده استفاده می شود. به منظور ارزیابی، شبیه سازی هایی انجام گرفته و عملکرد روش پیشنهادی با دو روش دیگر مورد مقایسه قرار گرفته است. در یکی از این دو روش، از الگوهای سطح و توضیحات خبره به منظور یادگیری یک تابع رتبه بندی گام استفاده شده است. در این روش گامها بر اساس این تابع رتبه بندی یاد گرفته شده انتخاب می شوند. در روش دیگر، تابع ارزش یادگیری تقویتی بر اساس ویژگی های ساده ی خطی تقریب زده می شود و گام های ربات بر اساس این تابع ارزش یادگیری شده و پاداش دریافتی انتخاب می شوند. علت استفاده از این دو روش به منظور مقایسه در واقع به این علت است که روش پیشنهادی این پایان نامه با الهامگیری از این دو روش ارائه شده است. بر اساس نتایج شبیه سازی، روش پیشنهادی نسبت به دو روش دیگر از جهت میانگین تعداد تصادم ها در هر گام و نرخ موفقیت ربات، عملکرد بهتری از خود نشان می دهد.
امیر مسعود بایبوردی سعید پاشا زاده
تحلیل داده¬های املاک و مستغلات اشخاص حقیقی و حقوقی باعث می¬شود که تنوع نوع ملک، توزیع مالکیت املاک، روند رشد املاک با توجه به نوع آنها، نواحی پر رشد شهر، توزیع بناهای جدید و قدیم در نواحی مختلف شهر و بسیاری اطلاعات مفید استخراج شوند. این اطلاعات می¬تواند توسط دولت برای پیش¬بینی درآمد شهرداری¬ها، برنامه¬ریزی برای انشعاب آب، برق و گاز در سطح شهر، تاسیس مراکز درمانی¬، آموزشی و امنیتی و تعیین بودجه سازمان های مختلف مورد استفاده قرار گیرد. با داده¬کاوی داده¬های املاک می¬توان¬ پیش بینی روند تغییر تراکم جمعیت و املاک در مناطق مختلف سطح شهر را انجام داد. تکنیک های مختلف داده کاوی برای انجام تحلیل های فوق قابل استفاده است. در این پایان نامه از اطلاعات پایگاه داده املاک بخش 1 و 2 اداره ثبت اسناد و املاک شهر تبریز استفاده شده است. ابتدا در مرحله پیش پردازش عملیات گسسته سازی، پاک سازی و حذف داده های ناقص و پرت انجام شده است. سپس با استفاده از الگوریتم k-means خوشه بندی های متعددی از ابعاد مطالعاتی مختلف روی این داده ها انجام شده است. پیش بینی رشد آپارتمان ها با استفاده از الگوریتم c4.5 داده کاوی شده است. استخراج قوانین انجمنی با روش apriori در رابطه با املاک انجام شده است. نتایج تحقیق اطلاعات مهمی در رابطه با املاک و مستغلات در اختیار، قرار می دهد.
امیر تبریزچی محمدرضا فیضی درخشی
تعیین موقعیت موبایل با استفاده از سیگنال های دریافتی یکی از نیازهای اساسی در صنعت تلفن همراه به شمار می آید. با توجه به اینکه به کارگیری سیستم های موقعیت یاب gps نیز دارای هزینه و عدم کارایی در مکان های سر بسته می باشد، اپراتورهای تلفن همراه ملزم به ارائه روش هایی برای مکان یابی گوشی تلفن همراه شده اند. با توجه به این مسئله روش های مکان یابی مختلفی از قبیل cell-id و toa، tdoa و ... به صورت تئوریک مطرح شد. در این پایان نامه معادله تخمین فاصله کاربر موبایل از آنتن bts، با استفاده از مدل انتشار امواج cost231 و بعضی از پارامتر های شبکه gsm معرفی شده است.
مهدی رحیمی محمدرضا فیضی درخشی
ترجمه خودکار از یک زبان طبیعی به زبان طبیعی دیگر با استفاده از کامپیوتر را ترجمه ماشینی می نامند. یکی از روشهایی که برای ترجمه از یک زبان به زبان دیگر بکار می رود، روش ترجمه ماشینی آماری است. از مشکلات اساسی در رابطه با ترجمه ماشینی آماری وجود نداشتن پیکره دو زبانه بزرگ است که منجر به دستیابی به خروجی هایی با کیفیت نامطلوب شده است. البته تنها با پیکره های دو زبانه نمی توان تمام ویژگی های زبانی را بدست آورد و نیاز به عملیات زبان-شناسی در ترجمه آماری احساس می شود. فرایند بازسازی ساختاری به معنی تطبیق دادن ترتیب کلمات ترجمه شده به ترتیب کلمات در زبان مقصد است. به عنوان مثال می توان به تفاوت بین ترتیب موصوف-صفت در زبان فارسی و صفت-موصوف در زبان انگلیسی اشاره کرد. در این پایان نامه ابتدا به بررسی و مقایسه روش های بازسازی ساختاری که با هدف بهبود بخشیدن به کیفیت سیستم های ترجمه آماری انجام شده اند، پرداخته شده است. بازسازی های ساختاری که به صورت داخلی در سیستم های ترجمه آماری انجام می شوند محدود هستند و برای جفت زبان هایی که تفاوت های ساختاری زیادی با هم دارند به اندازه کافی مناسب نیستند. بنابراین نیاز به تکنیک های بیشتری در این زمینه احساس می-شود. روش پیشنهاد شده در این پایان نامه که برای جفت زبان های فارسی و انگلیسی طراحی شده است از ویژگی ها و قواعد زبانی استفاده می کند تا خروجی بهتری را در ترجمه از زبان فارسی به انگلیسی نتیجه دهد. در اولین گام در انجام روش پیشنهادی، قسمت فارسی پیکره دو زبانه با استفاده از برچسب گذار اجزای سخن، برچسب گذاری می شود. سپس با استفاده از تجزیه گر وابستگی برای زبان فارسی، روابط وابستگی بین کلمات در جملات قسمت فارسی پیکره نیز مشخص می شوند. برچسب گذارهای موجود برای زبان فارسی دارای دقت بسیار مناسبی هستند و از این نظر در کاهش کیفیت خروجی نهایی سیستم تاثیرگذاری منفی نخواهند داشت اما در مورد تجزیه گرهای زبان فارسی این مورد خیلی صحیح نیست و دقت تجزیه گرها در کیفیت خروجی سیستم تاثیرگذاری بیشتری خواهند داشت و از طرفی گستردگی تجزیه گرهای وابستگی برای زبان فارسی به اندازه برچسب گذارها نیست. بعد از برچسب گذاری و مشخص کردن روابط وابستگی میان کلمات، با توجه به تفاوت های زبان فارسی و انگلیسی، قواعدی استخراج می شوند تا پس از اعمال بر روی جمله های زبان مبدا (در اینجا زبان فارسی) ساختار این جملات را به ساختار زبان مقصد نزدیک تر کنند. قواعد بدست آمده به صورت یک سیستم پیش پردازشی عمل می کند که در نهایت بدون نیاز به ایجاد تغییر در قسمت های اصلی سیستم ترجمه ماشینی پایه، موجب بهبود کیفیت خروجی خواهد شد. بر اساس آزمایش های انجام شده برای بررسی کیفیت خروجی سیستم ترجمه حاصل با استفاده از سیستم های ارزیابی موجود، بهبود قابل قبولی نسبت به سیستم ترجمه ماشینی پایه بدست آمده است. روش انجام گرفته در این پایان نامه منجر به بهبودی در حدود 11/1 درصد در معیار ارزیابی بلو و مقدار 86/1 درصد در معیار f-measure شده است. همچنین در معیار ارزیابی ter کاهش 6/1 درصدی را مشاهده کرده ایم.