نام پژوهشگر: حسین صامتی
وفا بارخدا بهرام ظهیر اعظمی
رویه تبدیل متن به گفتار از دو بخش اصلی سطح بالا (تحلیل متن) و سطح پایین (تولید گفتار) تشکیل شده است. در قسمت سطح بالا، متن ورودی به شکلی درمی آید که در مرحله دوم قابل استفاده باشد. تا به حال روش های گوناگونی برای تولید گفتار در قسمت سطح پایین به کار رفته است که در این میان سه روش تولیدی، مبتنی بر فرمنت و اتصالی بیشترین کاربرد را داشته اند. روش مبتنی بر فرمنت بر اساس اختلاف فرمنت ها در اصوات مختلف کار کرده و در طی دهه های گذشته بیشترین استفاده را داشته است. با این وجود در سال های اخیر روش اتصالی که بر اساس اتصال واحدهای از پیش ضبط شده کار می کند، محبوبیت بیشتری یافته اند. به لحاظ نظری، دقیق ترین و کامل ترین روش برای تولید گفتار، روش تولیدی است که بر اساس مدل کردن دستگاه تولید گفتار انسان کار می کند. با این وجود به لحاظ عملی این روش هنوز دارای پیچیدگی های زیادی بوده و بنابراین زیاد مورد استفاده قرار نگرفته است. در طول دهه های اخیر و همزمان با توسعه روش های تبدیل متن به گفتار، این سیستم ها در حوزه های بیشتری کاربرد پیدا کرده اند. گفتار مصنوعی می تواند به منظور خواندن پست های الکترونیکی، کاربرد در ابزارهای چندرسانه ای و به طور خلاصه برای تعامل بین انسان و ماشین به کار رود. علاوه بر این موارد، ارزیابی کیفیت گفتار تولید شده هم یکی دیگر از پارامترهای بسیار مهم است که البته به سادگی قابل دستیابی نیست. به همین منظور بازه گسترده ای از روش های ارزیابی به وجود آمده اند که هر کدام برخی از جنبه های گفتار را مورد بررسی قرار می دهند. امروزه برای بسیاری از زبان های دنیا، سیستم های تبدیل متن به گفتار با کیفیت های مختلف به وجود آمده است. در این پایان نامه، ما سه سیستم مختلف تبدیل متن به گفتار را برای زبان کردی و بر اساس واحدهای واج گونه، هجا و دایفون طراحی و پیاده سازی کرده ایم. در هر سه این سیستم ها از روش اتصالی برای تولید گفتار استفاده شده است. شرح مختصری از هر کدام از این سیستم ها و واحدهایشان به همراه ویژگی های خاص زبان کردی بیان شده است. همچنین نحوه تولید اطلاعات نوایی و راهکارهایی برای افزایش میزان طبیعی بودن گفتار تولید شده ارائه شده است. در نهایت هم چالش های موجود و کارهایی که در آینده می تواند در راستای تکمیل این پایان نامه انجام گیرد مورد بررسی قرار گرفته اند.
سمیه بخشایی نوشین ریاحی
این پایان نامه تلاشی است در جهت بررسی رویکرد جدید شاخه ترجمه ماشینی که از روش های آماری برای ساخت یک مترجم خودکار استفاده می کند. در فصل تجربیات ، ابتدا سیستم مترجم ماشینی آماری که برای جفت زبان فارسی-انگلیسی راه اندازی شده بهمراه خروجی این سیستم نشان داده شده است و پارامترهای آن مورد مطالعه قرار گرفته است. در ادامه به عنوان مطالعات جانبی اولین سیستم ترجمه آماری فارسی-آلمانی طراحی شده است. در این بخش ایده زبان پل به عنوان روشی برای ساخت مترجم آماری برای زبان هایی که پیکره موازی مستقیم ندارند تشریح شده و نتایج موفقیت آمیز آن در آزمایشات نیز نشان داده شده است. همچنین سعی شده با اعمال ایده هایی در مرحله پیش پردازش خروجی ترجمه بهبود داده شود. این تغییرات در راستای تسهیل ترجمه بین دو زبان با هدف افزایش کیفیت آن است. در انتها خروجی سیستم مترجم آماری تحلیل شده و خطاهای چنین سیستم هایی برای بهبودهای آتی مورد بررسی قرار گرفته است. خروجی این پایان نامه ابتدا یک پیکره دو زبانه موازی فارسی-انگلیسی است که در طی یک طرح تحقیقاتی مصوب دانشگاه الزهرا ساخته شده است. این پیکره با استفاده از ریشه یاب دانشگاه شهید بهشتی ریشه یابی شده است که برای مطالعات آتی به عنوان پیکره جانبی قابل استفاده است. همچنین یک پیکره طلایی حاصل تلاش های انجام شده در این پایان نامه است. پیکره طلایی پیکره ای است که علاوه بر هم ترازی در سطح جملات، کلمات نیز هم تراز شده اند. این پیکره دستی هم تراز شده، در یک کارگروه یکروزه و با استفاده از قضاوت انسانی ساخته شده است. در انتها نیز نتیجه گیری کلی از تجربیات این تحقیق عنوان شده و مسیر آتی تحقیقات نیز ترسیم شده است.
سید سعید صرفجو روح الله دیانت
موضوع این پایاننامه بررسی مسأله بازیابی اطلاعات در متن حاصل از بازشناسی گفتار میباشد. یک ورودی مسأله، تعدادی سند متنی که از بازشناسی گفتار به دست آمدهاند میباشد. ورودی دوم نیز یک کوئری است. هدف این است که کوئری را در اسناد جستجو نموده و اسناد مرتبط را پیدا کنیم. مشکلی که در اینجا وجود دارد این است که متن حاصل از بازشناسی گفتار، همواره دارای درصد خطایی در بازشناسی است که موجب میشود کلمات دچار خطا شده، معادل با کوئری در نظر گرفته نشوند و در نتیجه سند، مرتبط تشخیص داده نشود. در این پایاننامه یک روش بازیابی اطلاعات مقاوم نسبت به خطای بازشناسی گفتار ارائه شده است. ایده کلی این است که برای هر کلمه مهم موجود در سند، تعدادی کلمه مشابه در نظر بگیریم. به این ترتیب به ازای هر سند، تعدادی سند جایگزین به دست میآید. با توجه به تعداد زیاد اسناد جایگزین، در مرحله بعد، موثرترین اسناد جایگزین انتخاب میگردند. این اسناد جایگزین به اسناد فعلی اضافه گردیده و در نهایت الگوریتم بازیابی روی مجموعه جدید اسناد اعمال میگردند. برای هر یک از مراحل یافتن کلمات مهم، یافتن کلمات مشابه و به دست آوردن موثرترین اسناد، الگوریتمهای کارایی پیشنهاد شده است. نتایج پیادهسازی، نشاندهنده کارایی مناسبتر روش ارائه شده نسبت به روشهای بازیابی اطلاعات معمولی است. به طور خلاصه میتوان گفت در این پایاننامه، پیشپردازشی ارائه شده است که انجام آن قبل از اعمال الگوریتم بازیابی اطلاعات، موجب کارایی مناسبتر آن در حوزه بازیابی متون حاصل از بازشناسی گفتار میشود.
فاطمه کاوه یزدی سید ابوالفضل شاهزاده فاضلی
سیستم های محاوره به عنوان یکی از ابزارهای کلیدی در تعامل انسان و ماشین در دهه های اخیر مورد توجّه قرار گرفته و شاخه بزرگی از پردازش های زبانی را بوجود آورده اند. سیستم های محاوره به نوبه خود از زیرسیستم هایی تشکیل شده اند که هر یک بابی را در تحقیق های زبانی گشوده اند و از آن جمله می توان به پردازش های زبانی درک گفتار محاوره اشاره کرد. این پایان نامه تلاش ها در جهت ترکیب مدل های زبانی برای درک زبان گفتار فارسی آغاز نموده و در قالب آن به بررسی روش های پردازشی برای کاربرد درک با استفاده از داده های لایه های معنا و پایین تر صورت داده است. نتایج پژوهش های اجرا شده منجر به طراحی دو الگوی ترکیبی از مدل های زبانی شده است. مدل اوّل در این طرح براساس یک بستر کاری ترکیبی از بازشناسی و درک گفتار توسعه یافته و با دریافت لیستی از بهترین فرضیات بازشناسی گفتار، آنها را بهبود بخشیده و به عنوان ورودی واحد درک گفتار به کار گرفته است. این مدل با استفاده از یک الگوی سه جزئی ترکیب شده با مدل n-gram توانسته علاوه بر فراهم سازی انعطاف ناشی از بکارگیری الگوی معنایی سه جزئی از مزایای جهت دهی جستجوی مدل آماری نیز استفاده نماید. مدل دومی که در این پایان نامه به عنوان یک مدل جدید پیشنهاد شده است، یک الگوی سلسله مراتبی اولویت دار است، که از یک ابرساختار مبتنی بر ماشین متناهی الحالت برای کشف قاب ها استفاده نموده و از لایه هایی بعدی آن نیز برای تعیین شکاف های قاب مورد نظر بهره برده است. ارزیابی واحد درک طراحی شده در دو فاز و با جزئیات مندرج در فصل پنجم به انجام رسیده و برتری مدل دوم را بر مدل اوّل اثبات نموده است.