سید مصطفی فخراحمد

ترجمه ماشینی مبتنی بر روش های داده کاوی و ساختارهای استنتاجی

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1391
سید مصطفی فخراحمد محمد هادی صدرالدینی

ترجمه ماشینی یکی از جذاب ترین شاخه ها در زمینه پردازش زبان طبیعی(nlp) است. ترجمه ماشینی(mt) یک فرایند تجزیه و تحلیل خودکار متن در زبان مبدا و تولید متن معادل آن در زبان هدف است. روش های موجود برای ترجمه ماشینی را می توان به دو دسته کلی روش های مبتنی بر قانون و روش های مبتنی بر مجموعه متون تقسیم کرد. روش های مبتنی بر قانون وابسته به زبان بوده و در حل مشکل ابهام معنایی ناتوان هستند، برای حل این مسائل استفاده از روش های مبتنی بر مجموعه متون می تواند چاره ساز باشد. در این تحقیق، سیستم ترجمه جدیدی بنام مترجم برنا را معرفی می کنیم که رویکرد آن ترکیبی از هردو روش مبتنی بر قانون و مبتنی بر مجموعه متون می باشد. بخش مبتنی بر قانون سیستم وابسته به زبان نیست، زیرا قواعد گرامری از زبان به طور خودکار از مجموعه متون موجود استنتاج می شود. ساختار اصلی استفاده شده در سیستم پیشنهادی ساختار آتاماتای متناهی (dfa) است. این اولین بار است که این ساختار در ماشین ترجمه استفاده می شود. مهمترین مزیت این ساختار جداسازی دانش از ماشین ترجمه است. در سیستم برنا، قوانین گرامری استخراجی در قالب ماشین های متناهی تو در تویی ارائه خواهند شد که در ماشین ترجمه بصورت بازگشتی یکدیگر را فراخوانی خواهند کرد. در این تحقیق، همچنین تلاش شده است تا برای یکی از پرچالش ترین مسائل ترجمه ماشینی یعنی رفع ابهام سه راهکار جدید ارائه شود. در راهکار اول که یک روش یادگیری نظارتی است از الگوریتم نزدیک ترین همسایه استفاده می شود. در این روش به منظور بهبود دقت طبقه بند از یک فرآیند انتخاب خصیصه و یک روش وزن دهی جدید استفاده خواهد شد. در راهکار دوم، یک سیستم طبقه بند مبتنی بر قوانین فازی ارائه می شود و به منظور افزایش دقت طبقه بند شیوه ی وزن دهی به قوانین معرفی خواهد گردید. اما راهکار سوم، یک سیستم خبره است که اساس کار آن استنتاج دانش بر مبنای روش زنجیره پیشرو است. پایگاه دانش این سیستم مجموعه ای از قوانین همبستگی بین کلمات مختلف زبان است که طی یک فرایند داده کاوی بدست آمده اند. قابلیت استنتاج موجب می شود که روش پیشنهادی قادر باشد با تکیه بر برخی از کلمات موجود معنای سایر کلمات مبهم را تشخیص دهد حتی اگر این کلمات قبلا در مجموعه متون آموزشی هرگز با هم رخ نداده اند.

First 15 pages

ارائه مدلی جهت تطبیق دوستی در شبکه های اجتماعی، بر مبنای پروفایل کاربران

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده آموزشهای الکترونیکی 1392
سارا مظهری سید مصطفی فخراحمد

امروزه شبکه های اجتماعی به بستر ارتباطی مهمی تبدیل شده اند و طیف گسترده ای از برنامه های کاربردی برای آن ها در نظر گرفته شده است. یکی از روابط اساسی در بین اعضای شبکه اجتماعی دوستی است. تطبیق دوستی یک راه مناسب برای پیشنهاد افراد به عنوان دوست می باشد. مدل ارائه شده در این پایان نامه، بر مبنای شباهت بین کاربران بر اساس اطلاعاتی است که در پروفایل خود بیان نموده اند. در مرحله اول طرح پیشنهادی، به استخراج و کشف درجه نفوذ عوامل اصلی شکل گیری دوستی بر اساس پروفایل های یک شبکه اجتماعی پرداخته شد. در مرحله بعدی با توجه به نتایج به دست آمده، سیستم تطبیق و پیشنهاد دوستی ارائه گردید. نتایج به دست آمده بیان کننده این مطلب است که مدل پیشنهادی، به طور قابل توجهی بهتر از همتایان خود عمل کرد.

First 15 pages

شناسایی مشخصه های مناسب موجود در متن جهت رفع ابهام معنایی

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1392
مهسا حضرتی فرد سید مصطفی فخراحمد

به جرأت می توان ادعا کرد که عصر حاضر، عصر انفجار اطلاعات است و شاید بتوان زبان را بعنوان مهمترین سد و مانع در انتقال اطلاعات دانست. بنابراین ضرورت بکارگیری ماشین در پردازش و ترجمه ی متون تبدیل به نیازی غیر قابل انکار شده است. اما مشکلاتی که برسر راه مترجم های ماشینی وجود دارد مانع شده تا این مهم از کیفیت و دقت کافی برخوردار باشد. لذا تحقیق در مورد این مشکلات و بیان راهکارهای احتمالی جهت حل آن ها در خور اهمیت خواهد بود. یکی از تأثیرگذارترین مسائل در دقت و کیفیت ترجمه ی ماشینی، رفع ابهام معنایی است که دقت در آن باعث بالا رفتن دقت کل عمل ترجمه می گردد. منظور از رفع ابهام معنایی انتخاب معنای مناسب کلمه با توجه به متن، برای کلماتی است که دارای چندین معنای متفاوت هستند. لذا در این پژوهش سعی شده است تا به بررسی روش های مختلف و ایده های متفاوت ارائه شده توسط سایرین در زمینه ی ابهام زدایی پرداخته و با ارائه ی شیوه ای متفاوت در این راستا قدمی برداریم. روش ارائه شده در این پایان نامه، روشی مبتنی بر دیدگاه دانش محور است که با بهره گیری از اطلاعات تکمیلی پیرامون کلمه ی مبهم در متن و ارائه ی یک روش امتیازدهی، به رفع ابهام می پردازد. به این منظور از یک طرف با بکارگیری وردنت و منابع دیگری که به نوعی مکمل وردنت هستند، فهرستی از کلمات مرتبط با کلمه ی مبهم تهیه کرده و از طرف دیگر کلمات همراه با کلمه ی مبهم در متن را از پیکره ی مورد نظر استخراج می کنیم. سپس با استفاده از یک رابطه ی امتیازدهی، معنایی که دارای بیشترین امتیاز است و مرتبط تر به نظر می رسد را انتخاب می کنیم. در نهایت، دقت روش ارائه شده را بررسی کرده و نتایج را با دقت سایر روش ها مقایسه می کنیم.

بررسی کاربرد تکنیک های داده کاوی بر روی داده های پزشکی- مطالعه موردی داده های مربوط به آزمایشگاه درمانگاه مطهری شیراز

thesis وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - مرکز آموزش الکترونیکی 1392
راضیه میدانشاهی محمد هادی صدرالدینی

داده کاوی پیش گویانه یک ابزار ضروری برای محققان و پزشکان بالینی تلقی می شود. درک مسائل مهم نهفته در این متدها و برنامه های کاربردی که مورد توافق قرار گرفته و استاندارد شده اند برای گسترش روند آن ها اجباری و منتشرکننده نتایج حاصل است. امروزه پزشکان با بهره گیری از فناوری های نوین اطلاعاتی می توانند از داده کاوی پیش گویانه بهره گرفته و در مسائل روزانه خود با هدف تسریع و کاهش هزینه های خدمات درمانی آن را مورد استفاده قرار دهند. بخش علوم آزمایشگاهی نیر از این مساله مستثنی نبوده و در سراسر دنیا پیوند علوم پزشکی و فناوری اطلاعات توانسته است پیشرفت شگرفی در این زمینه داشته و به موفقیت های چشم گیری نائل آید. در این تحقیق با بهره گیری از این پیشرفت ها گامی نوین در استفاده از متدهای داده کاوی در حوزه پزشکی برداشته شده و بذل توجه خود را به قسمتی معطوف کرده که کمتر مورد توجه محققان قرار گرفته است. کشف و استخراج دانش از داده های پزشکی مربوط به گروه های هورمون شناسی، خون شناسی، ایمنی و شیمی بالینی حوزه ای است که می تواند نتایج نوینی در اختیار متخصصان علوم آزمایشگاهی و پزشکان پاتولوژی قرار دهد. لذا نتایج حاصل از این پژوهش را می توان در زمینه بهبود، تسریع خدمات و کاهش هزینه های درمانی بکار برد.

نام پژوهشگر: سید مصطفی فخراحمد