نام پژوهشگر: محمد علی نعمت بخش
محمد مهدی کیخا محمد علی نعمت بخش
آنتولوژی به عنوان یک روش برای از بین بردن ناهمگنی اطلاعات ارائه شده است. در یک حوزه ممکن است چندین آنتولوژی که از دیدگاههای متفاوت ایجاد شده اند، وجود داشته باشد که سبب ناهمگنی در یک حوزه خاص می شوند. جهت از بین بردن ناهمگنیها از فرآیند هم تراز سازییا تطابق آنتولوژی ها استفاده می شود. از آنجا که هنگام هم ترازسازی آنتولوژی ها سعی بر رفع همه انواع ناهمگنی های موجود بین دو آنتولوژی ورودی است پس باید روشی اتخاذ گردد تا به کمک آن بتوان نتایج هم ترازسازی انواع روشهای رفع ناهمگنی بین دو آنتولوژی ورودی را کنار هم گردآوری نمود. به مرحله گردآوری نتایج انواع روشهای ناهمگنی، مرحله جمع آوری شباهت ها گویند. در این تحقیق در ابتدا یک سیستم هم ترازسازی آنتولوژی ها با استفاده از سه روش رفع ناهمگنی بین آنتولوژی ها پیاده سازی شده است. این سیستم برای انواع زبان های بیان آنتولوژی ها یعنیowlو rdf قابل استفاده است. در سیستم ارائه شده از سه تطابق یاب استفاده شده است. دو تطابق یاب از ویژگیهای رشته ای اجزای آنتولوژی ها استفاده می نمایند. یکی از این تطابق یاب ها isub است که از فرم رشته ای موجودیت های دو آنتولوژی استفاده می کند و دیگریvdoc است که قبل از آغاز فرآیند محاسبه شباهت بین رشته ها، ابتدا یکسری عملیات پیش پردازش از قبیل حذف حروف اضافه و ربط را انجام می دهد و سپس براساس روش های بازیابی اطلاعات، میزان شباهت دو رشته را محاسبه می نماید. سومین تطابق یاب پیاده سازی شده، gmo است که از ساختار سلسله مراتبی دو آنتولوژی ورودی جهت محاسبه میزان شباهت موجودیت های دو آنتولوژی بهره می گیرد. پس از محاسبه شباهت توسط انواع تطابق یاب های مختلف، در مرحله جمع آوری شباهت های انواع تطابق یاب ها، روشی ارائه شده است که برخلاف سایر روش های موجود، فرآیند جمع آوری شباهت ها را براساس هر دو آنتولوژی و برای هر جفت موجودیت دو آنتولوژی بطور جداگانه انجام می دهد که یک روش تطبیقی و مطلع از ساختار است. ارزیابی کار انجام شده برای بررسی روش جمع آوری شباهت های ارائه شده بوسیله ی آنتولوژی های مسابقه جهانیتطابق آنتولوژی ها یعنیoaei 2009 صورت گرفته است که حاوییک سری آنتولوژی های استاندارد جهت مقایسه انواع سیستم های هم ترازسازی آنتولوژی ها می باشد. مقایسه نتایج سیستم ارائه شده با سیستم های جِرُمی سوئیت و نگاشت توسط جمع مورچه ها، بهبود دقت تشخیص هم ترازی های بین دو آنتولوژی توسط سیستم را نشان می دهد.
امید روزمند محمد علی نعمت بخش
در سال های اخیر، مدل سازی و شبیه سازی بازارهای تجاری و پیش بینی رفتار مشتریان نسبت به یک و یا چند محصول مورد توجه محققین قرار گرفته است. تلاش های زیادی در مدل سازی رفتار مشتری صورت گرفته است که اکثر آنها با تمرکز بر فاکتورهای غیر شناختی تاثیرگذار بر رفتار خریدار مانند کیفیت و قیمت می باشد. مهم ترین چالش مطرح در مدل سازی رفتار مشتری، محاسباتی کردن فاکتورهای انسانی فرهنگ و شخصیت در فرایند تصمیم گیری مشتری می باشد. افزودن این قابلیت به مدل محاسباتی تصمیم گیری مشتری به عنوان گامی مهم در نزدیک شدن به رفتاری مشابه با رفتار مشتری واقعی، از اهمیت بالایی برخوردار است. این مهم کمک شایانی را در توصیف و پیش بینی رفتار مشتری ها با فرهنگ های مختلف و خصوصیات شخصیتی متفاوت خواهد داشت. فن آوری سیستم های چندعاملی به عنوان یک ابزار پرکاربرد در مدل سازی و شبیه سازی سیستم های پیچیده اجتماعی مطرح می باشد. با توجه به اینکه محیط بازار به عنوان یک سیستم پیچیده شناخته می شود، استفاده از سیستم های چندعاملی برای مدل سازی بازار و رفتار خرید مشتری، می تواند مورد استفاده قرار بگیرد. بنابراین در این پایان نامه یک سیستم نرم افزاری چندعاملی برای مدل سازی رفتار مشتری ارائه می شود. هر عامل خریدار نقش یک مشتری واقعی را در این سیستم بازی می کند. مدل ارائه شده برای ذهن عامل خریدار از تئوری های موجود در رفتار خرید، تئوری های نیاز، و مدل های موجود در جامعه شناسی و روان شناسی برای فرهنگ و شخصیت بهره می برد. تمرکز این مدل بر محاسباتی کردن تاثیر فرهنگ و شخصیت بر نحوه درک و شناسایی نیاز توسط عامل خریدار است. همچنین، دیگر مراحل فرایند تصمیم گیری خریدار مانند انتخاب عمل مناسب، و مدل سازی اعتماد و اعتبار کالا در مدل ارائه شده مورد توجه قرار می گیرد. مراحل مختلف تصمیم گیری عامل بر اساس نتایج حاصل از شبیه سازی بررسی می شود. هم چنین ارزیابی رفتار عامل های خریدار بر اساس داده های معتبر واقعی کشورهای مختلف و بر اساس رفتار همه عامل ها در سطح سیستم، قابل قبول بودن مدل پیشنهادی را در تولید نتایج نزدیک به واقعیت، نشان می دهد.
محمد پورزعفرانی محمد علی نعمت بخش
پیوندهای rdf به عنوان یکی از ارکان وب معنایی به شمار می آیند. با استفاده از این پیوندها و به کمک آنتولوژی های موجود، وب کنونی به ساختاری قابل فهم برای ماشین تبدیل می شود. وب حاصله از این تغییر با نام وب داده ها شناخته می شود. یکی از چالش های اساسی در راه توسعه وب داده ها، پیوندهای شکسته شده می باشند. به دلیل ماهیت تغییرپذیر وب، مجموعه داده های موجود در وب داده ها نیز دائماً در حال تغییر می باشند. این تغییرات باعث می شوند پیوندهای موجود در گذر زمان به مکان های نادرست یا ناموجود ارجاع داده شده و به اصطلاح شکسته شده تلقی شوند. پژوهش های انجام گرفته در این زمینه تا کنون بر اصلاح پیوند، توسط مقصد پیوند تاکید داشته اند. این روش ها معایبی از جمله ایجاد نقطه شکسته مرکزی و نقض حق مالکیت مجموعه داده ها را به همراه دارند. در این تحقیق رویکردی برای اصلاح پیوند از طریق مبدأ پیوند ارائه شده است. زمانی که مقصد پیوند دیگر قابل دسترسی نباشد، الگوریتم در همان لحظه اجرا شده و مقصد تغییر یافته را پیدا می نماید. روش پیشنهادی با ایجاد دو مجموعه موجودیت های بالا دست و پایین دست، یک ساختار گرافی انحصاری را با نام گراف هویت برای هر موجودیت تشکیل می دهد. در ادامه از طریق این گراف کاندیداهای مشابه استخراج شده و مناسب ترین گزینه به عنوان خروجی نهایی ارائه می شود. روش پیشنهادی بر روی مجموعه داده های استاندارد، مورد ارزیابی قرار گرفته و با مهم ترین روش های ارائه شده تا کنون مقایسه شده است. نتایج بدست آمده، نشان می دهد که الگوریتم پیشنهادی در مقایسه با روش های دیگر پاسخ قابل قبولی را ارائه داده است.
مژگان عسکریزاده محمد علی نعمت بخش
وب داده های پیوندی به سرعت در حال گسترش می باشد و در حال حاضر شامل داده هایی از صدها مجموعه داده ی متفاوت می باشد. کیفیت داده های این مجموعه داده ها بسیار متغیر است، به طوریکه ممکن است این داده ها قدیمی، ناقص و یا نادرست باشند. از طرف دیگر امکان دارد مجموعه داده ها اطلاعات متناقضی درمورد یک موجودیت واحد در جهان واقعی ارائه کنند. به منظور استفاده ی برنامه های کاربردی داده های پیوندی از این فضای سراسری داده ها، چالش هایی بوجود آمده است. یکی از این چالش ها رفع اختلاف مقادیر داده ای است، در شرایطی که مجموعه داده های مختلف مقادیر متفاوتی برای یک موجودیت یکسان در جهان واقعی در نظر گرفته اند. در این تحقیق الگوریتمی ارائه شده است تا صحیح ترین مقدار از بین مقادیر موجود انتخاب شود تا بدین صورت اختلاف بین مقادیر برطرف شود. الگوریتم ارائه شده از چهار بخش اصلی تشکیل شده است که شامل مراحل فیلترگذاری، تشخیص تکراری ها، بررسی آنتولوژی و بررسی اندازه می باشد. داده ها از یک دامنه دانش و از مجموعه داده های مختلف استخراج می شوند و به عنوان ورودی به الگوریتم داده می شود و در نهایت بهترین مقادیر برای خصوصیات یک موجودیت انتخاب می شود الگوریتم پیشنهادی با استفاده از زبان برنامه نویسی جاوا پیاده سازی و سپس روی مجموعه داده های متعلق به دامنه ی فیلم و مناطق جغرافیایی تست و ارزیابی گردیده است. نتایج بدست آمده در این دو دامنه دانش متفاوت می باشد و به کیفیت داده های منتشر شده وابسته است.
انسیه داوودی جم محمد علی نعمت بخش
وب معنایی شامل قرار دادن داده ها روی وب و ساختن ارتباطات به گونه ای است که انسان و ماشین بتوانند محتوای وب داده را کاوش نمایند. هدف وب معنایی افزایش توانایی ماشین ها در دسترسی به منابع موجود در وب، پردازش و بکارگیری آن ها می باشد. با توجه به رشد گسترده ی داده های پیوندی و افزایش مجموعه داده ها در چند سال اخیر، نیاز به ابزاری برای کشف پیوند در مقیاس وسیع احساس می شود. ابزارهای کنونی برای کشف پیوند مجبور به مقایسه ی تمامی موجودیت ها در مجموعه داده ها هستند. با خوشه بندی موجودیت ها، می توان قبل از ایجاد پیوند و بر اساس نوع پیوند تعداد مقایسه ها بین موجودیت ها را کاهش داد. یکی از مهم ترین اتصالات معنادار در وب داده، شناسایی و اتصال موجودیت هایی است که به یک موجودیت یکسان اشاره می کنند ولی دارای شناسه های یکتای منبع متفاوت هستند و در مجموعه داده های مختلفی قرار دارند. در این تحقیق یک مدل به منظور شناسایی وایجاد خوشه هایی با موجودیت های همانند در وب داده ارائه شده است. مدل ارائه شده قابل بکارگیری روی مجموعه داده ها با دامنه های متفاوت است. این روش می تواند به عنوان یک مولفه در ابزارهای کشف پیوند مانند ابزار silk استفاده شده و سبب بهبود پبچیدگی زمانی وافزایش دقت کشف پیوند شود. مدل پیشنهادی دارای دو ماژول اصلی است: 1. ماژول خوشه بندی ابتدایی 2. ماژول شکستن ماژول خوشه بندی ابتدایی دارای سه فاز اصلی پیش پردازش، توابع شباهت و انتخاب مراکز است. مدل پیشنهادی با تعریف توابع شباهت متفاوت، ویژگی ها با انواع مختلف را در نظر می گیرد. در ماژول شکستن؛ بدترین خوشه شناسایی شده و به عنوان کاندید برای شکسته شدن در نظر گرفته می شود. مراحل کشف بدترین خوشه و شکسته شدن تا رسیدن به تعداد خوشه ی بهینه ادامه پیدا می کند. مدل پیشنهادی با استفاده از زبان برنامه نویس جاوا پیاده سازی شد و با استفاده از دو مجموعه داده linkedmdb و dbpedia به منظور خوشه بندی فیلم های همانند و دو مجموعه داده linkedmdb و linkedgeodata به منظور خوشه بندی شهرهای همانند مورد ارزیابی قرار گرفت. پس از مقایسه نتایج بدست آمده با کارهای قبلی مشابه، مشخص شد مدل پیشنهادی دارای پیچیدگی زمان کمتر، بدون از دست دادن پیوندها و دقت بالاست.
فردین ابدالی محمدی ناصر نعمت بخش
در اینترنتِ آینده که اینترنتِ سرویس ها نام گرفته است، سرویس یک مفهوم پایه است. این مفهوم، به منابعی که می توانند از طریق اینترنت عرضه شوند اطلاق می شود. برای استفاده از سرویسها و پر کردن فاصله بین مصرف کنندگان سرویس با ارائه دهندگان آن، نیاز به سازوکارهایی برای ثبت و جستجوی سرویسها است. تکنولوژی سرویس های وب یک رهیافت کنونی برای اینترنتِ آینده است که سازوکارهای مورد نیاز برای عرضه و استفاده از سرویسها را ارائه داده و توجه بسیاری از محققان را به خود جلب کرده است. در قلب این تکنولوژی، دایرکتوری سرویس قرار دارد که ثبت سرویس و جستجوی آن را میسر کرده است. با این وجود، با افزایش سرویس های وب و تکامل نیاز های کاربران، دایرکتوری های سرویس کنونی برای پاسخ به نیازهای کاربران، محدودیتهایی دارند که از مشکلات ساختاری و خدماتی آنها ناشی شده است و همین موضوع آن ها را برای اینترنت آینده ناکارآمد کرده است. از نظر ساختاری، این ماشین ها گلوگاه سیستم و نقطه خطا می باشند. دلیل این امر زمان بر بودن خدمت کشف سرویس مورد نیاز کاربر است. از نظر پردازش اطلاعات، دایرکتوری های سرویس هیچ دانشی از دادههای ذخیره شده تولید نمیکنند و همین، توان آن ها را محدود کرده است. خدمت ارائه شده به کاربر محدود به جستجوی سرویس است که در آن، دایرکتوری های سرویس تنها لیستی از سرویس های کاندید را برمی گردانند به این امید که یکی از آن ها مشابه درخواست کاربر باشد. این در حالی است که نیاز کاربران به خدمات سطح بالاتر مانند ترکیب سرویس بیشتر شده و این خدمات پیچیده باید در زمان کوتاه تری انجام شوند. اما در دایرکتوری های کنونی هیچ پیش پردازشی روی اطلاعات ذخیره شده به منظور استفاده بهینه از آن ها و ارائه خدمات بهتر صورت نمی گیرد. لذا کندی دایرکتوری های سرویس در ارائه خدمات و خدمات سطح پائین کنونی ارائه شده توسط آن ها که باعث تاخیر دایرکتوری سرویس در پاسخ گویی به پرس وجوهای پیچیده می شود، دو مشکلی است که در این پژوهش مورد توجه قرار داده شده است. برای غلبه بر این کاستی ها، یک دایرکتوری سرویس ایجاد شده که در آن روش جدیدی برای انتشار سرویس های وب ارائه شده است. در این دایرکتوری سرویس، موجودیت های شبکه استخراج شده و بین آن ها با رابطه های معنایی تعریف شده، پیوند برقرار می شود تا یک گراف معنایی به وجود آید. بر اساس این گراف معنایی، خدمات جدید و بهینه ای عرضه شده است. نشان داده شده که این دایرکتوری سرویس قادر به ارائه خدمات تکمیلی است و قابلیت پخش شدن را دارد. همچنین زیرساخت های نظری برای ساخت و نگهداری این دایرکتوری جدید توسعه داده شده است. خدمات ارائه شده توسط دایرکتوری سرویس جدید و قابلیت های آن از طریق آزمایش های مختلف بررسی شده اند و کارایی سیستم و عملیاتی بودن آن نشان داده شده است.
فراز محمدیان جدول قدم احمد رضا نقش نیلچی
خلاصه سازی خودکار متن یکی از جنبه های مهم در بازیابی اطلاعات می باشد. در این پایان نامه یک روش جدید برای خلاصهسازی خودکار متون فارسی پیشنهاد شده است که رویکردی مبتنی بر معنا دارد. روش پیشنهادی، دارای سه فاز پیش پردازش، پردازش و تولید خلاصه نهایی می باشد. در مرحله پیش پردازش، ریشه کلمات با استفاده از یک روش مبتنی بر فرهنگ واژگان بدست می آید. مجموعه ترادف جملات موجود در متن از طریق همین فرهنگ واژگان بدست می آید. این کار منجر به یک زنجیره لغوی قوی می شود. در مرحله پردازش، با استفاده از زنجیره لغوی و روش تحلیل معنای پنهان، ارتباط بین جملات مهم بدست می آید تا جملات مرتبط با هم گزینش و در خروجی قرار گیرند. در مرحله تولید خلاصه، برای رفع افزونگی و تکرار، جملات مشابه در خروجی با جملات انتخاب شده مقایسه شده و در صورت داشتن شباهت نسبی (با انتخاب ضریب میزان تشابه 80?) از قرار دادن آن در خلاصه نهایی جلوگیری می شود. دو شیوه برای ارزیابی خلاصه ساز پیشنهادی ارائه شده است. یکی روش ارزیابی مستقیم و دیگری روش ارزیابی مبتنی بر lsa (تحلیل معنایی پنهان) است. نتایج ارزیابی نشان می دهد به دلیل استفاده از فرهنگ واژگان غنی، ریشه یابی با دقت بالائی انجام می گیرد که در مقایسه با روش های مشابه کارایی بالائی دارد. به دلیل استفاده از همین فرهنگ واژگان غنی، مجموعه ترادف و زنجیره لغوی ارتباط معنای کلمات و جملات در روش تحلیل معنایی پنهان بسط داده شده به درستی بدست آورده می شود که نتایج حاکی از این امر دارد. در نهایت نتایج ارزیابی نشان می دهد که روش ارائه شده خلاصه قابل قبول و منسجمی ارائه می دهد.