پیمانه بندی هستان شناسی مبتنی بر گراف و مشابهت معنایی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی
- نویسنده سودابه غفوریان
- استاد راهنما محمود نقیب زاده محسن کاهانی
- سال انتشار 1392
چکیده
پیمانه بندی هستان شناسی راهی مناسب برای استفاده از هستان شناسی های بزرگ است. برای ایجاد پیمانه هایی با کیفیت بالا، باید هم جنبه ساختاری و هم معنایی هستان شناسی در نظر گرفته شود. برای در نظر گرفتن ویژگی ساختاری هستان شناسی کافیست آن را به صورت گراف نمایش دهیم. برای در نظر گرفتن ویژگی معنایی هستان شناسی کافیست به روابط مختلف، وزنهای متفاوتی داده شود. وزندهی به یالها مستلزم شناسایی روابط مختلف و تشخیص میزان مهم بودن آنهاست. بنابراین برای انجام راه حل پیشنهادی گامهای ذیل طی میشود: 1. مشخص کردن نحوه نمایش گراف هستان شناسی از روشی برای نمایش گراف هستان شناسی استفاده میشود که فاعل، مفعول و فعل هر کدام جدا بهصورت گره در نظر گرفته میشوند. البته فقط خصوصیات objectproperty و datatypeproperty را گره در نظر میگیریم و بقیه روابط (خصوصیات) به صورت یال در نظر گرفته میشوند، به علاوه در این نمایش نمونه ها نیز به عنوان گره نمایش داده میشوند. 2. شناسایی روابط و وزندهی به آنها برای وزندهی به روابط مختلف هستان شناسی از یک تابع وزن استفاده میشود این تابع به بعضی از روابط موجود، عددی صحیح نسبت میدهد. وزن دادن یک راه تفاوت قائل شدن بین روابط است. یک راه اولویت دادن به روابط بر اساس پیدایش روابط است و راه دیگر این است که میتوان بر اساس معنا و تعریف روابط اولویت آنها را مشخص کرد. 3. یکسان سازی وزن یالها در صورت لزوم اگر بین گره ها بیش از یک رابطه وجود داشت بین وزن روابط حداکثر وزن در نظر گرفته میشود و سپس بر اساس وزن حداکثر و وزن یک گام بالاتر از این وزن در جدول 1، وزن حاصل به وزن یک گام بالاتر تنظیم میشود. 4. نرمالسازی برای نرمال سازی، وزن یال خروجی از گره مورد نظر بر مجموع وزنهای یالهای خروجی از گره تقسیم میشود. بنابراین وزنها بین صفر و 1 خواهند بود. خروجی این قسمت ماتریسی است که برای ورود به الگوریتم فاصله گام تصادفی آماده است. 5. تخمین نزدیکی رئوس با استفاده از الگوریتم همسایگی فاصله گام تصادفی از الگوریتم همسایگی فاصله گام تصادفی برای اندازه گیری نزدیکی رئوس هستان شناسی استفاده میشود. 6. پیمانه بندی تابع معیار استفاده شده silhouettes coefficient یا s(i) است. میانگین s(i) معیاری است که نشان میدهد چقدر داده ها در یک پیمانه، مناسب گروه بندی شده اند. s(i) را به ازای هر گره مفهوم با توجه به رابطه زیر به دست می آید. کارایی پیمانه بندی بر اساس متوسط امتیاز هر پیمانه به دست میآید. امتیاز هر پیمانه نیز بر اساس متوسط امتیازهای گره های داخل پیمانه یعنی s(i) ها محاسبه میشود. برای پیمانه بندی دو الگوریتم به شرح زیر پیشنهاد شده است: الگوریتم پیمانه بندی تجمعی ورودی الگوریتم تجمعی ماتریس همسایگی فاصله گام تصادفی است. این الگوریتم پیمانه را به صورت تکراری براساس داشتن شباهت زیاد با هم ادغام میکند. یک الگوریتم پایین به بالاست که در ابتدا هر راس را به عنوان یک پیمانه مجزا در نظر میگیرد و در آخر با یک گراف به عنوان یک پیمانه منحصربه فرد پایان میگیرد. در اینجا در هر مرحله به ازای هر دو پیمانه ci و cj، پیمانه ها باهم ادغام میشوند و امتیاز بدست میآید، ترکیبی که بیشترین امتیاز را دارد، لحاظ میشود و در آخر این ترکیب انتخاب شده و به مرحله بعد که یکی از تعداد پیمانه ها کم میشود، میرود و دوباره همین مراحل تکرار میشود تا در نهایت یک پیمانه باقی بماند. الگوریتم پیمانه بندی اکتشافی الگوریتم اکتشافی به منظور پیشتیبانی از هستان شناسی های بزرگ و کاهش زمان اجرا پیشنهاد شده است. ورودی این الگوریتم برای پیمانه بندی ماتریس وقوعی است که از روی ماتریس مجاورت ساخته شده است. هر سطر از ماتریس وقوع یک یال را معرفی میکند که شامل گره اول، گره دوم و وزن بین آن دو میشود. این ماتریس بر اساس ستون وزن به صورت صعودی مرتب میشود. الگوریتم بدین صورت است که اگر گره اول و دوم در یک پیمانه نباشند، باهم ادغام میشوند. سپس دو شرط چک میشود: اول، اگر اندازه پیمانه جدید کمتر از یک سوم کل تعداد گره ها باشد، ادغام صورت میگیرد و شرط دوم چک کردن امتیاز پیمانه بندی است که اگر امتیاز بالاتر باشد الگوریتم ادامه می یابد، در غیر اینصورت الگوریتم خاتمه می یابد. راهکار پیشنهادی هر دو جنبه ساختاری و معنایی هستان شناسی را در نظر می گیرد حال آن که در اکثر کارهای گذشته به هردو جنبه توجه نمیشود. معنا با توجه به اختصاص دادن وزن به روابط متفاوت در نظر گرفته شده است به علاوه نسبت به سایر رویکردها روابط بیشتری در نظر گرفته می شود. در نظر گرفتن روابط بیشتر باعث می شود که یالهای بیشتری در نمایش گراف هستان شناسی وجود داشته باشد که میتوان در پیدا کردن شباهت دو گره تصمیم بهتری گرفت. استفاده از ماتریس همسایگی فاصله گام تصادفی برای ترکیب جنبه ساختاری و معنایی هستان شناسی انجام می گیرد. هر درایه از این ماتریس با توجه به وزن تقریباً همه درایه های ماتریس احتمال انتقال محاسبه می شود بنابراین وزن ها در روش پیشنهادی دقیقتر از سایر روشهایی هستند که فقط از ماتریس وزن استفاده می کنند. به علاوه در روش پیشنهادی یک تابع امتیازدهی جدید معرفی شده است. هدف این تابع بیشینه کردن شباهت داخل پیمانه ها و کم کردن شباهت بین پیمانه هاست. تابع امتیازدهی با توجه به هدفش نشان میدهد که گره ها چقدر در داخل پیمانه مورد نظر مناسب گروه بندی شده اند. و در آخر به عنوان نتیجه میتوان گفت، پیمانه های ایجاد شده در روش ما دارای بار معنایی هستند زیرا در این پژوهش روابط بیشتری نسبت به روشهای مشابه در نظر گرفته میشود و این روابط طوری پردازش میشوند که وزن هر یال یا رابطه روی انتخاب هر پیمانه تاثیر میگذارد.
منابع مشابه
بررسی هستان شناسی های توسعه یافته مبتنی بر اصول هستان شناسی های منبع باز زیست پزشکی
Background and Aim: Ontologies facilitate data integration, exchange, searching and querying. Open Biomedical Ontologies (OBO) Foundry is a solution for creating reference ontologies. In this foundry, the design of ontologies is based on established principles which allow for their interactions as a single system. The purpose of this study is to determine the main features of ontologies develop...
متن کاملتعیین مشابهت معنایی به روش بدونسرپرست با استفاده از قدمزنی تصادفی بر گراف جایگزینی زبانی
این مقاله به معرفی روشی برای تعیین مشابهت معنایی کلمات با استفاده از پیکرههای تنک میپردازد. این روش با ارائه مفهوم جایگزینپذیری غیرمستقیم برای اولین بار و پیادهسازی آن از طریق گراف جایگزینپذیری عبارتها توانسته است بر مشکل تنک بودن فضای زمینه در زبانهای با منابع محدودتر مانند فارسی غلبه نماید. از طرف دیگر باید به این نکته اشاره نمود که برای تولید گراف جایگزینی لازم برای تعیین مشابهت معنای...
متن کاملیک الگوریتم مبتنی بر owl dl برای محاسبه فاصله معنایی مفاهیم در یک هستان شناسی
اندازه گیری میزان شباهت معنایی بین مفاهیم بر اساس توصیفات آن ها در هستان شناسی ، عملیاتی بنیادی در بازیابی اطلاعات ، بازیابی مولفه ها و کشف سرویس ها محسوب می شود . در این موارد نیاز داریم که میزان شباهت یا میزان مطابقت دو توصیف یا مستند و یا میزان مطابقت چند کلمه کلیدی با محتوای یک توصیف یا مستند را تعیین نماییم . درنهایت این مسئله ، به مسئله تعیین میزان شباهت بین دو کلمه و یا دو مفهوم ، تبدیل ...
15 صفحه اولرتبه بندی رأسهای گراف
یک مسئلۀ مهم در نظریۀ گراف، علوم کامپیوتر و شبکه های اجتماعی، مشخص کردن اهمیت رأس های یک گراف (یا گره های یک شبکه) است. بدین منظور، معیارها و روش های گوناگونی پیشنهاد شده است. یکی از این روش ها، رتبه بندی است که بر پایۀ گا م برداریِ تصادفی بنا شده است. هدف ما در این مقاله، توضیح الگوریتم رتبه بندی به دو شکل متمرکز و توزیع شده است. به این منظور، نخست مفهوم رتبه بندی و الگوریتم محاسبۀ آن را به صور...
متن کاملارزیابی روش های ساخت اتوماتیک هستان شناسی وب معنایی
رشد بی رویه داده های روی وب اداره و کاوش اطلاعات را مشکل می سازد. هدف وب معنایی آن است که پایگاه دانش معنایی را به صفحات وب که شامل ابرمتون زبان طبیعی می باشند، اضافه نماید، تا قدرت جستجوی عمیق و جامعیت اطلاعات را بوجود آورد. از آنجا که ساخت یک پایگاه داده و هستان شناسی بصورت دستی بسیار هزینه بر و زمان گیر است، مانعی بر سر راه پیشرفت فعالیت های وب معنایی می باشد. به همین دلیل محققین سعی دارند ب...
15 صفحه اولترکیب خودکار سرویسها مبتنی بر گراف رنگآمیزی
سرویسهای وب بهعنوان مؤلفههای نرمافزاری مستقل توسط ارائهدهندگان سرویس بر روی اینترنت منتشر شده و توسط درخواستکنندگان سرویس برای رسیدن به اهداف مختلف فراخوانی میشوند. با این حال در بسیاری از موارد هیچ سرویسی بهتنهایی در مخزن سرویس یافت نمیشود که بتواند رضایت درخواستکننده را برآورده سازد. ترکیب سرویس، مؤلفههای جدیدی را با استفاده از یک مدل تعاملی برای سرعت بخشیدن به برنامهها ایجاد میک...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023