تجزیه ی ماتریس برای داده کاوی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز
- نویسنده فاطمه نیکومرام
- استاد راهنما اشکان سامی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
تجزیه ی ماتریس دارای کاربردهای زیادی نظیر: کاهش بعد، تشخیص الگو، آنالیز بیان ژن و ... می باشد. از آنجا که دربسیاری از کاربردها مانند تشخیص چهره، عناصر منفی وجود و معنا ندارند، تجزیه غیرمنفی و باینری ماتریس پیشنهاد داده شده است. در تجزیه ماتریس باینری، همه ی عناصر باینری هستند و جمع و ضرب نیز در فضای باینری تعریف می شوند. از بین انواع تجزیه باینری، تجزیه ستونی باینری ماتریس که توسط میئتنین ارائه شده است، دارای قابلیت تفسیر بالایی است. بنابراین، این روش، بهترین روش جهت استخراج قوانین است. در این روش، ماتریس ورودی به دو ماتریس c و x که یکی شامل k ستون و دیگری شامل k ردیف است، تجزیه می شود، به طوری که k تعداد خوشه ها و یا دسته ها می باشد. k ستون ماتریس اول، c، زیرمجموعه ای از ستون های ماتریس ورودی می باشند. بنابراین قابلیت تفسیر بالا است. دو چالش در این نوع تجزیه وجود دارد: 1) الگوریتم های پیشنهاد شده برای این روش، برای رسیدن به خطای کمتر از تعداد تکرار زیاد رنج می برند و حتی امکان دارد الگوریتم، بعد از تکرارهای بیشتر به جواب بدتر برسد. 2) از قابلیت تفسیر بالای این تجزیه در کاربردی استفاده نشده است. این پایان نامه دو هدف دارد: 1) بهبود الگوریتم های موجود. 2) ارائه کاربرد. در زمینه ی بهبود الگوریتم، دو روش برای بهبود در الگوریتم bcx ارائه شده است. یک روش، جهت بهبود در یافتن ماتریس c و یک بهبود در ماتریس x به وجود آمده، پیشنهاد شده است، که اثبات ریاضی برای این بهبود نیز ارائه شده است. انتخاب ستون های ماتریس c طوری بازبینی شده است که منجر به خطای کمتر می شوند و بهبود در ماتریس x، از تعریف ضرب ماتریس الهام گرفته است. نتایج حاصل از آزمایشات دقت بالای بهبود را در kهای بالا نشان می دهد. به طوری که برای kهای بالا، درصد بهبود حدود 50% به دست آمده است. در زمینه ی کاربرد، کاربرد استخراج اتوماتیک کلمات کلیدی موردتوجه قرار گرفته است. کلمات کلیدی در بسیاری موارد به عنوان خلاصه ی مفیدی از متن استفاده می شوند. انتساب دستی این کلمات کار بسیار وقت گیری است. در عمل، کلمات کلیدی، کلماتی هستند که پوشش خوبی از متن دارند. الگوریتمی بر اساس تجزیه bcx برای استخراج بهترین کلمات متن ارائه شده است که هر چه خطای تجزیه کمتر باشد، پوشش متن بهتر است. نتایج نشان می دهد که این الگوریتم، الگوریتمی کارا و ساده است.
منابع مشابه
به کارگیری تجزیه ماتریس در کاهش ابعاد داده نوع گراف:مورد کاوی داده ریزآرایه
چکیده به کارگیری تجزیه ماتریس در کاهش ابعاد داده نوع گراف: مورد کاوی داده ریز آرایه به کوشش: فهیمه گودرزی یکی از شاخه های مهم بیو انفوماتیک فناوری ریز آرایه dna است که امکان بررسی عبارت هزاران ژن را به طور هم زمان و در حداقل زمان ممکن می سازد که در سال های اخیر موجب تولید حجم انبوهی از داده های عبارت ژن شده است. تحلیل آماری این داده ها شامل نرمال سازی، خوشه بندی، طبقه بندی و ... غیر...
به کارگیری داده کاوی برای پیشنهاد پرسش درنظامهای بازیابی اطلاعات
دادهکاوی به مفهوم آشکارسازی الگوهای موجود در حجم انبوه دادههاست که در بسیاری از رشتهها به کار گرفته شده است. در رشته علم اطلاعات و دانششناسی به ویژه در بازیابی اطلاعات نیز میتوان از آن بهره برد. در بازیابی اطلاعات ابتدا پارادایم نظامگرا و سپس پاردایم کاربرگرا مطرح شده است که در پارادایم دوم به نیاز اطلاعاتی توجه شده است. در پارادایم دوم، ورود پرسشهای نامناسب از سوی کاربران، دلیل اصلی عدم...
متن کاملتجزیه تحلیل علایم بالینی بیماران مبتلا به اِسکلروزِ چندگانه با استفاده از داده کاوی
Background: One of the today most common and incurable diseases that is associated with central neural system is ‘MS’ disease. Multiple sclerosis (MS) is a demyelinating disease in which the insulating covers of nerve cells in the brain and spinal cord are damaged. In this disease become apparent a wide spectrum of symptoms such as lose muscles control and their coordination and vision derangem...
متن کاملداده کاوی احتمال وقوع خشکسالی در ایران
خشکسالی در سالهای اخیر خسارات زیادی به کشور وارد ساخته است که باید تلاش کرد تا با استفاده از مدیریت منطقی، حتیالامکان خسارات ناشی از آن را کاهش داد. بدین منظور لازم است تا مناطق متأثر از این بلا مقایسه شوند و در اولویت اقدامات مدیریتی قرار گیرند. هدف از انجام این مطالعه تهیه نقشه شاخص خطر خشکسالی ایران است. در این تحقیق دادههای بارش ماهانه 46 ایستگاه انتخاب شدند. بهمنظور تهیه نقشه شاخص DHI ...
متن کاملبررسی کاربردهای داده کاوی در نظام سلامت
Introduction: Extensive amounts of data stored in medical databases require the development of specialized tools for accessing the data, data analysis, knowledge discovery, and the effective use of the data. Data mining is one of the most important methods. The article sketches the used Data Mining techniques, and illustrates their applicability to medical diagnostic and prognostic problems. ...
متن کاملمدلی برای تحلیل رفتار مشتریان با استفاده از داده کاوی (مطالعه ی موردی: صنعت روغن خوراکی)
شناخت درست و حفظ مشتریان از عوامل اثرگذار در دنیای رقابت امروز است. صنایعی چون صنعت غذا به فکر هم مسیری با بازار رقابتی نوین هستند. امروزه علومی چون داده کاوی، مدیریت ارتباط با مشتری و مدیریت استراتژیک به صورت مکمل برای شناخت درست رفتار مشتری، بهبود c r m و افزایش درآمد، بهبودی بخش این موضوع اند. با استفاده از مفاهیم فوق، پژوهشی درخصوص داده های مربوط به یک شرکت تولیدی روغن انجام گرفته است. با ا...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023