تخمین داده های گم شده بر پایه ی روش های خوشه بندی قطعی و خوشه بندی فازی

پایان نامه
چکیده

داده های عددی را می توان به دلیل در برداشتن عمده ی اطلاعات سازمان ها، به ویژه در مسایل مالی، رکن اصلی آن ها تلقی کرد. به همین دلیل، وجود داده های کامل و بی نقص نقش مهمی را در عملکرد صحیح و حیات سازمان ها و مراکز مالی و تجاری ایفا می کند. از طرفی به دلایل بسیار از جمله خطای بشر و عوامل محیطی، امکان از دست رفتن برخی مقادیر در پایگاه داده ها و ناقص شدن اطلاعات، قابل پیش بینی است. به این منظور، تلاش برای یافتن راه هایی که بتوان داده های از دست رفته را بازیابی کرده و یا با دقت بسیار تخمین زد، امری ضروری است. در این پایان نامه، یک روش تخمین مقادیر گم شده با دقت بالا نسبت به روش های معمول، بر پایه ی الگوریتم معروف و پرکاربرد خوشه بندی c-میانگین سخت و فازی معرفی و برای یک مجموعه داده ی واقعی حسابداری پیاده سازی شده است. برای این منظور، ابتدا ضمن معرفی خوشه بندی و انواع و روش های آن، الگوریتم های c-میانگین سخت و فازی بررسی و پس از بیان مفاهیمی از علم حسابداری، نحوه ی عملکرد و نتایج حاصل بر داده هایی عملیاتی از این نوع، ارزیابی شده است. در این میان با توجه اهمیت عملکرد، برای تعیین داده ی ناسازگار و تعداد بهینه ی خوشه، روش های معتبری به کار گرفته شده است. آن گاه روش بهینه ی کامل که با تعمیم روش خوشه بندی ذکرشده به دست می آید، معرفی گردیده و بر روی یک مجموعه ی واقعی از داده های حسابداری مربوط به فرآیندهای مالی چند شرکت پیاده سازی شده است. سپس با مقایسه ی نتایج به دست آمده از این روش و تخمین مقادیر گم شده حاصل از دو روش آماری معمول، مزایای این روش نشان داده شده است.

منابع مشابه

نحوه خوشه بندی آماری داده های شکل

اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...

متن کامل

ارایه شاخصی جدید جهت سنجش اعتبار خوشه بندی در الگوریتم های خوشه بندی فازی نوع-2

One of the main issues in fuzzy clustering is to determine the number of clusters that should be available before clustering and selection of different values for the number of clusters will lead to different results. Then, different clusters obtained from different number of clusters should be validated with an index. But so far such an index has not been introduced for interval type-2 fuzzy C...

متن کامل

طبقه بندی سنگ ‏های ساختمانی از دیدگاه قابلیت برش با استفاده از روش خوشه بندی فازی

پیش بینی قابلیت برش سنگ به عنوان یکی از فاکتورهای موثر در تخمین هزینه‏ها و پیش بینی میزان تولید یک کارخانه فرآوری سنگ از اهمیت بالایی برخوردار می‏باشد. بنابراین شناخت کامل سنگ‏های ساختمانی و ارزیابی توان اجرایی دستگاه‏های برش در کارخانه‏های فرآوری، طراحان و برنامه‏ریزان تولید را به سمت بهبود سرعت فرآوری و افزایش تولید سوق می‏دهد. از اینرو، به کارگیری روش‏های نو و کاربردی برای دست‏یابی به این اه...

متن کامل

الگوریتمی جدید برای جزیره بندی کنترل شده سیستم های قدرت مبتنی بر خوشه بندی طیفی مقید

In this paper a new algorithm is presented for power systems controlled islanding based on constrained spectral clustering. The proposed algorithm minimizes two objective functions of power flow disruption in transmission lines and generation - demand imbalance in islands to ensure transient stability within islands and to minimize necessary actions in reconfiguration of transmission system, ge...

متن کامل

بررسی تاثیر روش های مختلف خوشه بندی داده ها بر روی دقت مدل های مربوط به برآوردی های حسابداری از طریق مقایسه روش های خوشه بندی سنتی و کلاسیک

امروزه استفاده از برآورد اطلاعات حسابداری همانند سایر رشته ها بدلیل عدم دسترسی به تمام اطلاعات، لازم و ضروری می باشد. به همین دلیل  در این پژوهش سعی شده با استفاده از روش های مختلف خوشه بندی دقت مدل های مربوط به برآورد های حسابداری مورد بررسی قرار گیرد تا مشخص گردد روش های مختلف خوشه بندی به چه میزان دقت مدل های مدنظر را افزایش میدهند و روش ارجح تر در میان روش های مختلف خوشه بندی در افزایش دقت ...

متن کامل

تحلیل داده های بیماران دیابتی در راستای خوشه بندی و تجویز دارو براساس الگوریتم پیشنهادی

مقدمه: دیابت یک اختلال سوخت و سازی در بدن است که توانایی تولید هورمون انسولین در بدن از بین می‌رود . هدف کلی از انجام پژوهش حاضر کشف دانش نهفته در داده­­های بیماران دیابتی است، که می­تواند به پزشکان در خوشه­بندی بیماران جدید و تجویز داروی مناسب مطابق هر خوشه کمک نماید. روش کار: در این مقاله از الگوریتم MR-VDBSCAN استفاده شده است. پیاده­سازی این الگوریتم د...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شیراز - دانشکده ریاضی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023