ارائه ی یک مدل آماری بزای خوشه بندی متون

پایان نامه
چکیده

در این پایان نامه سعی در ارائه ی یک مدل آماری برای خوشه بندی متون داشته ایم. هر خوشه به منزله ی جزئی از یک مدل ترکیبی در نظر گرفته می شود که شامل پارامترهای عدد اولویت جزء، بردار میانگین و ماتریس کواریانس جزء می باشد. هدف از ارائه ی یک مدل آماری، در نظر گرفتن پخشش های متفاوت برای مجموعه داده هایی که لزوماً پخشش آنها کروی نیست، می باشد. الگوریتمهای خوشه بندی مانند k-means و مشتقات آن که با یک پارامتر-که معمولاً مراکز خوشه هاست- کار می کنند، سعی دارند خوشه هایی با پخشش کروی را ایجاد کنند که این در مورد همه ی مجموعه داده های دنیای واقعی صدق نمی کند. هدف دیگر این پایان نامه، به مقدار دهی اولیه ی پارامترهای مدل بر می گردد. بسیاری از کارهای انجام شده در زمینه ی خوشه بندی بدون نظارت متون، ساخت چندین مدل مختلف با مقداردهی های اولیه ی تصادفی بوده است و نهایتاً مدل برتر را بر اساس یک معیار خاص انتخاب می کردند. از آنجائیکه مقداردهی تصادفی در همه ی اجراها نتایج قابل اعتماد و منظمی ارائه نمی دهد، ما با ارائه ی یک رویه ی چند مرحله ای و بدون کمک از هرگونه ناظر خارجی و با استفاده از الگوریتمهای سلسله مراتبی که پیچیدگی محاسباتی آن را با انتخاب یک مجموعه کوچک از نمونه های برتر و همچنین کاهش فضای ابعاد، کاهش دادیم موفق شدیم برای هر خوشه بهترین متون مربوطه را بیابیم و بوسیله ی آنها پارامترهای مذکور را مقداردهی کنیم. نتایج آزمایشگاهی و نمودارهای مقایسه ای به صورت کاملاً واضح نشان می دهند که روش های پیشنهاد شده در این پایان نامه از عملکرد بالاتری نسبت به روشهای ارائه شده ی مشابه داشته اند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

متن کامل

نحوه خوشه بندی آماری داده های شکل

اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...

متن کامل

ارائه مدل تحلیل خوشه بندی خاکستری در ارزیابی عملکرد و رتبه بندی هیات های ورزشی

هدف از پژوهش حاضر ارائه مدل تحلیل خوشه بندی خاکستری در ارزیابی عملکرد و رتبه بندی هیات های ورزشی بود. محدوده مورد مطالعه استان اصفهان؛ و نمونه آماری را هیات های ورزشی با ویژگی رشته های دسته جمعی و توپی شامل هیات های ورزشی فوتبال، والیبال، هندبال، بسکتبال، راگبی، و بیس بال (و سافت بال) تشکیل دادند که بر اساس چهار مولفه اصلی توسعه سخت افزاری (3 شاخص)، توسعه ورزش همگانی (5 شاخص)، توسعه ورزش قهرمان...

متن کامل

ارائه ی یک روش خوشه بندی سری های زمانی بر مبنای الگوریتم تکاملی دیفرانسیلی و تبدیل کسینوسی گسسته

با پیشرفت روز افزون تکنولوژی­های جمع آوری اطلاعات و امکان دسترسی به حجم عظیمی از داده همواره نیازمند روش­هایی برای تجزیه و تحلیل این حجم داده خام و استخراج اطلاعات مفید از آن می­باشیم.  امروزه خوشه­بندی داده به عنوان یکی از روش­های آنالیز و ساده سازی مجموعه داده­های بزرگ، مورد توجه بسیاری از محققین قرار گرفته است. در این میان خوشه­بندی سری­های زمانی با دقت مورد قبول، حائز اهمیت بسیاری می­باشد....

متن کامل

ارائه ی یک مدل خوشه بندی تودرتو با رویکرد مدل های برنامه ریزی ریاضی

خوشه بندی، قرار دادن داده ها در کنار یکدیگر، بر اساس ماهیت درونی آن هاست. محققان طبقه بندی های مختلفی برای الگوریتم های خوشه بندی ارائه داده اند. یک طبقه بندی سه تایی شامل مدل های خوشه بندی افرازی مدل های خوشه بندی سلسله مراتبی و خوشه بندی فازی، از کلی ترین تقسیم بندی ها محسوب می شود. به طوری که مدل های افرازی، سلسله مراتبی و فازی اشتراکی با یکدیگر ندارند. با این حال، استفاده از الگوریتم های سل...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023