ارائه ی یک مدل آماری بزای خوشه بندی متون
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر
- نویسنده حمید محمودی
- استاد راهنما اقبال منصوری فرشاد تاجری پور محمدهادی صدرالدینی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
در این پایان نامه سعی در ارائه ی یک مدل آماری برای خوشه بندی متون داشته ایم. هر خوشه به منزله ی جزئی از یک مدل ترکیبی در نظر گرفته می شود که شامل پارامترهای عدد اولویت جزء، بردار میانگین و ماتریس کواریانس جزء می باشد. هدف از ارائه ی یک مدل آماری، در نظر گرفتن پخشش های متفاوت برای مجموعه داده هایی که لزوماً پخشش آنها کروی نیست، می باشد. الگوریتمهای خوشه بندی مانند k-means و مشتقات آن که با یک پارامتر-که معمولاً مراکز خوشه هاست- کار می کنند، سعی دارند خوشه هایی با پخشش کروی را ایجاد کنند که این در مورد همه ی مجموعه داده های دنیای واقعی صدق نمی کند. هدف دیگر این پایان نامه، به مقدار دهی اولیه ی پارامترهای مدل بر می گردد. بسیاری از کارهای انجام شده در زمینه ی خوشه بندی بدون نظارت متون، ساخت چندین مدل مختلف با مقداردهی های اولیه ی تصادفی بوده است و نهایتاً مدل برتر را بر اساس یک معیار خاص انتخاب می کردند. از آنجائیکه مقداردهی تصادفی در همه ی اجراها نتایج قابل اعتماد و منظمی ارائه نمی دهد، ما با ارائه ی یک رویه ی چند مرحله ای و بدون کمک از هرگونه ناظر خارجی و با استفاده از الگوریتمهای سلسله مراتبی که پیچیدگی محاسباتی آن را با انتخاب یک مجموعه کوچک از نمونه های برتر و همچنین کاهش فضای ابعاد، کاهش دادیم موفق شدیم برای هر خوشه بهترین متون مربوطه را بیابیم و بوسیله ی آنها پارامترهای مذکور را مقداردهی کنیم. نتایج آزمایشگاهی و نمودارهای مقایسه ای به صورت کاملاً واضح نشان می دهند که روش های پیشنهاد شده در این پایان نامه از عملکرد بالاتری نسبت به روشهای ارائه شده ی مشابه داشته اند.
منابع مشابه
ارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده میشود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند میتواند در یک، چند و یا هیچ دستهای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار میگیرد. این موضوع میتواند در قالب یک ی...
متن کاملارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار می گیرد. این موضوع می تواند در قالب یک ی...
متن کاملنحوه خوشه بندی آماری داده های شکل
اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...
متن کاملارائه مدل تحلیل خوشه بندی خاکستری در ارزیابی عملکرد و رتبه بندی هیات های ورزشی
هدف از پژوهش حاضر ارائه مدل تحلیل خوشه بندی خاکستری در ارزیابی عملکرد و رتبه بندی هیات های ورزشی بود. محدوده مورد مطالعه استان اصفهان؛ و نمونه آماری را هیات های ورزشی با ویژگی رشته های دسته جمعی و توپی شامل هیات های ورزشی فوتبال، والیبال، هندبال، بسکتبال، راگبی، و بیس بال (و سافت بال) تشکیل دادند که بر اساس چهار مولفه اصلی توسعه سخت افزاری (3 شاخص)، توسعه ورزش همگانی (5 شاخص)، توسعه ورزش قهرمان...
متن کاملارائه ی یک روش خوشه بندی سری های زمانی بر مبنای الگوریتم تکاملی دیفرانسیلی و تبدیل کسینوسی گسسته
با پیشرفت روز افزون تکنولوژیهای جمع آوری اطلاعات و امکان دسترسی به حجم عظیمی از داده همواره نیازمند روشهایی برای تجزیه و تحلیل این حجم داده خام و استخراج اطلاعات مفید از آن میباشیم. امروزه خوشهبندی داده به عنوان یکی از روشهای آنالیز و ساده سازی مجموعه دادههای بزرگ، مورد توجه بسیاری از محققین قرار گرفته است. در این میان خوشهبندی سریهای زمانی با دقت مورد قبول، حائز اهمیت بسیاری میباشد....
متن کاملارائه ی یک مدل خوشه بندی تودرتو با رویکرد مدل های برنامه ریزی ریاضی
خوشه بندی، قرار دادن داده ها در کنار یکدیگر، بر اساس ماهیت درونی آن هاست. محققان طبقه بندی های مختلفی برای الگوریتم های خوشه بندی ارائه داده اند. یک طبقه بندی سه تایی شامل مدل های خوشه بندی افرازی مدل های خوشه بندی سلسله مراتبی و خوشه بندی فازی، از کلی ترین تقسیم بندی ها محسوب می شود. به طوری که مدل های افرازی، سلسله مراتبی و فازی اشتراکی با یکدیگر ندارند. با این حال، استفاده از الگوریتم های سل...
15 صفحه اولمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023