نام پژوهشگر: فاطمه سادات حسینی آمره ئی
فاطمه سادات حسینی آمره ئی بهرام صادقی بی غم
در این پایان نامه به بررسی کارهای انجام شده در حیطه کاهش تعداد داده ها و نیز مسئله خوشه بندی پرداخته می شود و در آخر راهکاری جهت حل مسئلهk -مرکز با استفاده از خوشه بندی سلسله مراتبی پیوند کامل ارائه می شود. امروزه با پیشرفت شبکه های کامپیوتری و افزایش قدرت پردازنده ها، روزانه سیل حجیمی از اطلاعات تولید می شود که از نظر بُعد و تعداد، تبدیل به داده های غیر قابل کنترل و عظیمی می شوند که به آن داده های حجیم گفته می شود. روش های مختلفی در خصوص کاهش بُعد و تعداد داده ها ارائه شده است که با استفاده از آنها می توان با انتخاب داده های کمتر و یا ویژگی های (فیلدهای) خاصی از داده ها، نسبت به پردازش سریع تر آن ها اقدام کرد. برخی از روش های ارائه شده در سال های اخیر مبتنی بر رویکرد هندسی هستند که در آن ها پس از تبدیل داده ها (رکوردها) به نقاط هندسی در فضا، الگوریتم هایی جهت یافتن بهترین زیرمجموعه ، به نام مجموعه هسته، از این داده های ارائه می گردد و هدف یافتن بهترین مجموعه هسته است که اولاً تعداد کمتری نسبت به داده اصلی باشد و دوماً خطای تقریب حاصل بسیار کم باشد یعنی جواب حاصل از این مجموعه با جواب حاصل از مجموعه اصلی تفاوت اندکی داشته باشند. واژه های کلیدی: داده های حجیم، هندسه محاسباتی، مجموعه هسته، خوشه بندی، مسئلهk -مرکز، خوشه بندی سلسله مراتبی پیوند کامل