نام پژوهشگر: مصطفی رفعت
مصطفی رفعت کوروش کیانی
جریان کلیک ها طیف گسترده و کاملی را همانند مسیرهای مرور، محصولات خریداری شده و تبلیغات کلیک شده در فضای وب پوشش می دهند. در این مقاله سعی شده است تا علاقه مندی و رفتارهای کاربران را بر اساس مجموعه داده های مربوط در فضای معمولی و کلان داده مورد بررسی قرار داده و با خوشه بندی، کاربران با علاقه مندی های یکسان را مشخص نماییم. با ارائه معیار شباهتی جدید و بر اساس همین معیار، الگوریتم خوشه بندی اچ سی دابلیو سی اس معرفی و بهبود کیفیت خوشه بندی آن نسبت به مدل های کامینز و کامدویدز نشان داده شد و بر پایه همان معیار، الگوریتم دیگری به نام ام آر- اچ سی دابلیو سی اس بر مبنای مدل برنامه نویسی مپ ردیوس، پیشنهاد داده شد. زبان برنامه نویسی مورد استفاده متلب ورژن 2014 ب می باشد و با انجام فرایند پیش پردازش بر روی مجموعه داده ها، ماتریسی از جلسات حضور کاربران تولید و در الگوریتم های خوشه بندی مورد استفاده قرار گرفت و در نهایت با استفاده از معیار شباهت فیشر خوشه بندی ها با یکدیگر موردقیاس و کیفیت بهتر خوشه بندی الگوریتم پیشنهادشده نشان داده شد و در مقایسه از لحاظ زمان اجرا، الگوریتم مپ ردیوس پیشنهادی نسبت به مدل معمولی آن کاهش چشمگیری داشت.