نام پژوهشگر: نیما معصوم پرست
نیما معصوم پرست کوروش کیانی
با توجه به افزایش روزافزون حجم اطلاعات وگذر از اقتصاد سنتی و از میان رفتن مرزهای جغرافیایی برای کسب و کار و به تبع آن شدت یافتن رقابت باعث شده است در فضای مجازی به خصوص در حوزه بانکداری و تجارت الکترونیکی، امروزه یکی از چالش های مهم داده کاوی که مورد توجه اکثر سازمان ها می باشد پردازش روی مجموعه داده های بسیار بزرگ یا کلان داده است که توجه بسیاری از محققان و متخصصین در حوزه فناوری اطلاعات را به خود معطوف کرده است. وفاداری مشتریان برای سازمانها و موسسات مالی به خصوص بانکها بسیار حائز اهمیت بوده و شناسایی و نگهداری مشتریان وفادار و با ارزش همواره یکی از اهداف مهم بانکها می باشد زیرا مشتریان وفادار به عنوان یک دارایی رقابتی برای موسسات مالی محسوب می شوند . هادوپ یکی از محصولات کد باز است که برای ذخیره سازی و پردازش حجم اطلاعات بسیار بالا طراحی شده است . هادوپ، امکان ذخیره سازی و پردازش اطلاعات در چندین سرور با هزینه ای پایین فراهم می آورد همچنین به دلیل داشتن انعطاف پذیری در پذیرش مقیاس بالای داده توسط دو ویژگی مهم یعنی معماری موازی و روش نگاشت کاهش در این تحقیق از آن استفاده شده است. در این تحقیق پس از معرفی داده های بزرگ و مدل ها و روش های کاربردی آن، به پیاده سازی الگوریتم خوشه بندی kmeans در بستر هادوپ و تشریح روشهای معماری موازی و نگاشت کاهش و بررسی قابلیت های ویژه مطرح در این حوزه پراخته سپس، با استفاده از الگوریتم نگاشت و کاهش نتایج را بهبود بخشیدیم .