نام پژوهشگر: فاطمه زهرا حیدری کبریتی

خوشه بندی کاربران وب و واکشی اولیه صفحات وب با استفاده از آنالیز معنایی پنهان احتمالاتی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده مهندسی برق و کامپیوتر 1393
  فاطمه زهرا حیدری کبریتی   احمد براآنی

در سالهای اخیر با توجه به رشد سریع وب جهانی، تحقیقات وسیعی پیرامون مدل کردن رفتار پیمایشیِ کاربران در وب¬سایت¬ها انجام گرفته است. در این راستا کاربردکاوی وب با هدف به¬دست آوردن الگوهای رفتار پیمایشی کاربران وب، مورد استفاده بسیاری از محققان قرار گرفته است. به¬طورکلی کاربران وب رفتارهای متفاوتی متناسب با نیازهای اطلاعاتی و وظایف مورد علاقه خود در بازدید از وب¬سایت¬ها از خود نشان می¬دهند، تمامی رفتارهای پیمایشی کاربران در فایل¬های ثبت وب قابل ردیابی است. یکی از تکنیک¬های مورد استفاده در کاربرد کاوی¬¬ وب خوشه¬بندی کاربران وب می¬باشد. در تکنیک خوشه¬بندی کاربرانی که رفتار پیمایشی مشابهی دارند در یک خوشه قرار می گیرند. هر خوشه منجر به ایجاد پروفایل¬های کاربری می¬شود که در برنامه¬های کاربردی مانند واکشی اولیه و حافظه نهان مورد استفاده قرار می¬گیرد. تکنیک¬های متداول و استاندارد کاربرد کاوی ¬وب برای خوشه¬بندی کاربران¬وب می¬تواند الگوهای کاربردی را مستقیماً کشف کند، اما این تکنیک¬ها به-طور خودکار نمی¬توانند مشخصات یا کیفیت عامل¬های پنهانی که منجر به کشف الگوهای پیمایشی مشترک می¬شوند را تعیین کنند. بنابراین نیاز به گسترش تکنیک¬هایی می¬باشد تا بتوان بصورت خودکار اهداف اساسی پیمایشی کاربران را شناسایی و رابطه معنایی پنهان میان کاربران-وب و همچنین رابطه معنایی پنهان بین کاربران¬وب و اشیاء وب را استخراج کرد. در این پژوهش، روشی براساس آنالیز معنایی پنهان احتمالاتی پیشنهاد می¬شود که مشخصات ذاتی رفتار پیمایشی کاربران را مشخص می-کند. روش پیشنهادی فاکتورهای پنهان به¬دست¬آمده را جهت خوشه¬بندی¬ الگوهای پیمایشی کاربران مورد استفاده قرار می¬¬دهد و پروفایل¬های کاربری را ایجاد می¬کند. نتایج خوشه¬بندی برای پیش¬بینی و واکشی درخواست¬های وب گروه¬های کاربران مورد استفاده و ارزیابی قرار می-گیرد. کارایی و برتری روش خوشه¬بندی کاربران از طریق آزمایش بر روی فایل¬¬های ثبت واقعی نشان داده می¬شود. روش پیشنهادی برای گروه-بندی کاربران وب و واکشی اولیه با کارهای قبلی مقایسه شده و نتایج به¬دست آمده کارایی بهتر و میزان دقت بالای روش پیشنهادی را در مقایسه با روش¬های دیگر از خود نشان می¬دهد.