نام پژوهشگر: فریبرز نحوی
فریبرز نحوی محمدرضا خیام باشی
با توجه به گسترش شبکه های اجتماعی، شناسایی اجتماعات که به عنوان بستر پنهان شبکه های پیچیده بشمار می آیند، از اهمیت خاصی برخوردار شده است. اکثر روش های کلاسیک، با دید ماکروسکوپی، کل ساختار گراف را در نظر گرفته و اقدام به شناسایی اجتماعات می نمایند. این روش ها، علیرغم دقت بالا، زمان اجرا بسیار بالایی نیز داشته و در شبکه های بزرگ در دنیای واقعی، قابل استفاده نمی باشند. بمنظور رفع این مشکل، الگوریتم های شناسایی محلی اجتماعات توسعه یافتند. از آنجایی که الگوریتم های محلی، تک تک گره های گراف را در نظر گرفته و ارتباطات بین آن ها را بررسی می نمایند، پیچیدگی زمانی پایین تری نسبت به روش های سراسری دارند. لیکن، پایین بودن کیفیت این روش ها، علیرغم سرعت بالا، آن ها را به سمت استفاده از معیارهای سراسری گراف جهت افزایش دقت سوق داده است که تهدیدی برای ماهیت الگوریتم های محلی بشمار می آید. در این پژوهش، ابتدا الگوریتمی بمنظور شناسایی محلی اجتماعات همپوشان با ایده گرفتن از روش های بهینه سازی حریصانه محلی معرفی گردیده است. شروع الگوریتم از یک هسته اولیه متراکم، عدم امکان انحراف فرآیند شناسایی اجتماعات محلی حول یک گره، قابلیت شناسایی گره های دورافتاده و قطب، کاهش تعداد چرخه های الگوریتم و در نتیجه کاهش پیچیدگی زمانی آن، شناسایی گره های مشترک و اجتماعات همپوشان بروش سراسری و عدم نیاز به تعیین مقادیر، پیش از شروع الگوریتم، از جمله قابلیت های الگوریتم معرفی شده می باشد. همچنین، الگوریتم پیشنهادی، با استفاده از خاصیت هموفیلی شبکه های پیچیده، ایده استفاده از ویژگی چگالی همسایگان مشترک دو گره در شبکه های اجتماعی را مطرح نموده است. این ایده که بر مبنای خاصیت هموفیلی شبکه های پیچیده بنا نهاده شده و توسط معیار مشابهت ساختاری جاکارد قابل محاسبه است، دو فرد در یک شبکه اجتماعی را هر چقدر دارای دوستان مشترک بیشتری باشند، به لحاظ شخصیتی شبیه تر می پندارد. از دیدگاه الگوریتم پیشنهادی، مشابهت گره های گراف، نه به عنوان معیاری مجزا، بلکه به عنوان بستر و زیرساخت ارتباط بین گره ها می باشد. به همین دلیل، الگوریتم پیشنهادی، با وزن دار نمودن یال های گراف، در شناسایی اجتماعاتی که نه تنها به لحاظ ساختاری با یکدیگر ارتباط قوی دارند، بلکه به لحاظ معنایی نیز با یکدیگر مرتبطند اقدام می کند. نتایج حاصل از مقایسه زمان اجرای الگوریتم پیشنهای و روش های مشابه بر روی مجموعه داده های آزمایشی دنیای واقعی و نیز محک تحلیلی، حاکی از بهبود زمان اجرای الگوریتم می باشد. همچنین، استفاده از مشابهت ویژگی های گره ها در شناسایی اجتماعات، منجر به کاهش آنتروپی و همگن تر شدن اجتماعات شناسایی شده نسبت به روش های مشابه و نیز نسبت به الگوریتم پیشنهادی، بدون استفاده از ویژگی ها می باشد.