نام پژوهشگر: سارا ابوالصدق
سارا ابوالصدق محمد صالح اولیاء
با توجه به رشد روز افزون پایگاه های اطلاعاتی، داده کاوی هر روز اهمیت بیشتری نسبت به گذشته پیدا می کند. در این میان استفاده از تکنیک های کشف دانش از منابع مختلف موجود و بدست آوردن الگوهای مناسب برای فهم عمیق داده ها می تواند پلکانی در جهت ارتقاء سطح دانش با سرعتی چشمگیرتر از قبل باشد. بعلاوه درک داده ها و کشف الگوهای موجود در آن ها باعث مرتفع شدن زمینه های مطالعاتی جدید برای جویندگان علم خواهد شد. هدف از انجام این مطالعه استفاده از تکنیک متن کاوی به منظور خوشه بندی ادبیات مهندسی صنایع می باشد. خوشه بندی بر روی 79329 چکیده، شامل مقالات مجلات معتبر بین المللی مربوط به 50 سال گذشته (1961 تا 2010 میلادی) انجام پذیرفته است. پس از کاربرد تکنیک های مختلف جهت آماده سازی داده های متنی، به کمک تکنیک خوشه بندی k-means خوشه هایی ایجاد شدند که توانایی تخصیص برچسب های موضوعی مجموعه های مهندسی صنایع را دارا شدند. موضوعات بدست آمده شامل 8 دسته ی: "مدیریت تولید و عملیات" ، "تحقیق در عملیات"، "سیستمهای هوش مصنوعی" ، "سیستمهای تولید پیشرفته" ، "مدیریت کیفیت و بهره وری" ، "فنآوری اطلاعات"، "مدیریت زنجیره تامین" و "موضوعات دیگر" می باشند. این موضوعات عمدتاً با دسته بندی های رایج پژوهش های مهندسی صنایع همخوانی داشتند و در مواردی نیز تکنیک خوشه بندی منجر به آشکار سازی عناوین جدید موضوعی از جمله عنوان "طراحی" شد. در نتیجه ایجاد دیکشنری از لغات با توجه به فراوانی لغات موجود در هر خوشه فراهم گردید. علاوه بر آن روند خوشه های بدست آمده در دهه های مختلف مورد بررسی قرار گرفت و مشخص شد که دو خوشه ی "تحقیق در عملیات" و "سیستم های هوش مصنوعی" در زمره ی موضوعات با بیشترین مشاهده در طول 5 دهه اخیر بوده ند و انتظار میرود که این موضوعات در آینده نسبت به دیگر موضوعات از رشد بیشتری برخوردار گردند. اعتبارسنجی خوشه ندی حاضر با استفاده از دو معیار معروف دقت و بازخوانی مورد ارزیابی قرار گرفت.