نام پژوهشگر: هادی رمضانی
هادی رمضانی احمد فراهی
با وجود حجم بالای اطلاعات متنی، نیازمند سیستمی کارا جهت دسته بندی خودکار متون داریم. بنابراین، باید دسته بندی را طوری انجام داد که ضمن افزایش دقت، سبب کاهش زمان و هزینه شود. فرایند دسته بندی متون دارای گامهای پیش پردازش، وزن دهی، کاهش ویژگی و دسته بندی است که برای هر گام روشهای مختلفی تا کنون ارائه شده است. یکی از گامهای تعیین کننده در دسته بندی، کاهش ویژگیها است. این موضوع در زبان فارسی به دلیل وجود ویژگیهای زیاد و تکراری و دارای معانی نزدیک، فرایندی با پیچیدگی قابل ملاحظهای میباشد. با توجه به اهمیت این موضوع، ایده اصلی ما بهبود عملکرد از طریق استخراج بهترین ویژگیها از متون فارسی است که برای این منظور به ارائه روشی با استفاده از تجزیه و تحلیل مولفههای اصلی (pca)و روش ترکیبی، از دو الگوریتم مطرح جستجوی تکاملی genetic و pso پرداختیم، بدین ترتیب میتوان از مزیت جستجوی سراسری در genetic و و قابلیت جستجوی موضعی در pso جهت کاهش ویژگیهای استخراج شده با هم تجمیع کرد و برای افزایش دقت و کاهش زمان محاسباتی به کار برد. نتایج حاصل از به کارگیری روش پیشنهادی نشان دهنده بهبود عملکرد و کاهش مدت زمان قابل توجهی در تست، بر روی متون فارسی با روش دسته بندی نزدیکترین همسایه میباشد. همچنین در مقایسه با روشهای مشابه، روش ارائه شده عملکرد بهتری از خود نشان داده است. این موضوع در زبان فارسی به دلیل وجود ویژگیهای زیاد و تکراری و دارای معانی نزدیک، فرایندی با پیچیدگی قابل ملاحظهای میباشد. با توجه به اهمیت این موضوع، ایده اصلی ما بهبود عملکرد از طریق استخراج بهترین ویژگیها از متون فارسی است که برای این منظور به ارائه روشی با استفاده از تجزیه و تحلیل مولفههای اصلی (pca)و روش ترکیبی، از دو الگوریتم مطرح جستجوی تکاملی genetic و pso پرداختیم، بدین ترتیب میتوان از مزیت جستجوی سراسری در genetic و و قابلیت جستجوی موضعی در pso جهت کاهش ویژگیهای استخراج شده با هم تجمیع کرد و برای افزایش دقت و کاهش زمان محاسباتی به کار برد. نتایج حاصل از به کارگیری روش پیشنهادی نشان دهنده بهبود عملکرد و کاهش مدت زمان قابل توجهی در تست، بر روی متون فارسی با روش دسته بندی نزدیکترین همسایه میباشد. همچنین در مقایسه با روشهای مشابه، روش ارائه شده عملکرد بهتری از خود نشان داده است.
هادی رمضانی رضا سلامی
چکیده ندارد.