نام پژوهشگر: علیرضا بهالگردی
علیرضا بهالگردی امیر مانیان
در ابتدا، دلایل ظهور و رایج شدن داده کاوی به عنوان یکی از مهم ترین گام های کشف دانش در پایگاه داده ها مورد توجه قرار می گیرد. مطالعه موردی ما یعنی دسته بندی گاوها به لحاظ سختی یا سهولت زایش و پیش بینی در این زمینه، یک کاربرد نوین از داده کاوی به شمار می آید که به تشریح و بیان ضرورت انجام آن، خواهیم پرداخت. پس از آن به پیشینه تاریخی داده کاوی، برخی کاربردها، توصیف فرایند kdd، دسته بندی عملکردها و تکنیک-های داده کاوی و بیان مجمل دسته بندی، پیش بینی و خوشه بندی می پردازیم. با ارائه ی تعریف سخت زایی و مرور عوامل موثر بر آن در تحقیقات حوزه ی علوم دامی و نیز نگاهی به برخی کارهای آماری و داده کاوی انجام شده در این راستا، به بیان چالش های پیش رو، همچون چند کلاسه بودن مسئله و نامتوازن بودن داده ها خواهیم پرداخت و در این زمینه نیز سوابق راه کارهای بر مبنای داده کاوی را بیان خواهیم داشت. سپس با توجه به چالش های مذکور، روش هایی برای ارائه پیش بینی مطرح و به کار گرفته می شود. برمبنای تحلیل نتایج، استفاده از درخت تصمیم c4.5 به صورت حساس به هزینه، به عنوان راه حل محوری پیشنهاد می گردد. پس از آن تعدادی از روشهای انتخاب یا کاهش نمونه برای بهبود راه حل ارائه شده، به کار گرفته می شود. بر اساس ارزیابی ها، ملاحظه خواهیم نمود بهترین کارایی را روش تلفیقی ما کسب می نماید. ما این روش را osts-fcnn نامیدیم.این روش با اعمال تغییرات روی روش oss و ترکیب آن با روش fcnn به وجود آمده است.