نام پژوهشگر: هادی تجلی زاده
هادی تجلی زاده علیرضا عصاره
پس از آن که در سال 1996 سشنا تکنولوژی ریزآرایه را کشف کرد، به یک باره حجم انبوهی از داده های مربوط به ژن انسان در اختیار محققین قرار گرفت. همین امر سرآغاز ایجاد شاخه ی جدیدی در علم بیوانفورماتیک برای تشخیص بیماری ها بویژه سرطان گشت. محققین توانستند با تحلیل داده های ریزآرایه و کلاس بندی ژن ها به نتایج مقبولی در زمینه ی تشخیص انواع مختلف سرطان برسند اما همچنان با چالش تعداد بسیار زیاد ویژگی های نامرتبط در داده های ریزآرایه روبرو هستند. از این رو تا به امروز روش های مختلفی برای انتخاب ژن های مرتبط با انواع بیماری ها معرفی و آزمایش شده اند که طبیعتاً هیچ کدام کامل و بدون خطا نبوده اند. علاوه بر انتخاب ژن ها، تکنیک استفاده شده برای دسته بندی داده ها نیز تأثیر مستقیمی بر نتایج نهایی خواهد گذاشت.به طور مثال، تکنیک های منفرد معمولاً در مقابل تکنیک های ترکیبی خطای بیشتری در تشخیص بیماری و دسته بندی داده ها دارند. از این رو این پایان نامه در صدد یافتن تکنیکی ترکیبی برای انتخاب ویژگی و دسته بندی داده ها است که علاوه بر حذف ویژگی های نامرتبط و ارائه ی دسته بندی قابل قبول دارای هزینه ی محاسباتی بالایی نباشد و با حداقل صرف زمان، بهترین نتیجه را فراهم آورد.?بدین منظور، ابتدا با استفاده از یک روش انتخاب ویژگی از نوع هیبرید مرتبط ترین ژن ها انتخاب شده و سپس با استفاده از یک تکنیک پیشنهادی دسته بندی کننده ی ترکیبی بر پایه ی ترکیب جنگل های تصادفی به دسته بندی داده ها پرداخته ایم و در نهایت نتایج اعمال این تکنیک را بر روی ? مجموعه داده ی ریزآرایه ی واقعی بررسی و این نتایج با ? روش دیگر انتخاب ویژگی و دو روش دسته بندی مقایسه گردید که در اکثر حالات، تکنیک پیشنهادی نتایج قابل قبول تری را فراهم آورده است.