نام پژوهشگر: رامین معاذالهی
رامین معاذالهی علی اکبر نیک نفس
در سال های اخیر قدرت محاسبات دی.ان.ای در حل مسائل پیچیده کامپیوتری به اثبات رسیده است. به دلیل قدرت پردازش موازی بسیار زیاد مولکو ل های دی.ان.ای، امکان جستجوی تمام فضای را ه حل با استفاده از عملگرهای بیولوژیکی میسر می شود. در این تحقیق دو روش بر پایه محاسبات دی.ان.ای برای دسته بندی داده ها و استخراج قوانین همبستگی که در حوزه داده کاوی مطرح می شوند پیشنهاد می کنیم. در روش اول نشان می دهیم که چگونه می توان مدل دسته بندی داده ها را با استفاده از رشته های دی.ان.ای تولید کرده و با اعمال توالی از عملگرهای بیولوژیکی روی مدل ایجادشده، دسته بندی داده های جدید را انجام داد. نتایج شبیه سازی روش پیشنهادی روی پنج مجموعه داده از uci و مقایسه با روش c5.0، برتری روش پیشنهادی را از لحاظ دقت دسته بندی نشان می دهد. در روش دوم نشان می دهیم که چگونه می توان به طریق مشابه کلیه قوانین همبستگی را با استفاده از رشته های دی.ان.ای تولید کرده و با اعمال توالی از عملگرهای بیولوژیکی، قوانینی که حداقل پشتیبان و اطمینان تعیین شده را ارضا می کنند در زمان چندجمله ای استخراج کرد. لازم به ذکر است که استخراج کلیه قوانین همبستگی در کامپیوترهای سیلیکونی در بدترین حالت دارای پیچیدگی زمانی نمایی است، بنابراین مزیت روش پیشنهادی آشکار می شود.