نام پژوهشگر: علی‌اکبر نیک‌نفس

کاربرد محاسبات دی.ان.ای در حوزه داده کاوی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده فنی 1391
  رامین معاذالهی   علی اکبر نیک نفس

در سال های اخیر قدرت محاسبات دی.ان.ای در حل مسائل پیچیده کامپیوتری به اثبات رسیده است. به دلیل قدرت پردازش موازی بسیار زیاد مولکو ل های دی.ان.ای، امکان جستجوی تمام فضای را ه حل با استفاده از عملگرهای بیولوژیکی میسر می شود. در این تحقیق دو روش بر پایه محاسبات دی.ان.ای برای دسته بندی داده ها و استخراج قوانین همبستگی که در حوزه داده کاوی مطرح می شوند پیشنهاد می کنیم. در روش اول نشان می دهیم که چگونه می توان مدل دسته بندی داده ها را با استفاده از رشته های دی.ان.ای تولید کرده و با اعمال توالی از عملگرهای بیولوژیکی روی مدل ایجادشده، دسته بندی داده های جدید را انجام داد. نتایج شبیه سازی روش پیشنهادی روی پنج مجموعه داده از uci و مقایسه با روش c5.0، برتری روش پیشنهادی را از لحاظ دقت دسته بندی نشان می دهد. در روش دوم نشان می دهیم که چگونه می توان به طریق مشابه کلیه قوانین همبستگی را با استفاده از رشته های دی.ان.ای تولید کرده و با اعمال توالی از عملگرهای بیولوژیکی، قوانینی که حداقل پشتیبان و اطمینان تعیین شده را ارضا می کنند در زمان چندجمله ای استخراج کرد. لازم به ذکر است که استخراج کلیه قوانین همبستگی در کامپیوترهای سیلیکونی در بدترین حالت دارای پیچیدگی زمانی نمایی است، بنابراین مزیت روش پیشنهادی آشکار می شود.

رتبه بندی چندتایی قوانین استخراج شده از داده کاوی با استفاده از الگوریتم ژنتیک
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی صنعتی کرمان - دانشکده برق و کامپیوتر 1392
  بهزاد ربیعی قهفرخی   علی اکبر نیک نفس

با توجه به گسترش روز افزون داده ها در پایگاه های داده و ناتوانی مغز انسان در تجزیه و تحلیل این داده ها و به وجود آمدن چالشی جدید به نام انفجار اطلاعات در عصر حاضر، نیاز به ابزاری که بتوان با استفاده از آنها کاستی ها و نقایص بیان شده را به حداقل رساند، به شدت احساس می¬شود. امروزه در زمینه¬ی پایگاه های داده فرآیندی به وجود آمده است که آنرا داده کاوی می¬نامند. هدف از داده کاوی کشف و استخراج دانش مفید از بین انبوه داده هاست. استخراج قوانین یکی از متداول ترین روش ها برای تولید الگو از بین داده ها است. به عنوان مثال قوانین کلاس بندی و انجمنی می توانند به عنوان خروجی های یک مجموعه داده در نظر گرفته شوند. بعد از استخراج قوانین، تعدادی قانون دسته بندی "اگر...آنگاه..." وجود خواهد داشت که با یکدیگر متفاوت هستند. میزان جذابیت و ارزش این قوانین با یکدیگر برابر نیست. علاوه بر این از بین قوانین استخراج شده تنها تعدادی محدود برای پیاده سازی ها مورد استفاده قرار می گیرد که به دلیل کمبود بودجه، زمان و منابع در دسترس است. در این پژوهش با استفاده از الگوریتم ژنتیک و مجموعه داده¬ی در زمینه ی بازار بورس ایران و با استفاده از درخت تصمیمی به نام c5.0 یک روش رتبه بندی چندتایی معرفی می¬کنیم. این روش قوانین استخراج شده توسط درخت تصمیم را به صورت کدهایی در ژن های هر کروموزوم نگاشت می¬کند و قوانین برتر را با توجه به تابع برازشی به نام تعداد رکوردهای به درستی پیش بینی شده استخراج می کند. پس از استخراج قوانین برتر، نتایج را با چندین روش رتبه بندی مورد مقایسه قرار داده و روش پیشنهادی برتری مطلقی را نسبت به تمامی روش ها نشان می دهد.

ارائه ی الگویی بهبود یافته برای طبقه بندی مستندات متنی موجود
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده فنی 1392
  محبوبه ضیایی   علی اکبر نیک نفس

امروزه حجم قابل توجهی از اطلاعات موجود در قالب متن ذخیره شده اند؛ بنابراین استفاده از ابزار هایی که به استخراج دانش از میان این دریای عظیم داده های بپردازد اهمیت زیادی پیدا کرده است. ذات غیر ساخت یافته ی متون باعث شده که متنکاوی نیاز به مرحله ای مهم به نام پیش پردازش داشته باشد؛ هرچه پیش پردازش قوی تری داشته باشیم نتایج بهتری را در سایر مراحل خواهیم داشت. در این پایان نامه سعی شده به حل چالش ها و مسائل حوزه پیش پردازش و در نهایت طبقه بندی متون بپردازیم؛ از جمله دستاورد های این پایان نامه می توان به موارد زیر اشاره کرد:یک روش جدید وزن دهی ویژگی، مخصوص طبقه بندی مستندات ارائه شده است. مقایسه ی این روش با روش های وزن دهیtfidf، tfrf، tfcrf نشان دهنده ی کارایی خوب این روش نسبت به سایر روش ها می باشد. از روش ارائه شده برای ارائه یک روش حذف خودکار کلمات زائد متن، استفاده گردیده است؛ سپس تاثیر حذف کلمات زائد با استفاده از روش پیشنهادی و با استفاده از لیست از قبل تهیه شده را بر روی طبقه بندی مقایسه نموده ایم،که نتایج گویای بهبود کارطبقه بند در هنگام استفاده از روش پیشنهادی بوده است. با توجه به اهمیت وجود دیکشنری برای طبقات مستندات، الگوریتمی جدید برای استخراج دیکشنری ارائه و سپس ارزیابی شده است. در پایان الگوریتمی جدید برای طبقه بندی مستندات ارائه نموده ایم، که این الگوریتم را با روش های متفاوت وزن دهی مورد بررسی قرار دادیم. در ادامه با طبقه بندی تصادفی اولیه ی متفاوت نیز الگوریتم پیشنهادی را بررسی کردیم که تمامی نتایج به دست آمده گویای کارایی بالای این الگوریتم می باشد. همچنین در انتها نیز به ارزیابی عملکرد الگوریتم پیشنهادی نسبت به سایر الگوریتم ها پرداختیم، که الگوریتم پیشنهادی دارای بهترین کارایی در بین سایر الگوریتم ها بود.تمامی موارد ذکر شده را پیاده سازی و در قالب سیستمی نرم افزاری ارائه نموده ایم.

شبیه‏ سازی مدارهای منطقی در محاسبات دی‏.ان‏.ای
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده فنی 1392
  ویدا عابدی فریزنی   علی اکبر نیک نفس

چشم انداز برنامه‏ نویسی سیستم‏ های مولکولی برای اجرای عملیات و قدرت پردازش موازی مولکول‏ های دی.ان.ای، محققان را به سوی طراحی مدارهای بیوشیمیایی ترکیبی جذب کرده است. از آنجاکه ساخت رایانه‏ ای با قدرت پردازش موازی خواسته‏ ی این تکنولوژی بوده است، رایانه مولکولی نقطه عطفی در این مسیر محسوب می‏ گردد. در این تحقیق ابتدا یکی از پیشرفته‏ ترین مدل ‏های موجود، تشریح شده است. سپس، با استفاده از این مدل یک واحد محاسباتی-منطقی مولکولی شبیه‏ سازی شد. این شبیه‏ سازی، مشکلات موجود در این مدل را آشکار ساخت، بنابراین یک مدل جدید برای رفع مشکلات مذکور پیشنهاد شد. در الگوریتم پیشنهادی اول با استفاده از مکانیزم زیستی جابجایی ‏رشته، گیت ‏ها مطابق جدول صحتشان ساخته شدند. گیت‏ های ساخته شده با این الگوریتم، در‏حضور ورودی، خروجی خود را خودبه‏ خود و بدون آنزیم، آزاد می‏ کنند. این روند، مشابه عملکرد گیت‏ ها، در مدارهای سیلیکونی است. در این الگوریتم، ساختار مجزایی برای صفر و یک منطقی تعریف شد. این الگوریتم با کاهش چشمگیر پیچیدگی مدارها، باعث بهبود زمان اجرا شده است. گیت منطقی nand برای ساخت مدارهای ترکیبی، یک گیت کامل است، لذا الگوریتم دوم برای ساخت این گیت پیشنهاد شد. در این روش، طبق رشته ورودی ساخته ‏شده، خروجی استنتاج می‏ شود. این الگوریتم سرعت بالایی نسبت به روش‏ های قبل خود دارد. مزیت مشترک گیت‏ های دو الگوریتم مذکور، قابلیت استفاده مجدد آنهاست که در بسیاری از روش‏ های گذشته محقق نشده است.

شناسایی الگوهای سفارشات خرید در شبکه توزیع کالا از طریق داده کاوی (مطالعه موردی شرکت توزیع کننده کالا در استان گلستان)
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی صنعتی کرمان - دانشکده مهندسی برق و کامپیوتر 1393
  یاشار گرگانی   علی اکبر نیک نفس

توزیع کننده ها سازمان هایی هستند که محصولات را از تولیدکننده ها می خرند و به خرده فروش ها می فروشند. خرده فروش ها محصولاتی را سفارش می دهند که مصرف کنندگان نهایی می خرند. بنابراین توزیع کننده ها نیازهای مصرف کنندگان نهایی را براساس سفارشات خرده فروشان حدس می زنند. داده کاوی ابزاری است که به کشف قواعد و یا الگوهای مخفی از حجم زیاد داده کمک می کند. با توجه به اهمیت توزیع کنندگان در کل کانال توزیع، در این پرژه سعی شده است رفتارهای سفارشات خرده فروشان با استفاده از ابزارهای داده کاوی درک شود. در این پروژه ابتدا مشتریان یک شرکت توزیع کننده کالا (خرده فروشان) براساس اقلامی که سفارش داده اند، بخش بندی شدند. برای بخش بندی، مشتریان براساس سفارشاتشان خوشه بندی گشتند. سپس الگوهای خرید هر بخش شناسایی گردیدند. از استخراج قواعد همبستگی برای شناسایی الگوهای خرید استفاده شده است. در نهایت برای هر الگو یک درخت تصمیم ایجاد گشت که شرایطی را که در آن خرده فروشان طبق این الگو سفارش می دهند نشان می دهد. طبق الگوهای کشف شده، بسته های تجاری برای مدیران شرکت توزیع کننده کالا ارائه گشته است. این بسته ها در تصمیم گیری به مدیران تجاری کمک خواهد کرد.