نام پژوهشگر: محمدعلی بالافر

آنالیز و پیش بینی زلزله تبریز با استفاده ازداده کاوی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده برق و کامپیوتر 1393
  علی خیری   محمدعلی بالافر

وجود گسل شمال تبریز و زلزله¬های مهیب تاریخی آن نشان می¬دهد که این منطقه یکی از مناطق مهم لرزه¬خیز ایران می¬باشد. در این پایان¬نامه گسل شمال تبریز و داده¬های لرزه¬ای جمع¬آوری شده این ناحیه مورد مطالعه قرار گرفته است. پیش¬بینی زمین¬لرزه یکی از چالش¬های امروزی بشر می¬باشد که اگر بتوان به نتایج علمی و موفق رسید یک پیشرفت برجسته به حساب می¬آید. این پژوهش از تکنیک¬های مختلف داده¬کاوی برای تحلیل داده¬ها استفاده کرده است. ابتدا داده¬های لرزه¬ای در این منطقه جمع¬آوری و قبل از استفاده پیش¬پردازش¬های لازم روی داده¬ها انجام گرفته است. سپس به آنالیز و پیش¬بینی مهمترین پارامترهای مخاطرات لرزه¬ای از جمله بزرگی و زمان وقوع زمین لرزه¬ها پرداخته شده است. از بین الگوریتم¬های استفاده شده برای تخمین بزرگا با مقادیر پیوسته، الگوریتم vote که در زیرپردازش خود از الگوریتم¬های رگرسیون خطی، شبکه عصبی پس انتشار خطا و درخت تصمیم¬گیری w-m5p بهره می¬برد کمترین ریشه میانگین خطا را به خود اختصاص داد و از بین الگوریتم¬های پیش¬بینی¬کننده بزرگا با مقادیر گسسته، الگوریتم classification by regression که در زیرپردازش خود از شبکه عصبی پس¬انتشار خطا با یک لایه مخفی شامل سه نرون استفاده می¬کند دارای بیشترین مقدار دقت پیش¬بینی می¬باشد. بهترین الگوریتم¬های پیش¬بینی¬کننده زمان وقوع زمین لرزه¬ها از بین الگوریتم¬های مختلف استفاده شده برای این منظور الگوریتم¬های رگرسیون خطی و k- نزدیکترین همسایگی کمترین خطا را به خود اختصاص دادند.

داده کاوی رفتار مشترکین شرکت مخابرات ایران (همراه اول)
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده برق و کامپیوتر 1393
  سعید شیرمحمدی   محمدعلی بالافر

امروزه، حجم انبوه اطلاعات و تعاملات پیچیده، داده¬کاوی را به قدرتمندترین ابزار جهت سودآور نمودن سازمان¬ها و جلوگیری از ورشکستگی تبدیل نموده است. رقابتی شدن بازارهای جهانی و منطقه ای، شرکتها را مجبور به ایجاد مزیت¬¬های رقابتی در تولید، ارائه خدمات ، افزایش رضایت¬مندی و جذب بیشتر مشتریان نموده است. با رقابتی شدن خدمات مخابراتی مدیریت ارتباط با مشتری در این بخش اهمیت زیادی یافته است. با توجه به اینکه حجم بسیار عظیمی از داده¬های مخابراتی علی¬الخصوص جزئیات مکالمات تلفن¬های همراه وجود دارد که عملاً از آنها استفاده نمی¬شود، بکارگیری تکنیک¬های داده¬کاوی روی این داده ها باعث کشف دانش نهفته در آنها در مورد رفتار مشترکین گردیده و باعث پیش¬گویی رفتارشان می گردد. لذا داده¬کاوی از مهمترین روش¬های مدیریت علمی و موثر ارتباط با مشتری، جهت افزایش سوددهی و رضایت¬مندی مشتری می¬باشد. صنعت ارتباطات، یکی از صنایعی است که در سطح دنیا بسیار رقابتی بوده و در کشور ما هم اخیراً رقابتی شده است لذا ارزش حفظ مشترکین جاری برای شرکت مخابرات ایران افزایش یافته است . فرسایش (churn) در بازاریابی موبایل، یک مسئله درجه یک بوده و بیشترین دغدغه ارائه¬دهندگان خدمات (provider ها) می باشد. در این پایان¬نامه ما از داده¬های مربوط به صورت¬حساب مشترکین جهت تشخیص churn استفاده کرده و از الگوریتمهای مختلف بهره گرفتیم و نهایتاً آن ها را با هم مقایسه کرده و روش بهینه را انتخاب کردیم. در این پایان نامه با استفاده از صورتحساب مشترکین، به تشخیص مشترکینی که دچار فرسایش (churn) شده¬اند، پرداختیم. جامعه آماری در این تحقیق شامل تلفن های دائمی همراه اول استان آذربایجان شرقی، شامل خدود 600000 مشترک می¬باشد که داده¬های مورد مطالعه در این تحقیق مربوط به شش ماهه اول سال 93 تلفن همراه دائمی استان می¬باشند. در نهایت اگر بتوانیم مشتری را بشناسیم، طبقه¬بندی کنیم، نیازهایشان و گرایشاتشان را بفهمیم خواهیم توانست بموقع با اتخاذ تدابیر لازم از ریزش آنها ممانعت بعمل آوریم و همه آنها با داده¬کاوی رفتار مشتریان بدست می آید. در خاتمه باید اذعان داشت که مسأله مورد طرح، مربوط به یک واقعیت در شرکت¬های مخابراتی امروزی می باشد که مدیران ارشد سازمان در تصمیم¬گیری¬های کلان خود از آن رنج می¬برند. با توجه به ماهیت این شرکتها، چنین نتایجی از اهمیت زیادی برخوردار است چرا که موجب حفظ سرمایه، حفظ مشتری، پویائی و انعطاف¬پذیری شرکت در ارائه خدمات بهتر می¬شود.

بررسی و مقایسه روش های انطباق و بهبود پرس وجو برای موتورهای جستجو در محیط وب
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده برق و کامپیوتر 1393
  رضا خداپی   محمدعلی بالافر

پرس وجوهای مبهم و کوتاه ارسالی به موتور جستجوها، به بازیابی نتایج غیرمرتبط منجر می شود. روش های انطباق پرس وجو سعی می کنند تا پرس وجوها را ابهام زدایی کنند و پرس وجو را با نیازهای اطلاعاتی کاربر منطبق کنند. بسط پرس وجو یکی از روش های انطباق پرس وجو است که سعی دارد کلمات مرتبطی را به پرس¬وجو اضافه کند، که می توان کلمات بسط را به صورت محلی و سراسری انتخاب کرد. بسط پرس وجو معمولا کارایی سامانه های بازیابی اطلاعات را افزایش می¬دهد. بازخورد مرتبط (rf) و بازخورد شبه مرتبط (prf) روش های بسط پرس وجو هستند که به ترتیب از اطلاعات بازخورد کاربر و اسناد رتبه بالا در نتایج اولیه استفاده می کنند تا کلماتی مرتبط را به پرس وجو اضافه کنند. راه کارهای محلی برای بسط پرس وجو، از اسناد رتبه بالای نتایج اولیه در روش بازخورد شبه مرتبط استفاده می کنند، که به بهبود کارایی سامانه ی جستجو کمک می کند. راه کار خوشه بندی لی و کرافت سعی می کند تا از هم پوشانی خوشه های ساخته شده با الگوریتم knn، برای انتخاب اسناد مرتبط استفاده کند. راه کار پیشنهادی ما، از الگوریتم knn برای خوشه بندی اسناد نتایج اولیه استفاده می کند. برای رسیدن به خوشه های بهتر، از شباهت حساس به پرس وجو استفاده کرده¬ایم. اعضای خوشه ها رتبه بندی شده و خوشه ها نسبت به هم رتبه بندی می شوند تا بتوانیم اسناد بهتر را از خوشه های رتبه بالا انتخاب کنیم. اسناد مرتبط انتخاب شده با هم ترکیب می شوند و کلمات بسط از سند ترکیبی با تابع رتبه¬بندی tf-idf انتخاب می شوند. کلمات انتخاب شده به پرس وجو اضافه می شوند تا بازیابی با پرس وجو بسط-داده شده انجام گیرد. برای ارزیابی راه کار ارائه شده از مجموعه داده ی پزشکی med استفاده کرده ایم. نتایج آزمایشات نشان می دهد که راه کار پیشنهادی، کارایی را نسبت به بازیابی پایه vsm و بازخورد شبه مرتبط بهبود می دهد. کارایی با خوشه های ساخته شده با شباهت حساس به پرس وجو نسبت به شباهت مبتنی بر کلمه افزایش پیدا کرده است که نشان از موثر بودن شباهت حساس به پرس وجو در خوشه بندی اسناد نتایج اولیه دارد

معرفی یک مدل شبیه سازی مبتنی بر یادگیری تقویتی در شبیه سازی دسته ای
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده برق و کامپیوتر 1393
  روح الله وفایی   ناصر رضوی

شبیه سازی و مدلسازی، یکی از جنبه های بسیار مهم و گاها حیاتی، در بسیاری از زمینه های علمی و مهندسی هستند. شبیه سازی و بررسی سیستم های پیچیده معمولا کمک بزرگی را برای زندگی بهتر انسان ها فراهم آورده است. سیستم های پیچیده شامل دامنه ی بسیار بزرگی از مسائل است که از علوم مختلف برای پیشبرد اهداف آن مطالعات متنوعی صورت می گیرد. شبیه سازی کامپیوتری یکی از اهدافی است که در زمینه ی سیستم های پیچیده برای ارائه ی شبیه سازی های واقعی تر و کاراتر همیشه مطرح بوده است. روش های شبیه سازی مبتنی بر قانون یکی از مهم ترین رویکردها در شبیه سازی دسته ای است که به تعدد، تا به حال مورد استفاده قرار گرفته است. مطالعات جدید در این زمینه بیان داشته اند که شبیه سازی های مبتنی بر قانون دارای محدودیت هایی است که در مسائل بزرگ تر و پیچیده تر مشکلاتی را به همراه خواهد داشت. در پژوهش حاضر از روش یادگیری به جای استفاده از قوانین از پیش تعریف شده در شبیه سازی دسته ای استفاده شده است. با توجه به اینکه مفهوم یادگیری در ازدحام های دنیای واقعی نیز وجود دارد به نظر می رسد که استفاده از مفهوم یادگیری در شبیه سازی دسته ای باعث می شود شبیه سازی های واقعی تری داشته باشیم. همچنین با توجه به مشکلاتی که برای رویکردهای مبتنی بر قانون بیان شده است، سعی شده است تا با استفاده از ایده ی یادگیری در شبیه سازی دسته ای، قدمی در جهت رفع چالش ها برداشته شود. در پژوهش حاضر، پیاده سازی روش یادگیری تقویتی برای شبیه سازی تعدادی عامل در حوزه ی شبیه سازی دسته ای مورد مطالعه قرار گرفته است. در روش یادگیری تقویتی با یک رویکرد پاداش و تنبیه، عامل ها سعی می کنند تا رفتار درست و قوانین مختلف را یاد بگیرند. نتایج نشان داده اند که در یادگیری قوانین اصلی که مورد نظر بوده است (جدایی از برخورد با موانع و همسایگان، حرکت گروهی) عامل ها توانستند به یک کارایی مورد قبولی دست یابند. همچنین امکان پذیری استفاده از روش یادگیری در شبیه سازی، خود یک مزیت ذاتی نیز به شمار می رود.

داده کاوی در رسانه های اجتماعی به منظور پیش بینی بازار سهام
thesis دانشگاه آزاد اسلامی واحد گرمی - پژوهشکده برق و کامپیوتر 1393
  مرجان فتحی   محمدعلی بالافر

در این تحقیق از الگوریتمهای یادگیری ماشینی در پردازش زبان طبیعی استفاده شده است تا بدین طریق نظر عموم درباره سهام فردی را در رسانههای اجتماعی بررسی نموده و از این رهگذر ارتباط آن با تغییرات قیمت سهام را مورد بررسی قرار دهیم. همچنین بررسی ها و تحقیقاتی در خصوص ارتباط فعالیت کاربران در stocktwits در دو دوره زمانی خارج از ساعات کاری بازار سهام و در حین باز بودن بازار، با میزان تجارت سهام در روزی کاری بعد انجام شده است .سپس به بررسی این مورد که آیا می توان با استفاده ازنظرات کاربران در رسانه های اجتماعی قیمت سهام را پیش بینی کرد و یا خیر می پردازیم.

داده کاوی در انتخابات ایران
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده برق و کامپیوتر 1394
  علیرضا سهندی اسفنجانی   محمدعلی بالافر

چکیده ندارد.

تشخیص بیماری آلزایمر با استفاده از روش های آماری و یادگیری ماشین
thesis دانشگاه آزاد اسلامی واحد گرمی - دانشکده مهندسی کامپیوتر 1394
  رویا نورزاده   محمدعلی بالافر

بیماری آلزایمر (ad ) به عنوان شایع ترین نوع زوال عقل در سالمندان است که حدود 26 میلیون نفر را در سراسر جهان را تحت تاثیر قرار داده است. ساختارهای آناتومیک مختلف مغز مانند هیپوکامپوس و ضخامت قشر مغز تحت تاثیر بیماری آلزایمر قرار می گیرند و ویژگی های آتروفی آن ها مانند حجم، شکل و ضخامت می تواند به عنوان نشانگرها یا شاخص های بیماری آلزایمر مورد استفاده قرار بگیرد. در بین روش های مختلف تشخیص بیماری آلزایمر، روش تصویربرداری مغز میتواند با امکان نمایش دادن واضح تغییرات بافتهای مغز به عنوان روشی برای تشخیص زودهنگام بیماری آلزایمر مورد استفاده قرار بگیرد. انتخاب ویژگی های شاخص با وجود حجم بالای ویژگی های ضخامت بافت مغز مستلزم استفاده از روش های کاهش تعداد ویژگی است. در این پایان نامه برای کاهش تعداد ویژگی ها و انتخاب چندین زیرمجموعه از ویژگی های ضخامت بافت مغز از آزمون های آماری t و الگوریتم های انتخاب ویژگی مبتنی بر هسته sas ، sfs و fas استفاده شده است. هدف پایان نامه انتخاب زیرمجموعه ای از ویژگی های شاخص برای تفکیک و دسته بندی بیماران آلزایمر و افراد سالم با ارزیابی دقت طبقه بندی زیرمجموعه ها توسط الگوریتم های طبقه بندی و بررسی تاثیر تعداد ویژگی ها بر دقت طبقه بندی است. نتیجه که حاصل شده انتخاب زیرمجموعه ای با 30 ویژگی با بالاترین دقت است.

ارائه روشی برپایه متن کاوی برای استخراج اطلاعات آب و هوا
thesis دانشگاه آزاد اسلامی واحد گرمی - دانشکده مهندسی کامپیوتر 1394
  توحید باقری زنده دل   محمدعلی بالافر

با توجه به ازدیاد بیش از حد داده ها در فضای مجازی و همچنین زیاد شدن تعداد پایگاه های اینترنتی، داده های ساخت نیافته مانند داده های متنی و وب نیز روز به روز در حال افزایش هستند. با اکتشاف در این داده ها می توان الگوهای جذابی را از آن ها استخراج نمود. یکی از روش های استخراج الگو در این نوع داده ها روش های متن کاوی و داده کاوی می باشند که الگوریتم های متعددی را به منظور کشف دانش از داده های متنی موجود در وب محیا کرده اند. از طرف دیگر، هر روز نیاز بیشتری در خصوص استفاده از داده های موجود به منظور استخراج دانش و استفاده از این دانش در زندگی روزمره احساس می شود. بعنوان مثال می توان براساس داده ها و اخبار موجود آب و هوا که در وب سایت های مختلف منتشر می شوند، مدلی به منظور پیش بینی وضعیت آب و هوا بطور خودکار تهیه نمود که وضعیت لحظه ای آب و هوا را براساس استخراج متون و متن کاوی و با استفاده از روش های داده کاوی تحلیل نماید.

بخش بندی خودکار رگ های خونی شبکیه چشم
thesis دانشگاه آزاد اسلامی واحد گرمی - دانشکده کامپیوتر و فناوری اطلاعات 1393
  زهرا محمدی   محمدعلی بالافر

امروزه استفاده از پردازش تصویر جزء لاینفک بسیاری از تحلیل ها و اعمال جراحی در علم پزشکی محسوب می شود؛ بطوریکه در جراحی مدرن، بسیاری از عملیات های جراحی به خصوص در نواحی بسیار حساس مانند چشم، تقریباً بدون پردازش های اولیه بر روی تصویر انجام نمی شود. در این پایان نامه، روشی برای استخراج رگ های خونی موجود در شبکیه چشم، جهت بهبود دقت در شناسایی رگ های خونی و تفکیک صحیح پیکسل های رگ از پیکسل های غیر رگ، ارائه شده است. روش پیشنهادی راه حلی را ارائه می کند که در آن از نقشه برجستگی به منظور تشخیص مرزهای رگ استفاده می شود. این مرزها، سپس با استفاده از فیلتر گابور با یکدیگر تلفیق می شوند تا بتوانند فاصله میان دو مرز در یک را به عنوان عرض رگ پرکرده و به عنوان رگ قطعه بندی کنند. آزمایشات انجام گرفته بر روی پایگاه داده drive نشان می دهد که روش پیشنهادی در این پایان-نامه توانسته است عملکرد خوبی در تشخیص رگ با دقت 0.9798 و قدرت تفکیک رگ از غیر رگ با دقت 0.9646، ارائه کند.

پیش بینی تغییرات ارزش سهام با در نظر گرفتن تاثیر اخبار
thesis دانشگاه آزاد اسلامی واحد گرمی - دانشکده کامپیوتر و فناوری اطلاعات 1394
  رودابه حیدری مطلع   محمدعلی بالافر

در جهان امروز اینترنت و اخبار موجود در آن مانند سرمایه های جاری هستند که در اختیار همگان قرار می گیرند و هر کس بتواند اطلاعات موجود در آن را به نحو درست جمع آوری کرده مورد تحلیل دقیق قرار دهد می تواند به بهترین شکل از این سرمایه بهره مند شود. با استفاده از این اطلاعات و در راه رسیدن به سود مالی، تحلیل اخبار موجود در متن در راستای پیش بینی جهت تغییر قیمت سهام شرکت ها از اهدافی است که چندی است سازمان ها و افراد مختلف در پی آن هستند.

دسته بندی اسناد کوتاه برای استخراج کلمات کلیدی و گسترش پرسوجو ها
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده مهندسی برق و کامپیوتر 1394
  هادی مقدم زاده   محمدعلی بالافر

کاوش متن پردازشی است که برای پیدا کردن و بهبود اطلاعات از متن به کار می رود. با کاوش می توان اجرای جستجوها را با توجه به ارتباط یادگیری ماشین و بازیابی اطلاعات بهبود بخشید. برای مثال دسته بندی موضوعی اخبار، یکی از حیطه های تمرکز محققان برای استخراج داده های مهم از محیط های داده ای بزرگ است. به دلیل بالا رفتن محتوی ایجاد شده کاربران روی اینترنت، انواع متن های مختلفی با جذابیت بالا ایجاد شده اند که نیاز است از میان حجم عظیم داده ها, اطلاعات مورد نیاز استخراج گردد. برای این منظور نیاز به دسته بندی اسناد وجود دارد. در این تحقیق به استخراج اطلاعات از اسناد کوتاه که حاوی تعداد کمی کلمه هستند پرداخته شده است. بنابراین دانستن میزان اهمیت کلمات در داخل اسناد ضروری است که این کار از طریق استخراج کلمات کلیدی به وسیله تمرکز بر روی وزن دهی به روابط صورت گرفته است. وقتی از اسناد کوتاه استفاده می شود بزرگترین چالش در وزن دهی روابط این است که کلمات کلیدی در یک سند اغلب فقط یکبار تکرار می شوند که این کار را دشوار می سازد. در این تحقیق روش هایی برای وزن دهی کلمات ارائه کرده و بر اساس وزن های ارائه شده، اسناد ارزیابی می گردند. ارزیابی اسناد در سه مرحله صورت میگیرد: 1) دسته بندی اسناد 2) استخراج کلمات کلیدی برای تشخیص کلمات خیلی مهم از یک سند و 3) مدل سازی کلمات کلیدی وابسته به هم با هدف شناسایی لینک های مابین کلمات کلیدی و استفاده از آنها برای گسترش پرس وجوها. الگوریتمی که ارائه شده است با استفاده از روش k-means به دسته بندی اسناد می پردازد. بعد از انجام آزمایشات و بررسی های انجام شده نتایج حاصل شده است و مقایسه نتایج با دیگر روش های موجود نشان از برتری الگوریتم ارائه شده دارد.

استفاده از ویژگی های شکلی نواحی مهم رنگی در بازیابی تصویر
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس 1381
  محمدعلی بالافر   احسان الله کبیر

در این پایان نامه دو الگوریتم بازیابی تصویر رنگی براساس ویژگیهای شکلی نواحی مهم آنها ارائه می شود . در الگوریتم اول رنگ تصویر پرس و جو به 5 رنگ از پیش تعیین شده ، کاهش داده می شود و ناحیه بزرگتر از هر رنگ مشخص می شود. کاربر یکی از این 5 ناحیه را انتخاب می کند . تصاویری از پایگاه داده که بزرگترین ناحیه هم رنگ آنها به ناحیه انتخابی شبیه تر است ، بازیابی می شوند. در الگوریتم دوم ، رنگ تصویر پرس و جو به 5 رنگ غالب آن کاهش می یابد . 5 ناحیه بزرگتر از هر رنگ و 10 ناحیه بزرگتر از ترکیب های دو تایی رنگها مشخص می شوند . کاربر یکی از این 15 ناحیه را انتخاب می کند . تصاویری از پایگاه داده که یکی از 15 ناحیه آنها به ناحیه انتخابی شبیه تر است ، بازیابی می شوند. برای مقایسه نواحی از توصیفگرهای فوریه ، گشتاورهای پایا و هیستوگرام رنگ اصلی آها استفاده می شود. نتایج آزمایش این الگوریتم ها بر روی مجموعه ای شامل 120 تصویر گل ارائه و بررسی شده است .