نام پژوهشگر: یلدا مظاهر
یلدا مظاهر سمیه علیزاده
در سال های اخیر داده کاوی، روش تحلیلی فعالی در حوزه های علمی مختلف بوده است. یکی از این حوزه ها، پیش بینی تأخیر قطار است. برای پیش بینی تأخیر قطار باید داده های گذشته تأخیر قطار تحلیل شوند. هدف این تحقیق ارائه یک رویکرد داده کاوی ترکیبی برای پیش بینی تأخیر قطارهای مسافری با صحت بالا و استخراج قواعد تأخیر است. این رویکرد ترکیبی، از مزایای هر دو روش شبکه عصبی مصنوعی و درخت تصمیم استفاده می کند. شبکه عصبی مصنوعی قدرت مواجهه با داده های مغشوش را دارد؛ درحالیکه، درخت تصمیم به ایجاد قواعدی می پردازد که درک آنها آسان است. در این رویکرد، ابتدا داده های مغشوش با استفاده از شبکه عصبی مصنوعی حذف شده اند. بنابراین، مجموعه داده جدید از مجموعه داده اولیه خالص تر است و برای ایجاد قواعد مناسب تر می باشد. سپس، مجموعه داده جدید به سه قسمت: مجموعه داده آموزشی، آزمایشی و اعتبارسنجی تقسیم شد. در نهایت، درخت تصمیم بر اساس این سه مجموعه ساخته شده است. این تحقیق شامل 196816 رکورد تأخیر است که از پایگاه داده تأخیر قطارهای مسافری شرکت رجاء انتخاب شده است و شامل داده های هشت محور از سال های 1386 تا 1390 می باشد. رویکرد پیشنهادی روی این محورها به طور جداگانه اعمال شده است تا رفتار تأخیر محورهای مختلف به سادگی قابل تمایز باشد. صحت پیش بینی رویکرد پیشنهادی با درخت تصمیم اولیه مقایسه شده است. این مقایسه یک بار بدون درنظرگرفتن داده های غربال شده صورت گرفته است که در این حالت، نتایج نشان داد که صحت پیش بینی رویکرد پیشنهادی بیشتر از درخت تصمیم اولیه است. بار دیگر این مقایسه با این فرض که داده های غربال شده، توسط مدل پیشنهادی به طور تصادفی پیش بینی می شوند، صورت گرفته است. در این حالت، صحت پیش بینی مدل پیشنهادی از درخت تصمیم اولیه کمتر شده است.