نام پژوهشگر: علی زینل همدانی
شکیبا خادم القرانی علی زینل همدانی
داده کاوی یک شیوه نوین برای استخراج اطلاعات در فرایند تصمیم گیری های علمی است و اغلب از روشهای آماری و یادگیری ماشین برای تجزیه و تحلیل داده ها استفاده مینماید. یک رویکرد جدید رد این راستا ترکیب شیوه های آماری و یادگیری ماشین برای کسب اطلاعات بیشتر از استفاده جداگانه هر یک میباشد. در این پایان نامه فرایند داده کاوی رگرسیون لجستیک و درختهای تصمیم معرفی میشوند و با ترکیب cart یکی از الگوریتمهای درختهای تصمیم با رگرسیون لجستیک چندگانه شیوه نوینی برای تحلیل داده های چند رسته ای ارائه میگردد. سپس این روش ابداعی را برای داده های واقعی خط تولید ورق فولاد به کار گرفته که نتایج نشان میدهند تحلیل داده ها کاراتر و حاوی اطلاعات سازنده تر به خصوص برای پاسخهای رسته ای ترتیبی میباشد.
محمد حامد موحدی علی زینل همدانی
کشف داده پرت مرحله مهمی در پیش پردازش داده ها است و نتایج داده کاوی وابسته به انجام صحیح آن می باشد. در کشف داده پرت، داده هایی که با سایر داده ها تفاوت زیادی دارند و رفتار داده های معمولی را نشان نمی دهند، شناسایی شده و حذف می گردند. مراحل بعدی داده کاوی تنها بر روی داده های معمولی انجام می شوند. چنانچه داده های پرت حذف نشوند و همراه با داده های معمولی پردازش شوند، ممکن است مدل نا صحیحی ایجاد کنند و مدل نهایی بیانگر رفتار معمول نمونه ها نباشد. حذف این داده ها در حالی صورت می-گیرد که در برخی موارد تعداد داده های پرت زیاد است یا این داده ها دارای ارزش و مفهوم خاصی هستند. در این تحقیق به بررسی استفاده از داده های پرت در چنین مواردی پرداخته خواهد شد تا مشخص شود که آیا پردازش جداگانه این داده ها می تواند سودمند باشد یا خیر. به این منظور روش های داده کاوی به طور جداگانه بر روی داده های معمولی و پرت اعمال می شوند تا مدل یا مدل هایی برای بیان رفتار هر گروه حاصل شود. برای ارزیابی نتایج از دقت استفاده می شود و دقت روش پیشنهادی، که پردازش جداگانه داده-های معمولی و پرت است با روش معمول که همان حذف داده های پرت است مقایسه می گردد. در این راستا از چهار مجموعه داده استاندارد که معمولاً در کشف داده پرت استفاده می شوند یعنی german credit، wdbc، pima indian diabetes و bcw یک مجموعه داده ساختگی بهره برده می شود. بر طبق پیاده سازی های انجام شده پردازش این داده ها حداقل به روشی که در این تحقیق مورد استفاده قرار گرفته است، به عنوان یک روش معمول، مناسب نیست.
آزاده باغشاهی اکبر توکلی
هدف از این پژوهش تجزیه رشد بهره وری کل عوامل تولید به پیشرفت تکنولوژی و تغییرات کارایی فنی، در ایران است. در جهت دستیابی به این هدف اقدام به برآورد تابع تولید مرزی تصادفی به فرم ترانسلوگ و مدل آثار عدم کارایی کردیم. تابع تولید فوق الذکر با استفاده از داده های سری زمانی سال های 1386-1338 و روش حداکثر درستنمایی (mle) تخمین زده شده است و مدل آثار عدم کارایی با وجود r&d به عنوان عامل موثر بر کارایی تخمین زده شد. نتایج تحقیق نشان می دهد که کارایی فنی علیرغم فراز و نشیب ها در طول دوره مورد بررسی روند صعودی دارد همچنین سهم تغییرات کارایی فنی دررشد بهره وری کل عوامل بیش از پیشرفت تکنولوژی است. رشد بهره وری کل عوامل نیز در اواخر دوره زمانی مورد بررسی بیشتر است.