نام پژوهشگر: معصومه مومن نژاد
معصومه مومن نژاد اکبر فرهودی نژاد
روش های مختلف واردکردن اطلاعات و رکوردها از منابع مختلف به پایگاه داده باعث به وجود آمدن رکوردهای تکراری می شود که این امر باعث افزایش حجم پایگاه داده می گردد که معمولاً خطاهایی را شامل می شود که عبارت اند از:خطاهای تایپی، اطلاعات ناقص، نادیده گرفتن فرمت های استاندارد و یا هر ترکیبی از عامل های فوق. یکی از مهم ترین بخش های موجود در پایگاه داده های تجاری، اطلاعات مربوط به اسامی افراد و آدرس پستی آنان است که بدون افزایش کیفیت داده ای این اطلاعات امکان پیاده سازی پایگاه داده های ملی میسر نخواهد شد. مثلاً گاهی اوقات اطلاعات واردشده استاندارد خاصی را رعایت کرده اند اما در جای صحیح وارد نشده است مانند واردکردن یک کد پستی صحیح در مقابل آدرسی که به آن تعلق ندارد لذا ثبت کردن درست و کامل اطلاعات مورد نیاز، اهمیت ویژه ای دارد زیرا امکان استفاده مجدد از داده در آینده وجود دارد. هدف این پروژه دستیابی به این مهم است. در این پایان نامه ابتدا به بررسی روش های تطبیق فیلد پرداخته شده است و زمان اجرای یکی از الگوریتم های آن را بهبود داده ایم و نیز روشی جدید بر مبنای الگوریتم ژنتیک و همچنین برنامه ای جهت بررسی صحت تعلق آدرس به کد پستی درج شده در مقابل آن، ارائه شد که منطبق با تقسیمات جدید کشوری است و برای اولین بار در ایران مورد آزمایش قرار می گیرد و از نسخه کدیاب مورد استفاده در سایت پست جمهوری اسلامی ایران کامل تر می باشد.