نام پژوهشگر: بهزاد واحدی طرقبه

محاسبه و ارائه خودکار دقت هندسی و تمامیت عوارض خطی در اطلاعات مکانی مردم گستر
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده نقشه برداری 1393
  بهزاد واحدی طرقبه   علی اصغر آل شیخ

مزایای فراوان اطلاعات مکانی مردم گستر همچون دسترسی آسان به اطلاعات، قابلیت به روزرسانی سریع و امکان اصلاح خطاهای احتمالی موجود توسط کاربران، منجر به پیشرفت روزافزون این سیستم ها و افزایش شمار کاربران آن ها گردیده است. اما از آنجا که اغلب افراد غیرمتخصص تولید کننده این داده ها هستند، نظارتی بر نحوه تولید آن ها وجود ندارد و بنابراین کیفیت داده های تولید شده با چالش روبرو است. از همین رو و از بدو پیدایش مفهوم اطلاعات مکانی مردم گستر، کیفیت این اطلاعات بزرگ ترین محدودیت آن و محل بحث و تحقیق بسیاری از محققان بوده است. در این تحقیق سعی شده با ارائه روشی خودکار، کیفیت عوارض خطی داده های مردم گستر شهر تهران از طریق مقایسه آن ها با داده های مرجع (رسمی) ارزیابی شود. برای بیان برآوردی از کیفیت این داده ها، سه شاخص تمامیت، دقت هندسی و دقت توصیفی که از مهم ترین شاخص های کیفیت داده های مکانی به شمار می روند، در نظر گرفته شده اند.روش ارائه شده از چهار قسمت اصلی تشکیل شده است: تناظریابی خودکار بین عوارض مرجع و مردم گستر، محاسبه تمامیت داده، محاسبه دقت هندسی و محاسبه دقت توصیفی. خودکار بودن روش این قابلیت را به آن می دهد که بتوان منطقه وسیع تری را بررسی کرد. همچنین، با تغییراتی اندک در قسمت تناظریابی، از این روش می توان برای داده های مناطق مختلف استفاده کرد. علاوه بر این، ارزیابی سه جزء از اجزای کیفیت مکانی منجر به برآورد کامل تری از کیفیت نسبت به تحقیقات پیشین می شود.در قسمت اول، با استفاده از یک الگوریتم پنج مرحله ای عوارض مرجع و مردم گستر متناظر مشخص می شوند. چهار مرحله اول از این الگوریتم بر روی داده های مردم گستر و مرحله پنجم بر روی داده های مرجع اعمال می شوند. در مراحل اول تا سوم تناظریابی، با اعمال تلفیقی از قیود هندسی و توصیفی بر روی قطعه عوارض (فاصله بین دو نقطه متوالی سازنده عوارض خطی)، به جستجوی عوارض متناظر پرداخته می شود. در مرحله چهارم، با بازسازی عوارض از روی قطعه عوارض، خطاهای احتمالی ناشی از مراحل قبل شناسایی می شود. در مرحله پنجم، با اعمال قیود هندسی و توصیفی بر روی داده های مرجع، هر عارضه ای که احیاناً تا کنون مورد بررسی قرار نگرفته باشد، بررسی می شود. با اتمام تناظریابی، تمام داده های مرجع و مردم گستر به صورت دارای متناظر و بدون متناظر دسته بندی می شوند تا در مراحل بعدی، آنالیز کیفیت روی آن ها اعمال شود. طبق نتایج این قسمت، حدود 82 درصد از عوارض مرجع و 90 درصد از عوارض مردم گستر دارای متناظر در مجموعه دیگر هستند.قسمت دوم، محاسبه تمامیت داده است. برای این منظور طول داده های مرجع دارای متناظر بر طول کل داده های مرجع تقسیم می شود. بنابر نتایج حاصله، میزان تمامیت داده های مردم گستر 81/9 درصد است. این مقدار در واقع بیانگر این است که برای 81/9 درصد از داده های مرجع، یک متناظر در مجموعه مردم گستر وجود دارد.در قسمت سوم دقت هندسی عوارض مردم گستر دارای متناظر محاسبه می شود. منظور از دقت هندسی در این تحقیق، دقت مختصات است. در واقع این پارامتر میزان اختلاف مکانی بین یک عارضه مرجع و عارضه مردم گستر نظیر آن را بیان می کند. برای محاسبه دقت هندسی از روش بافر افزایشی استفاده شده است. طبق نتایج به دست آمده، حدود 40 درصد از عوارض مردم گستر دقت هندسی کمتر از 5 متر و حدود 80 درصد از آن ها دقت هندسی زیر 10 متر دارند.آخرین قسمت این تحقیق محاسبه دقت توصیفی است. داده های مردم گستر اقلام توصیفی مختلفی همچون "نام عارضه" و "نوع عارضه (راه)" دارند اما از آنجا که به جز نام، مقدار سایر اقلام توصیفی برای درصد قابل توجهی از داده ها تهی است و یا دقت خوبی ندارد، در این تحقیق فقط به بررسی نام عوارض پرداخته شد و دقت توصیفی در قالب دقت نام عوارض محاسبه گردید. برای بررسی دقت نام عوارض مردم گستر، اختلاف بین نام این عوارض با نام عوارض مرجع نظیر، از طریق الگوریتم لونشتاین (levenshtein) محاسبه شد. این اختلاف که فاصله ویرایش نام دارد می تواند مقداری بین صفر تا تعداد کاراکترهای عارضه مورد بررسی داشته باشد. پس از آن عوارض مردم گستر دارای نام، بر اساس این اختلاف، که فاصله ویرایش نام دارد، در سه دسته طبقه بندی شدند: عوارض دارای نام صحیح، عوارض دارای نام تقریباً صحیح و عوارض دارای نام ناصحیح. طبق نتایج حاصل، 33 درصد از عوارض مردم گستر دارای نام، نام صحیح دارند. 44 درصد از آن ها نام تقریباً صحیح و 23 درصد باقیمانده نام نادرست دارند.