نام پژوهشگر: احمد براانی دستجردی
آرزو رجایی احمد براانی دستجردی
یکی از زمینه های مربوط به کاربرد نظریه سیستم های فازی در پایگاه داده ها، بازیابی اطلاعات، سیستم های خبره و پایگاه دانش است. مهم ترین مسئله ای که در پایگاه داده فازی مطرح می شود، نحوه مواجهه با پدیده عدم قطعیت است. نمایش و کار با داده های غیرقطعی در پایگاه داده رابطه ای، مسئله پیچیده ای است که برای حل آن باید در ساختار رابطه ها و عملگر های مربوط به کار با رابطه ها اصلاحاتی انجام شود. هم چنین هر پایگاه داده دارای محدودیت های جامعیت است و از میان این محدودیت ها، به وابستگی های داده بیشتر توجه می شود. هدف اصلی این پژوهش، بررسی وابستگی های داده فازی در پایگاه دادههای رابطه ای فازی و ارائه تعریف جدیدی برای وابستگی چندمقداری فازی با درجه ی ? است. در پایگاه داده ی رابطه ای فازی تعاریف زیادی برای مفهوم وابستگی چندمقداری فازی بیان شده اند و در این پژوهش به بررسی مفهوم تقریب معنایی برای این نوع وابستگی می پردازد و فرمولی را برای حل مشکل این نوع وابستگی در نحوه مواجهه با اعداد crisp و تهی موجود در این نوع پایگاه داده ها ارائه می دهد. هم چنین تعریف جدیدی را برای وابستگی چندمقداری فازی بر مبنای مفهوم توسعه ی تقریب معنایی با درجه ی ? برای پایگاه داده های رابطه ای فازی که شامل مقادیر crisp ، تهی و فازی هستند، ارائه می دهد و سپس قانون های استنتاج را تعریف و کامل بودن آن ها را اثبات می کند و هم چنین ثابت می کند که وابستگی تابعی فازی و وابستگی چندمقداری کلاسیک، حالت های خاصی از وابستگی چند مقداری فازی هستند.
نیره قهرمان احمد براانی دستجردی
وب شامل کتابخانه های دیجیتال و بیلیون ها سند متنی است. جستجوی آسان و سریع در این مجموعه ی بزرگ برای کاربران و محققان پراهمیت است. دستیابی به این هدف نیازمند سازمان دهی اسناد می باشد. با توجه به این-که دسته بندی اسناد با دست یا قوانین کاری سخت و پرزحمت است، نیاز به سیستم های دسته بندی خودکار به شدت احساس می شود. سیستم های خودکار دسته بندی متون نیازمند مجموعه ی آموزش مناسب و بزرگ هستند. غالبا برای تهیه ی این مجموعه، تعداد زیادی از اسناد بدون برچسب، توسط افراد خبره به صورت دستی برچسب گذاری می شوند. برچسب گذاری دستی اسناد عملی پرزحمت و زمان بر است. علاوه بر این در برچسب-گذاری دستی به دلیل خستگی و بی دقتی انسان ها امکان اشتباه وجود دارد. در این تحقیق ساخت نیمه خودکار مجموعه ی آموزش انجام گرفته است، به طوری که درصد کمی از اسناد این مجموعه ی بزرگ به صورت دستی برچسب گذاری می شوند و برچسب گذاری درصد باقیمانده به صورت خودکار انجام می پذیرد. با مطالعات قبلی این نتیجه حاصل شد که معمول ترین روش برای دسته بندی متون استفاده از ماشین بردار پشتیبان است، به همین دلیل در این تحقیق راه حلی براساس یک سیستم ارزیابی svm توصیف شده است. وظیفه ی این سیستم آماده سازی مجموعه ی آموزش برای دسته بندی متون می باشد. روش انتخاب شده استفاده از الگوریتم های co-training و ترکیب آن با معیار سنجش مشابهت برای برچسب-گذاری دقیق تر می باشد. نتایج حاصل نشان می دهد که تنها با برچسب گذاری 10 درصد از مجموعه ی آموزش، اسناد باقیمانده را می توان با دقت 98 درصد به صورت خودکار برچسب گذاری کرد. شایان ذکر است که این کاهش دقت در مجموعه داده های استاندارد رخ می دهد و در مجموعه های کاربردی ،کاهش دقت در مقابل کاهش دقت ناشی از خستگی و بی-دقتی انسان ها در برچسب گذاری مجموعه های بزرگ ، ناچیز است.