استخراج خودکار اطلاعات از تالارهای گفتمان
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی و کامپیوتر
- نویسنده سعید سارنچه
- استاد راهنما بهرام صادقی بی غم vidyasagar p
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
با همه گیرشدن استفاده از اینترنت و افزایش توان تولید اطلاعات و نرخ بارگزاری آن به شبکه جهانی اطلاعات، دسترسی به اطلاعات در این شبکه با مشکلاتی مواجه کرده است که نیاز به استفاده از ابزار های کمکی جهت دسترسی سریع به اطلاعات مفید می باشد. امروزه موتورهای جستجو از علم داده کاوی برای ارائه سرویس های مناسب و مفید برای کاربران خود استفاده می نمایند. از آنجایی که اطلاعات وارد شده اطلاعاتی هستند که به نوعی در زندگی روزمره کاربران تولید می شوند. اطلاعاتی در مورد سلیقه ها، تفریحات، عقاید و سوالات کاربران که توسط ابزارهای دیجتال کاربر بارگزاری می گردند، پس با پردازش این اطلاعات می توان از داده های خام، اطلاعاتی را استخراج کرد که در نگاه اول دور از دسترس می باشند. امروزه بیشتر کاربران از نرم افزار های جدید به عنوان web 2.0 برای ارائه اطلاعات بر روی وب استفاده می کنند. این نوع نرم افزار ها برای ایجاد یک محیط برای اشتراک گذاری اطلاعات ایجاد شده اند و همچنین امکان مدیریت اطلاعات را به کاربران می دهند. یکی از این نرم افزار ها که مورد استقبال کاربران قرار گرفته است نرم افزا تالار گفتمان (forum) می باشد. این نرم افزار تلاش می کند تا محیطی برای بحث و گفتگوی کاربران ایجاد نماید و کاربران نیاز های خود، سوالات، نظرات خود را در مورد بحث های مختلف را ثبت نمایند. امروزه افراد، شرکت ها، سازمانهای دولتی و موسسات آموزشی از این سیستم به عنوان کانال ارتباطی بین خودشان و کاربران استفاده می نمایند. نوکیا، سیستم عامل ubuntu و دانشگاه iasbs از تالار گفتمان برای ایجاد ارتباط مفید و دو سویه از این نرم افزار استفاده می کنند. تالار گفتمان مربوط به ubuntu دارای نزدیک به یک میلیون کاربر می باشد که این کاربران توانسته اند نزدیک به 9.5 میلیون مطلب را در تالار پست نمایند. که به مطالب، سوالات و پاسخ های متفاوتی در باره این سیستم عامل اشاره شده است بطوریکه روزانه تعداد زیادی از کاربران با مراجعه به این سایت مشکل خودشان را حل می کنند. این شهرت و استقبال کاربران مشکلاتی را نیز به همراه داشته است. از جمله این مشکلات افزایش کاربرانی است که داده های هجو در این تالار ها وارد می کنند. امروزه spammer ها با استفاده از ابزارهای مربوط به یادگیری ماشین توانسته اند تا از سد های مختلف عبور کنند و این مطالب را وارد تالار های گفتمان کنند. در عین حال تشخیص این نوع کاربران از کاربران دیگر مشکل می باشد. تنها راه حل بررسی رفتاری این نوع از کاربران می باشد که این هم نیاز به پردازش اطلاعات پست شده در تالارگفتمان را دارد که این کار را میتوان از طریق استخراج اطلاعات انجام داد.
منابع مشابه
استخراج خودکار جملات همتراز انگلیسی-فارسی از متون مقایسهای با بهرهبرداری از اطلاعات نحوی
پیکرههای موازی همواره از غنیترین منابع در مباحث پردازش زبان طبیعی محسوب میشوند. این نوع پیکرهها شامل متون ترجمهشدۀ دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله همترازشدهاند. علیرغم کاربرد فراوان این نوع پیکرهها در مطالعات مختلف از جمله پژوهشهای زبانی، ترجمة ماشینی آماری و سامانههای خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکرههای موازی مو...
متن کاملارائه روشی جدید برای شاخصگذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشهبندی متون
Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, i...
متن کاملاستخراج خودکار عبارتهای کلیدی از متون مقالههای فارسی
در پژوهش حاضر، عبارتهای کلیدی از متون مقالههای فارسی به صورت خودکار جداسازی گردیده است. استخراج عبارتها مبتنی بر روشهای آماری، نحوة توزیع واژگان، مجاورت و ... صورت پذیرفته است. سیستمی که بر پایه پژوهش حاضر طراحی گردیده، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، به گونهای که در طول زمان مرتباً به کارایی آن افز...
متن کاملاستخراج خودکار معادلهای واژگانی از پیکرههای دو زبانه موازی
امروزه به مدد ظهور انواع فناوریهای رایانهای، پیکرههای زبانی نقش بسیار مهمی در حل انواع مختلف مسائل زبانشناختی ایفا میکنند. پیکرههای دو زبانه موازی در سطح جمله و در سطح واژه میتوانند برای بازیابی واحدهای تکواژهای و یا حتی چند واژهای براحتی مورد استفاده قرارگیرند که این امر کاربردهای مفیدی در حوزههای مختلف رایانه و زبان خواهد داشت. هدف این مقاله بهکارگیری یک پیکره موازی انگلیسی– فا...
متن کاملتبیین مفهوم گفتمان مدنی در عرصه های عمومی شهری با رویکردی اکتشافی؛ از حمام ها تا تالارهای شهری
این مقاله فاقد چکیده میباشد.
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023