کشف روندهای نوظهور در حوزه‏ های علمی بر پایه خوشه‏ بندی پویا با رویکرد متن‏ کاوی و تحلیل پیوند

پایان نامه
چکیده

در سالیان اخیر حجم زیادی از داده های متنی و کتابشناسی علمی از طریق اینترنت و پایگاههای علمی در اختیار پژوهشگران قرار گرفته است. پردازش این حجم بالای داده مستلزم توسعه ابزار و روشهای جدید می باشد. نگاشت دامنه دانش شامل تحلیل و مصورسازی مجموعه داده های مقالات علمی و حق امتیازها است. نقشه های حاصل از این نگاشت برای تشخیص حوزه های عمده پژوهشی و کشف روندهای نوظهور به کار می روند. در رساله حاضر در راستای پاسخگویی به بخشی از نیازهای فوق، متون علمی و حق امتیازها با رویکرد داده کاوی متون تحلیل می‏شوند. هدف این کار تسهیل دسترسی به اطلاعات، آشکار کردن ساختار دانش و فراهم ساختن دید کلی برای مدیریت دانش و آینده نگاری است. به منظور آشکارسازی ساختار یک حوزه علمی می خواهیم زیرحوزه های این حوزه را شناسایی کرده و سیر تحول زمانی زیرحوزه ها را بررسی کنیم. مسئله این است که روش مناسب و کارا برای تفکیک، شناسایی و مصورسازی زیرحوزه ها چیست؟ چگونه می توان زیرحوزه ها را در دوره های متوالی با هم تطابق داد و پویایی آنها را مصور نمود؟ در این رساله حوزه علم و فناوری نانو برای ارزیابی عملکرد روشهای ارائه شده انتخاب شده و متون مرتبط بر اساس کلیدواژه‏ها بازیابی می‏شود. سپس با خوشه بندی سلسله مراتبی متون چکیده و عنوان، خوشه های مباحث مطرح در هر دوره یافته می شود. در این راستا برای ارزیابی خوشه های بزرگ ضریب سیلوئت بر اساس شباهت معرفی می گردد. در مرحله دوم ارتباط بین علم و فناوری از طریق بررسی شباهت و تطابق خوشه‏های مقالات و حق امتیازها یافته می‏شود. شباهت با گرافهای دوبخشی مصور می شود. ارتباط و نشت اطلاعات بین زیرحوزه های علم از طریق گراف استناد مقالات مصور می شود. در مرحله سوم قواعد تطابق جدیدی برای ردیابی خوشه ها در طول زمان توسعه می یابد. برای تطابق دوره ها دو روش تخصیص مجاری و ابرخوشه بندی معرفی می شود. زنجیره خوشه های یافته شده مصور می شود. در این تحقیق 468.000 خلاصه مقاله (برگرفته از isi) و 69.000 حق امتیاز فناوری نانو (برگرفته از uspto) از سال 1990 تا 2008 با روش خوشه‏بندی سلسله‏مراتبی افرازی خوشه‏بندی گشته و با معیار جدید ضریب سیلوئت بر اساس شباهت ارزیابی شد. زیرحوزه‏های فناوری نانو شناسایی و توسط خبرگان ارزیابی گردید. این معیار برای دسته‏بندی مقالات ایران در درخت فناوری نانو مورد استفاده قرار گرفت. الگوریتم کارای ارائه شده برای تطابق پویای خوشه‏ها برای شناسایی روند به کار گرفته شد. روشها و ابزار توسعه داده شده قابل استفاده برای مصورسازی و ردیابی خوشه های یک حوزه علمی و کشف روندهای نوظهور بوده و امکان خوشه‏بندی پویا را برای صدهاهزار سند فراهم می‏کند. این ابزار کمک بزرگی برای محققین علمی و خبرگان آینده نگاری بوده و اطلاعات لازم را برای مدیریت تحقیق و توسعه فراهم می‏کند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مدل تخصیص تبلیغات در وب نوشت ها بر پایه خوشه بندی با رویکرد تحلیل شبکه های اجتماعی و متن کاوی

با گسترش روز افزون داده ها بر روی اینترنت و نیمه ساختار یافته و بدون ساختار بودن بیشتر این داده ها، استفاده از روش های کشف دانش برای رسیدن به دانش نهفته در آن ضروری به نظر می رسد. یکی از خدمات پرطرف دار ارائه شده در اینترنت وب نوشت است. چنین فضای گسترده ای با چنین حجم بازدید کننده دارای پتانسیل بالای تجاری است که این پژوهش نیز همین موضوع را هدف خود ساخته است. پژوهش حاضر با قرار دادن وب نوشت فار...

15 صفحه اول

بررسی تطبیقی متن چشم انداز و بیانیه ماموریت شرکت های برتر و شرکت های ایرانی در صنایع غذایی با استفاده از تکنیک متن کاوی و خوشه بندی

با توجه به نقش مهم چشم انداز و بیانیه ماموریت در تبیین اهداف استراتژیک و جهت گیری سازمان ها، تحلیل متن این اسناد اهمیت به سزایی خواهد داشت. صنعت غذا به عنوان یکی از گسترده ترین صنایع در برطرف سازی یکی از نیاز های اساسی مردم در ایران نیازمند پیشرفت و بهبود می‌باشد. بدین منظور ما در این پژوهش به بررسی متن بیانیه ماموریت و چشم انداز شرکت های برتر صنایع غذایی در دنیا و ایران پرداختیم تا تفاوت ها و ...

متن کامل

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)

Customer classification using k-means algorithm for optimizing the transportation plans is one of the most interesting subjects in the Customer Relationship Management context. In this paper, the real-world data and information for a spare-parts distribution company (ISACO) during the past 36 months has been investigated and these figures have been evaluated using k-means tool developed for spa...

متن کامل

کشف ساختار درونی مطالعات روانشناسی مثبت به روش متن کاوی

این پژوهش با هدف کشف ساختار درونی مطالعات روانشناسی مثبت صورت گرفته است. رویکرد پژوهش پیش رو، در بخش ادبیات نظری و پیشینه های پژوهش، مطالعه ی کتابخانهای و از لحاظ ماهیت، کاربردی و در تجزیه و تحلیل یافته‌ها، تحلیلی است و از روش همرخدادی واژگان و نهایتاً خوشهبندی متن که از روشهای متنکاویاند برای کشف ساختار درونی و روابط موضوعی مطالعات روان‌شناسی مثبت استفاده شده است. جامعه این پژوهش، مقالات حوزه ر...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده فنی مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023