نام پژوهشگر: محرم منصوری زاده
محرم منصوری زاده نصرالله مقدم چرکری
در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، لحن و متن گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. تحقیقات موجود در حیطه بازشناسی احساس را می توان به سه گروه عمده تقسیم کرد. گروه اول، یکی از منابع مانند گفتار یا حرکات چهره را برای بازشناسی احساس استفاده می کنند. گروه دوم، نتیجه بازشناسی احساس با چندین منبع را در سطح تصمیم با هم ترکیب می کنند. گروه سوم ویژگی های استخراج شده از منابع مختلف را برای تولید ویژگی های مختلط با هم ادغام می کنند و با استفاده از ویژگی های جدید احساس را باز می شناسند. ترکیب سطح تصمیم، ارتباط بین ویژگی ها منابع مختلف را در نظر نمی گیرد. مثلا خشم و ترس علایم مشابهی در چهره دارند اما ویژگی های گفتاری آنها متفاوت است. انتظار ما این است که طبقه بندی که بر اساس ویژگی های گفتاری و چهره ای کار می کند؛ بتواند به شکل بهتری این دو احساس را از هم متمایز کند. از سویی دیگر، بررسی های روانشناسی نشان داده اند که علایم احساس در گفتار و چهره به صورت کاملا همزمان ظاهر نمی شوند. مثلا گره کردن ابروها هنگام وقوع احساس خشم، ممکن است اندکی قبل یا بعد از بالا رفتن تن صدا مشاهده شود. این ناهمزمانی، ترکیب و ادغام ویژگی ها را دچار مشکل می کند. مدل پیشنهادی در این رساله همجوشی اطلاعات گفتار و حالات چهره را در دو سطح ویژگی و تصمیم در نظر می گیرد. در این مدل، ویژگی های صوتی و تصویری در قالب سریهای زمانی استخراج می شوند. به منظور همزمان سازی آنها، بافرهای فعالی برای نگهداری مقادیر ویژگی ها و همجوشی زمانی آنها استفاده می شود. در زمان هایی که مقادیر ویژگی مورد نظر وجود داشته باشند؛ بافر با این مقادیر به روز می شود. در لحظات بعد اگر تا مدت معینی مقدار ویژگی موجود نباشد؛ مقدار موجود در بافرها به عنوان مقدار فعلی ویژگی گزارش می شود. پس از انقضای این مدت، مقادیر بافرها با مقادیر پیش فرض خاصی جایگزین می شوند. با استفاده از این بافرها، ویژگی های مختلف صوتی و تصویری همپوشانی زمانی مناسبی با هم پیدا می کنند. برای طبقه بندی احساس بروز یافته، سه نوع طبقه بند مبتنی بر ویژگی های گفتار، ویژگی های چهره و ویژگی های ادغام شده آنها یادگیری می شوند. سطح دوم همجوشی اطلاعات در مدل پیشنهادی، نتایج این طبقه بندها و همچنین نتیجه نهایی لحظه قبل را به صورت خطی با هم ترکیب می کند. مدل پیشنهادی با استفاده از دو پایگاه داده صوتی تصویری احساس enterface05 ( زبان انگلیسی، 42 نفر) و tmu-emodb (زبان فارسی، 12 نفر) آزمایش شده است. نتایج این آزمایش ها نشان دهنده این است که دقت بازشناسی احساس با ادغام ویژگی های ناهمزمان و ترکیب طبقه بندهای مبتنی بر ویژگی های ناهمزمان مشابه هم بوده و در حدود 40% برای پایگاه اول و 65% برای پایگاه دوم می باشند. در حالی که پس از همزمان سازی و ادغام ویژگی ها، میانگین دقت به 70% و 75% به ترتیب بر روی این دو پایگاه بدست آمده است. همچنین نتایج بدست آمده نشان میدهند که دقت بازشناسی با استفاده از ترکیب سه نوع طبقه بند فوق، برای پایگاه اول با دقت بدست آمده از طبقه بند مبتنی بر ویژگی های همزمان شده، تفاوت چندانی ندارد اما برای پایگاه دوم، این تفاوت از نظر آماری معنی دار است. نتایج فوق بیانگر افزایش دقت بازشناسی احساس با بکار بردن بافرهای همزمان سازی و ترکیب سه نوع طبقه بند فوق می باشند.
رضا داوطلب میر حسین دزفولیان
شبکه های عصبی فازی مین-ماکس (fmm) روش جدیدی در حوزه یادگیری ماشین هستند که با توجه به کارایی بالای این شبکه ها، می توان در کاربرد های مختلف یادگیری ماشین از آن ها بهره جست. از مهم ترین ویژگی های این روش ها می توان به تک گذار بودن، برخط بودن و ناپارمتریک بودن مرحله یادگیری آن ها اشاره کرد. این ویژگی ها باعث سرعت و دقت بالای این شبکه ها در مقایسه با سایر روش های یادگیری می شود. ورودی ها و خروجی های این شبکه ها می توانند به صورت فازی یا غیرفازی باشند. فازی بودن ورودی و خروجی در شبکه های fmm، قابلیت تعمیم این شبکه ها را افزایش می دهد، طوری که می-توان در حوزه های مختلف یادگیری ماشین از این شبکه ها استفاده کرد. با توجه به مطالعات انجام شده، روش fmcn، نسبت به سایر روش های fmm موجود از کارایی بهتری برخوردار است. در اولین روش پیشنهاد شده در این رساله، با ایجاد تغییراتی در روش fmcn، روش جدیدی به نام m-fmcn ارائه شده است. در روش m-fmcn، برای حل مشکل نواحی همپوشان از یک تابع "شعاع محور" استفاده شده است. همچنین، تغییراتی در فرایند یادگیری داده شده تا این فرایند سریع تر انجام شود. با توجه به نتایج بدست آمده، در اکثر موارد روش m-fmcn نسبت به روش fmcn، از سرعت و دقت بالاتری برخوردار بوده و فضای کمتری اشغال می کند. بعد از روش m-fmcn، روش شبکه فازی مین-ماکس وزن دار یا wfmm ارائه شده است. در این روش چگالی نمونه-های واقع شده در نواحی مختلف فضای نمونه، در خروجی شبکه تاثیر گذار هستند. در روش wfmm از محدود سازی هایپرباکس ها استفاده نشده و نمونه هایی که در نواحی همپوشان قرار می گیرند با توجه به فاصله تا مرکز هایپرباکس ها و همچنین چگالی نمونه های هایپرباکس ها، طبقه بندی می شوند. نتایج بدست آمده از پیاده سازی این روش بیان گر افزایش دقت طبقه بندی این روش در مقایسه با روش های قبلی fmm است. روش دیگری که در این رساله پیشنهاد شده، روش شبکه های فازی-مین ماکس چند سطحی یا mlf است. این روش از یک ساختار درختی استفاده می کند و نمونه هایی که در نواحی همپوشان قرار می گیرند در سطوح بعدی درخت با دقت بیشتری طبقه بندی می شوند. روش mlf از دقت بالایی در طبقه بندی برخوردار بوده و از ویژگی های بارز آن می توان به کارایی بالا و حساسیت پایین آن نسبت به " ضریب گسترش هایپرباکس ها" (?) اشاره کرد. همچنین در مواردی که از داده های یکسانی برای آموزش و آزمایش استفاده می شود، تقریبا در همه موارد، قادر به یادگیری و طبقه بندی صحیحِ تمامی نمونه هاست.
علیرضا محمدی حسن ختن لو
امروزه با توجه یه کاربرد وسیع هستان شناسی ها به ساخت و توسعه آنها توجه زیادی می شود. اما به این دلیل که افراد مختلفی با درک و کلمات متفاوتی هستان شناسی ها را توسعه می دهند ممکن است دو هستان شناسی که یک دامنه را توصیف می کنند دارای ساختار و واژگان متفاوت باشند. ایجاد درک مشترک بین هستان شناسی ها موجب ایجاد سامانه های تطابق هستان شناسی ها شده است. آن چه که در توسعه سامانه های تطابق تاکنون مغفول مانده است نگاه به مبحث شناخت شناسی به عنوان اساس هستان شناسی و استفاده از مفاهیم این حوزه در تطابق هستان شناسی هاست.در این پژوهش با پرداختن به حوزه شناخت شناسی، به روشی بر مبنای هوش جمعی رهنمون می شویم و فرا سامانه ای برای تطابق هستان شناسی ها ارائه می دهیم. هم افزایی سامانه های تطابق در این روش موجب انطباق هر چه بهتر هستان شناسی ها با دقت و فراخوانی بیشتری نسبت به سایر سامانه های تطابق می شود.
مینا حمیدی محرم منصوری زاده
در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. مدل پیشنهادی در این پایان نامه از گفتار پیوسته فارسی برای بازشناسی احساس استفاده می کند. بازشناسی احساس از گفتار بر روی زبان های مختلفی انجام شده اما بر روی زبان فارسی تا کنون این چنین به آن پرداخته نشده است. برای ارزیابی عملکرد سیستم طراحی شده، نیاز به پایگاه داده مناسبی داشتیم. به علت نبود پایگاه داده مناسب اقدام به ساخت و تهیه پایگاه داده صوتی احساسی نموده و آن را basu speech database نام نهادیم. این پایگاه داده از صدای ضبط شده بازیگران در سریال ها و فیلم های تلوزیونی و نمایشنامه های رادیویی ساخته شده است. هدف طبیعی بودن و جامع بودن گفتار موجود در پایگاه داده بود که به همین خاطر در این پایگاه از گفتار زن و مرد و در رده های مختلف سنی استفاده شده است. در این مدل ابتدا ویژگی های مورد نیاز گفتار را استخراج کرده و با استفاده از سه طبقه بند شبکه عصبی، svm و بیز به بازشناسی احساس از گفتار پرداخته شده و نتایج به دست آمده مقایسه و تحلیل شده است. در این پایان نامه سه آزمایش متفاوت ترتیب داده شده است. آزمایش اول و دوم به بازشناسی احساس تنها یک فرد پرداخته، با این تفاوت که در آزمایش اول هر احساس به صورت جدا بررسی شده اما در آزمایش دوم هر پنج احساس مورد نظر مورد بررسی قرار گرفته شده است. اما آزمایش سوم بر روی کل پایگاه داده تهیه شده، انجام گرفته است. بر اساس نتایج به دست آمده، بازشناسی احساس از گفتار برای یک شخص خاص نتایج بهتری از خود نشان خواهد داد، علاوه بر این هر چه تعداد احساس مورد بررسی بیشتر شود، احتمال نزدیک شدن آنها به هم و پایین آمدن دقت بیشتر خواهد شد. در آزمایشات انجام شده طبقه بند بیز دقت بالاتری برای بازشناسی احساس از گفتار بدست آورده است. با مقایسه نتایج بدست آمده در این تحقیق با کارهای دیگری که در این زمینه انجام شده اند، دقت به دست آمده در آزمایشات انجام شده در این پایان نامه که به صورت میانگین برای سه طبقه بند شبکه عصبی، svm و بیز به ترتیب،6.69%، 4.71% و 78% می باشد، نتایج قابل قبولی خواهند بود.
مهدی خلیلی میر حسین دزفولیان
استخراج اطلاعات یکی از زمینه های رایج پردازش زبان های طبیعی است که فعالیت خود را از همان ابتدای پیدایش پردازش هایی روی زبان های طبیعی آغاز کرده است. هدف از استخراج اطلاعات بدست آوردن اطلاعات مفیدی از منابع وسیع و غیر ساخت یافته موجود در فضای مجازی است. استخراج روابط معنایی یکی از شاخه های رایج در زمینه استخراج اطلاعات است. روابط معنایی زیادی را می توان تعریف کرد که از جمله مهمترین آنها رابطه های عام- خاص، کل-جزء، تضاد و ترادف است. رابطه عام-خاص بیانگر وجود نوعی شمول معنایی میان دو مفهوم است. یعنی مفهوم عام از نظر معنایی شامل مفهوم خاص می شود. بطور مثال "اتومبیل" نوعی "خودرو" است در نتیجه در این رابطه "خودرو" عام و "اتومبیل" خاص است. رابطه کل-جزء نشان دهنده ی نوعی عضویت است. بطور مثال یک بازیکن جزئی از یک تیم است در نتیجه در رابطه ی بین "بازیکن" و "تیم" کلمه ی "بازیکن" جزء و کلمه ی "تیم" کل است. در این پایان نامه سه روش مختلف برای استخراج روابط معنایی پیشنهاد شده است. روش اول بر پایه الگوهای متنی استوار است و برای استخراج روابط معنایی از یک برچسب گذار نقش دستوری کلمات فارسی استفاده می کند. طریقه ی کار این روش بدین صورت است که ابتدا با استفاده از جفت نمونه های اولیه، برای هر رابطه معنایی الگو های متنی را از پیکره استخراج کرده و سپس با توجه به نقش دستوری کلماتی که می توانند در کنار الگوی مورد نظر قرار بگیرند کلمات مرتبط معنایی را استخراج می کنیم. موفقیت این روش بطور متوسط برای الگوهای مختلف 65 درصد است. روش دوم یک روش بر پایه n-gramها است. در این روش هر دو کلمه که در یک n-gram قرار می گیرند همسایه نامیده می شوند. فرض بر این است که دو کلمه با هم رابطه معنایی دارند اگر تعداد همسایگان مشترک آنها بیش از حد آستانه باشد. میزان موفقیت این روش 42 درصد بوده است. روش سوم به منظور استخراج رابطه تضاد استفاده شده و برخلاف دو روش قبلی که از ویژگی های نحوی زبان استفاده می-کنند این روش از ویژگی های معنایی زبان استفاده می کند. در این روش دو کلمه به عنوان ورودی دریافت شده و برای تشخیص متضاد بودن آنها جملاتی از پیکره که شامل کلمه اول هستند استخراج شده و در آن جمله ها کلمه دوم را با کلمه اول جابجا کرده سپس فعل جمله را معکوس می کنیم. حال بررسی می کنیم اگر جمله بدست آمده از نظر معنایی درست باشد آنگاه آن دو کلمه با هم متضاد هستند. برای تعیین صحت جمله بدست آمده از دو روش دستی و خودکار استفاد شده که در روش دستی نتایج بسیار خوبی بدست آمده است.
شکوفه دشتبانی محرم منصوری زاده
در زبانشناسی رایانه ای پیکره، انباره ای از داده های متنی است که برای اهداف مختلفی مثل مطالعات فرهنگی یک زبان خاص، مطالعه تغییرات یک زبان با گذشت زمان، پروژه های پردازش زبان های طبیعی، پروژه هایی که مربوط به حوزه ی زبان شناسی است، ایجاد می شوند. در این تحقیق تمرکز ما بر طراحی و ساخت پیکره ی دو زبانه ی فارسی-انگلیسی حوزه ی فاوا است. این پیکره به صورت خودکار ساخته شده است و منابع آن اسناد تخصصی حوزه ی فاوا است. در این پژوهش نرم-افزاری برای ساخت پیکره طراحی شده است که هزینه و مدت زمان ساخت پیکره را کاهش می دهد علاوه بر این، نرم افزار ارائه شده قابلیت مدیریت پیکره را نیز برای کاربران فراهم می کند. از ویژگی های پیکره ی ساخته شده فراهم کردن یک مجموعه ی متمرکز از اسناد تخصصی است که می تواند در پروژه های مختلف حوزه ی فاوا استفاده شود. مهمترین مرحله ی ساخت پیکره-های چند زبانی ترازبندی داده های پیکره است. در این پروژه روشی برای ترازبندی جمله های پیکره ی فارسی تخصصی حوزه فاوا ?ict? و جملات انگلیسی پیکره ی تخصصی حوزه فاوا ارائه شده است. هدف این پژوهش طراحی یک سیستم ترازبندی برای استخراج جمله های متناظر دو زبان است. در این روش با استفاده از یک لغت نامه دو زبانی که ایجاد کرده ایم و تکنیک های هوش مصنوعی، امتیاز نشان دهنده شباهت دو جمله، محاسبه می شود. در نهایت اطلاعات مربوط به نگاشت جمله های دو مجموعه ی انگلیسی و فارسی در پایگاه داده ی پیکره ذخیره می گردد. آزمایش ها نشان می دهد که این تکنیک علاوه بر اینکه از نظر دقت مناسب است، تعداد جمله های کاندید را نیز کاهش می دهد. در انتها آماری از وضعیت فعلی پیکره ی فاوا ارائه می شود.
اکرم احمدی طامه محمد نصیری
وردنت یک پایگاه داده ی لغوی بزرگ است که برای ابهام زدایی کلمات، بازیابی اطلاعات و ترجمه ی متون استفاده می-شود. این پایگاه داده ی لغوی شامل اسم، فعل، صفت و قید است که کلمات هم معنی را در مجموعه هایی به نام ترادف دسته بندی می کند. در این پژوهش روش های خودکار را برای استخراج دادگان حوزه ی فناوری اطلاعات و ارتباطات (فاوا) از وردنت عمومی انگلیسی پرینستون پیشنهاد می کنیم و در مرحله ی بعد آن را به منظور ساخت وردنت فارسی نگاشت می دهیم. مزیت روش خودکار کاهش دخالت عامل انسانی و در نتیجه سرعت بخشی به فرایند توسعه وردنت فاوا می باشد. به همین منظور، چندین روش استخراج خودکار بر اساس تعریف ترادف، روابط معنایی بین ترداف های وردنت، شباهت بین تعریف ترادف ها و تعاریف لغت نامه-های تخصصی موجود و بالاخره ترادف های برادر ارائه نموده ایم. نتایج پیاده سازی و ارزیابی این روش ها بر روی وردنت پرینستون نشان می دهد که استخراج دادگان فاوا دقت قابل قبولی به همراه داشته است.
محمدرضا علاقه بند محرم منصوری زاده
با افزایش کاربرد شبکه های بی سیم در سال های اخیر، تحقیق و توسعه برای ایجاد روش های جدید که عملکرد این نوع شبکه ها را بهبود بخشد به امری ضروری تبدیل شده است تا راه حل هایی جهت رفع برخی از اشکالات ذاتی شبکه های بی سیم ارائه گردد. یکی از مشکلاتی که در شبکه های بی سیم وجود دارد عدم استفاده از روش های تطبیق ارسال داده است. با این که زمینه استفاده از روش های فوق در لایه فیزیکی استاندارد 802.11 از طریق ایجاد انواع روش های مدولاسیون و کدینگ فراهم شده است، استاندارد هیچ روش مشخصی جهت استفاده از این امکانات ارائه نکرده است. این در حالی است که در صورت استفاده از این روش ها، توان عملیاتی شبکه می تواند تا حد چشمگیری افزایش یابد. به طور کلی هدف استفاده از این روش ها، مقابله با تغییراتی است که به صورت ذاتی در کانال ارتباطی شبکه های بی سیم رخ می دهد تا به صورت تطبیقی و بسته به شرایط کانال ارتباطی، سرعت ارسال داده تنظیم شود. در این پژوهش در ابتدا طی آزمایش هایی به بررسی رفتار روش های پیشین پرداخته تا از این طریق مشکلات آن ها مشاهده شود تا روش جدید ارائه شده را به سمت رفع این مشکلات راهنمایی شود. در ادامه به ارائه یک روش تطبیق نرخ ارسال مبتنی بر روش یادگیری فازی- تقویتی پرداخته خواهد شد که نشان می دهد استفاده از روش های یادگیری می تواند با یادگیری رفتار محیطی، استراتژی بهتری را در اختیار یک روش تطبیق نرخ ارسال قرار دهد. در آخر به بررسی و تحلیل نتایج حاصل از آزمایش های متعدد انجام شده بر روی روش ارائه شده پرداخته و نشان داده می شود که این روش توانایی پاسخ دهی به تغییرات شرایط را داشته و می تواند کارایی شبکه های بی سیم را حتی بیش از روش-های پیشین افزایش دهد.
حسین سبزیانی محرم منصوری زاده
برای بدست آوردن روابط سلسله مراتبی در یک متن بدون ساختار، ابتدا به کمک روشهای هوشمند پردازش متن و استفاده از روابط معنایی، تمام عبارت هایی را که در متن نقش کلیدی دارند را استخراج میکنیم. هر کدام از این عبارت ها عضوی از گراف نهایی تولید شده ار متن خواهد بود. سپس با استفاده از الگوریتم خاصی به استخراج ابرنام(hypernym) هر یک از عبارت ها میپردازیم و به صورت بازگشتی این عمل تکرار می شود تا گراف روابط سلسله مراتبی کامل شود. در مراحل بعد به با استفاده وزن دهی یالهای گراف به هرس کردن گراف میپردازیم و تمام حلقه های گراف را از بین میبریم و نمودار نهایی به صورت درخت خواهد بود. در آخر ممکن است چون محتمل است که نمودار کمبود اطلاعات داشته باشد به بازیابی برخی از روابط هرس شده ی مفید میپردازیم.
مصطفی راستگو حسین بیات
توزیع اندازه ذرات (psd) خاک یکی از مهم ترین ویژگی های فیزیکی خاک های معدنی است. از این ویژگی می توان برای پیش بینی و تخمین خواص هیدرولیکی خاک ها مانند منحنی مشخصه رطوبتی خاک و توابع هدایت هیدرولیکی اشباع و غیراشباع استفاده نمود. مطالعه پدیده های مربوط به آب در خاک، مستلزم آگاهی از مقدار آب موجود و وضعیت انرژی آن (به ترتیب رطوبت و مکش) در خاک است. منحنی مشخصه رطوبتی خاک (swcc) رابطه ی میزان رطوبت خاک با مکش ماتریک خاک را نشان می دهد. با وجود اهمیت زیاد psd و swcc در خاک ها، به مدل سازی و قابلیت برازش مدل های آن ها برای پیش بینی کل منحنی های psd و swcc در خاک توجه کمتری صورت گرفته است. هدف از این پژوهش، بررسی قابلیت برازش مدل های psd و swcc بر داده های تجربی و انتخاب بهترین مدل از بین آن ها برای کل نمونه های خاک و برای هر کدام از گروه ها و کلاس های بافتی می باشد. در این پژوهش 35 مدل مختلف psd و همچنین 51 مدل مختلف swcc به ترتیب به داده های توزیع اندازه ذرات خاک (160 نمونه خاک) و داده های منحنی مشخصه رطوبتی (145 نمونه خاک) برازش داده شدند. در این پژوهش دقت برازش مدل ها به داده ها، با سه معیار ضریب تعیین (r2)، ریشه میانگین مربعات خطا (rmse) و معیار اطلاعات آکایک (aic) مورد ارزیابی قرار گرفتند. در بحث مدل های psd، مدل های بست، ویبول دو و سه پارامتری، روسین راملر (1 و 2)، فردلاند دو نمایی و تک نمایی و ون گنوختن در اکثر گروه ها و کلاس های بافتی بهترین برازش را داشتند. به همین علت می توان از این مدل ها با دقت قابل قبول برای پیش بینی منحنی توزیع اندازه ذرات که از ویژگی مهم در مکانیک و فیزیک خاک و همچنین در اندازه گیری غیرمستقیم ویژگی هیدرولیک خاک است، استفاده نمود. مدل های مندلبورت، فرکتال، گایودین، نمایی، لگاریتمی-نمایی، فرکتال جامد منفذ، یانگ، تورکت، شامن، onl و slm دقت ضعیفی در برازش غالب گروه ها و کلاس های بافتی داشتند. در بحث مدل های swcc، نتایج نشان داد که مدل های گرنوالت (1، 2، 3 و 4)، فردلاند و زینگ، ون گنوختن، آپیش، لیباردی، سایمونز، معلم، بروتسائرت، درسین، بوردین، دورنر، دکستر و گاردنر تقریبا در همه ی گروه ها و کلاس های بافتی دارای دقت برازشی بالایی بودند. به همین علت می توان از این مدل ها با دقت قابل قبول برای پیش بینی منحنی مشخصه رطوبتی که از ویژگی مهم در فیزیک خاک است، استفاده نمود. همچنین در اکثر گروه ها و کلاس های بافتی مدل های ژانگ و ون گنوختن، لالیبرت، بروکس و کوری، واکلین، مکی و بامب، روسو و نیمو (1)، فرکتال مرکب، فرمی، کمپل، روسو و خلوصی دقت برازش ضعیفی داشتند. بر اساس نتایج به دست آمده، مشخص می گردد که در گروه ها و کلاس-های بافتی مختلف، دقت برازش مدل های متفاوت با هم فرق داشتند. البته تعمیم پذیری این نتایج مستلزم بررسی تعداد نمونه های بیشتر است که نیاز به تحقیقات وسیع تری در آینده دارد.
بهنام خوش سفر محرم منصوری زاده
سایت های شبکه های اجتماعی مانند فیس بوک، توئیتر و وب سایت هایی که به جمع آوری نظرات کاربران میردازند، پس از استفاده گسترده از تکنولوژی وب 2.0 توجه بسیار زیادی را به خود جلب کرده اند.با توجه به اینکه سازمانهای تولیدکننده محصول و ارائه¬دهنده خدمت برای باقی ماندن در بازار رقابتی کنونی نیازمند آگاهی از نظرات مصرف کنندگان می¬باشند. مصرف¬کنندگان نیز با گسترش وب و شبکه های اجتماعی نظرات خود را به راحتی با دیگرات در بستر وب به اشتراک می گذارند، از این رو سازمان ها نیازمند نظارت بر شبکه-های اجتماعی و وب برای پیگیری درخواست¬ها و نظرات کاربران هستند. با توجه به اینکه اطلاعاتی که در سطح وب وجود دارد، بسیار زیاد می باشد و هر روز این اطلاعات در حال افزایش می¬باشد، از این رو پیدا کردن اطلاعات مورد نیاز و تحلیل و آنالیز آن مشکلی می-باشد که سازمانها با آن روبرو هستند، از این رو ما برای ساده شدن بدست آوردن اطلاعات مورد نیاز برای سازمان¬ها، بر اساس مجموعه داده¬ای که مورد استفاده قرار داده ایم، مدلی را ارائه میدهیم که نظراتی که در سطح وب داده شده اند را گروه بندی می کند. گروهبندی نظرات با توجه به روابط مفهومی و معنایی واژگان صورت می گیرد. در این پژوهش ما داده ها را در سه گروه مختلف دسته بندی می کند که هر کدام از خوشه ها نشان دهنده اطلاعات خاصی می-باشد، حال با توجه به گروهای تعیین شده می توان برای دست¬یابی به هر اطلاعاتی که لازم می¬باشد، به خوشه مربوطه مراجعه کرد و اطلاعات را بدست آورد. در این پژوهش از داده-های جمع¬آوری شده وب سایت آمازون استفاده کرده ایم. این داده ها بر روی سایت دانشگاه استنفورد برای انجام کارهای پژوهشی قرار دارد. در این مدل ما از الگوریتم k-means برای خوشه¬بندی استفاده کرده ایم. همچنین از درخت تصمیم برای پیش بینی نیز بهره برده ایم. مدل به کار گرفته شده در این پژوهش دارای 84 درصد دقت می¬باشد، که کارایی این روش به شدت وابسته به آماده¬سازی دادههای اولیه می باشد.