ایوب باقری

پیاده سازی و بهبود الگوریتم هایی برای مسئله انتخاب ویژگی در رده بندی متون

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر 1388
ایوب باقری محمدحسین سرائی

امروزه پیشرفت امکانات نرم افزاری و سخت افزاری، موجب آسانی ذخیره شدن مقادیر زیادی داده شده است. تعداد مستندات متنی روز به روز در حال افزایش است، نامه های الکترونیکی، صفحات وب، متون خبری و مقالات تنها بخشی از این گستره رو به افزایش هستند. بنابراین نیاز به تکنیک های متن کاوی همانند روش های خودکار برای رده بندی متون احساس می شود. در امر رده بندی خودکار متون، انتخاب ویژگی از درون متن جزء مهم ترین مراحل می باشد. انتخاب ویژگی برای کاهش ابعاد فضای ویژگی استفاده می شود، چرا که فضای ویژگی برای متون شامل ده ها هزار کلمه خواهد بود که پردازش های بعدی سیستم را امکان ناپذیر می کند. تاکنون روش های مختلفی برای انتخاب ویژگی برای داده های متنی طراحی شده اند که هر یک دارای معایب و مزایایی هستند، ولی روشی کلی که اکثر سیستم های رده بندی متون از آن استفاده کنند و میزان کارایی بالایی نیز داشته باشد معرفی نشده است. برای بهبود کارایی سیستم رده بندی متون در این پایان نامه دو روش جدید برای انتخاب ویژگی ارائه شده است. روش اول بر پایه الگوریتم مبتنی بر احتمال سرد شدن شبیه سازی شده پیاده سازی شده است. در الگوریتم سرد شدن شبیه سازی شده نیاز به استفاده از تابع برازندگی مناسب وجود دارد. بنابراین از روش بسامد سند برای ارزیابی راه حل در هر تکرار الگوریتم سرد شدن شبیه سازی شده استفاده شده است. روش بسامد سند به عنوان تابع برازندگی دارای هزینه محاسباتی کمی است. روش دومی که برای انتخاب ویژگی در این کار ارائه شده است روش بهبود یافته اطلاعات متقابل است که آن را اطلاعات متقابل اصلاح شده نام نهادیم. در نهایت کارایی روش-های پیشنهادی با کارایی روش های مربع چی، ضریب همبستگی، مربع چی ساده، بهره اطلاعاتی، اطلاعات متقابل، بسامد سند و انحراف معیار بسامد کلمه بر روی مجموعه ای از متون فارسی مقایسه شده است و به این نتیجه رسیدیم که هر دو روش پیشنهادی دارای کارایی بهتری در اکثر موارد می باشند. در بین روش های بررسی شده روش های مربع چی و ضریب همبستگی نسبت به روش-های پیشنهادی قابل مقایسه هستند. همچنین پس از بررسی نتایج به این نکته رسیدیم که در اکثر مقایسه ها روش پیشنهادی مبتنی بر الگوریتم سرد شدن شبیه سازی شده ، به روش اطلاعات متقابل اصلاح شده چیره خواهد شد. همچنین الگوریتم های پیشنهادی در رده سیاسی پایین ترین و رده ورزشی بالاترین کارایی دارند.

تجزیه و تحلیل مبتنی بر سطح ویژگی احساسات بر روی نظرات برخط با استفاده از روش های با نظارت بسیار ضعیف

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر 1393
ایوب باقری محمدحسین سرایی

با رشد روزافزون اطلاعات متنی تولید شده توسط کاربران در اینترنت، تجزیه و تحلیل احساسات در متون، زمینه کاری جذابی در بین محققان علوم داده کاوی و پردازش زبان طبیعی شده است. تجزیه و تحلیل یا کاوش احساسات، مطالعه محاسباتی احساسات، نظرات، گرایش ها و تمایلات کاربران بر روی موضوعات، اشیا، خصوصیات و ویژگی های آنها در اسناد متنی می باشد. یکی از مهم ترین مسائل در تجزیه و تحلیل احساسات، تجزیه و تحلیل مبتنی بر سطح ویژگی است که هدف آن استخراج ویژگی ها و کلمات احساس ارائه شده بر روی آنها می باشد. با افزایش نظرات برخط کاربران بر روی محصولات یا سرویس ها نیاز به مدل هایی خودکار در جهت تجزیه و تحلیل احساسات مبتنی بر سطح ویژگی پدیدار می شود. تا به حال روش های مختلفی در زمینه تجزیه و تحلیل احساسات در سطح ویژگی در دو دسته روش های مبتنی بر تکرار و رابطه و روش های مدل گرا ارائه شده اند. بسیاری از روش های ارائه شده وابسته به دامنه موضوع هستند و ویژگی های زیادی را تولید می کنند. با وجود دامنه وسیع و تنوع زیاد محصولات و سرویس ها، استفاده از روش های وابسته به دامنه موضوع راه حل مناسبی نخواهد بود. علاوه بر این با فقدان مجموعه داده آموزشی برچسب خورده ، تهیه مجموعه داده مناسب برچسب خورده در دامنه های موضوعی مختلف امری طاقت فرسا، هزینه بر و وقت گیر است، در نتیجه نیاز به مجموعه داده بر چسب خورده موجب وابستگی به دامنه موضوع خواهد شد. علاوه بر داشتن این چالش ها، کاستی های دیگری که در روش های موجود در حل مسئله تجزیه و تحلیل احساسات در سطح ویژگی وجود دارند، استخراج همزمان ویژگی و احساس، یافتن ویژگی های پنهان، استخراج ویژگی های چند کلمه ای و وابستگی روش های معرفی شده به زبان می باشند. این رساله با هدف بهبود مدل های پیشین و ارائه راهکارهایی در جهت رفع چالش های موجود به دنبال مدلی است که بتواند با نظارت بسیار ضعیف و بدون نیاز به مجموعه داده برچسب خورده، تجزیه و تحلیل احساسات در سطح ویژگی را انجام دهد. در این راستا، در این رساله دو مدل با نظارت بسیار ضعیف و با حداقل وابستگی به دامنه برای تجزیه و تحلیل احساسات در سطح ویژگی بر روی نظرات برخط کاربران ارائه شده است. مدل بدون ناظر تشخیص ویژگی و احساس مدل پبشنهادی اول است که نیاز به مجموعه داده برچسب خورده ندارد و علاوه بر ویژگی های بارز، ویژگی های پنهان را نیز استخراج می کند. مدل تشخیص همزمان ویژگی و احساس jase به عنوان مدل پیشنهادی دوم ارائه شده است که بر اساس مدلسازی موضوعی سعی در تشخیص همزمان کلمات احساس و ویژگی ها دارد. این مدل پیشنهادی علاوه بر استفاده از مزایای روش های مبتنی بر تکرار و خصوصیات مفهومی متن، ساختار متن را نیز برای کاوش احساسات در نظر می گیرد. در بخش آزمایش ها، ارزیابی مدل های پیشنهادی در جهت رسیدن به حداقل وابستگی به زبان بر روی مجموعه داده های نظری به زبان های انگلیسی و فارسی در سطح سند و ویژگی احساسات بر اساس معیارهای استاندارد بازیابی اطلاعات انجام شده است. در این آزمایش ها مدل های پیشنهادی با سایر روش ها از جمله روش های مبتنی بر تکرار و رابطه و روش های مبتنی بر یادگیری نظارتی مقایسه گردیده است. نتایج ارائه شده از مدل های پیشنهادی و مقایسه آن با سایر مدل های استاندارد نشان از بهبود کارایی مدل های پیشنهادی نسبت به روش های پیشین دارد. با توجه به آزمایش ها، بهترین نتایج به دست آمده از مدل پیشنهادی بدون ناظر تشخیص ویژگی و احساس در معیارهای precision و recall به ترتیب برابر با 90% و 71% می باشند. همچنین بهترین کارایی در مدل پیشنهادی jase در معیار accuracy در بین مجموعه های داده نظری انگلیسی برابر با 86.79% و در بین مجموعه های داده نظری فارسی برابر با 79.58% است.

۱۵ صفحه ی اول

تجزیه و تحلیل عوامل ایجاد و تداوم موجودیهای راکد در انبار شرکت آب و فاضلاب شهری استان کرمانشاه

پایان نامه دانشگاه آزاد اسلامی واحد کرمانشاه - دانشکده ادبیات و علوم انسانی 1394
ایوب باقری ابراهیم عباسی

روش جمع?آوری اطلاعات بررسی اسناد و مدارک خرید نمونه?های انتخابی می باشد، روش فوق مفیدترین روش گرد?آوری اطلاعات تشخیص داده شد. روش نمونه?گیری به این ترتیب بوده که ابتدا با توجه اهمیت ریالی اقلام راکد، جامعه آماری به چهار طبقه تقسیم و از بین طبقات با استفاده از روش تصادفی ساده حدود 9% اقلام راکد به عنوان نمونه انتخاب شدند. نتایج تحلیل واریانس یک راهه نشان داد بین عوامل ایجاد و تداوم موجودیهای راکد در انبار شرکت آب و فاضلاب شهری استان کرمانشاه در سالهای 91 تا 93 تفاوت در سطح 01/0 < p معنی دار است همچنین نتایج آزمون کای اسکور نشان داد بین عوامل ایجاد یعنی اشتباه در شناسائی اقلام مورد نیاز، ، عدم تناسب اقلام موجودیهای انتقالی از تشکیلات قبلی با نیازهای شرکت ، عدم کنترل میزان موجودی اقلام در خواست شده و تداوم موجودیهای راکد در انبار شرکت آب و فاضلاب شهری استان کرمانشاه و تعداد آنها در هر سال رابطه معنی دار در سطح 01/0 < p وجود دارد.

نام پژوهشگر: ایوب باقری