نام پژوهشگر: وریا عبدالله نژاد
وریا عبدالله نژاد عادل محمدپور
چکیده امروزه جمع آوری اطلاعات از طریق کامپیوتر و اینترنت باعث تولید زیاد داده شده است. کسب دانش از مجموعه داده های بزرگ ممکن است پیچیده و در مواردی غیر ممکن به نظر آید، بنابراین نیاز به داشتن روش ها و تکنیک هایی برای تلخیص و استخراج اطلاعات از این نوع داده ها ضروری است. یکی از تکنیک های مرسوم برای این کار خوشه بندی است. اساس این روش خلاصه کردن یک مجموعه از مشاهدات در تعداد محدودی گروه است، یا به طور هم ارز ایجاد یک افراز روی مجموعه ای از مشاهدات در داخل چند گروه جدا از هم به طوری که مشاهدات داخل هر گروه مشابه یکدیگر می باشند و مشاهداتی که در گروه های متفاوت قرار گرفته اند شباهت کمتری دارند. نوع خاصی از داده هایی که در چند سال اخیر بیشتر به آن توجه شده است داده های طولی می باشند که در واحدهای متوالی زمان از واحدهای مشخص به دست می آیند. هدف این پایان-نامه ارائه روشی برای خوشه بندی مدل-پایه برای داده های طولی است. برای این منظور داده های طولی با استفاده از توزیع های گاوسی و ناگاوسی با در نظر گرفتن ساختار کوواریانس مناسب برای این داده ها، خوشه-بندی می شوند.