نام پژوهشگر: مهدی وثیقی
مهدی وثیقی محسن کمپانی زارع
چکیده قسمت اول: فرآیند تقطیر از جمله روش های متداول جداسازی در مقیاس آزمایشگاهی و صنعتی میباشد و مطالعه آن از اهمیت ویژهای برخوردار است. در این راستا از طیف سنجی مادون قرمز نزدیک جهت استخراج دادهها از خروجی ستون تقطیر استفاده شد. طی این بررسی، مخلوط های دوتایی ساده ای همانند تولوئن-هگزان، تولوئن-سیکلوهگزن و تولوئن-اتانول جهت مطالعه این فرآیند مهیا گردید. بدلیل تفاوت نقطه جوش حلال های مذکور، غلظت این ترکیبات در خروجی ستون تقطیر متفاوت خواهد بود. این تغییرات موجب تغییرات رونددار در طیف ترکیب خروجی از ستون تقطیر خواهد شد. روش های مختلف کمومتریکس همانند تمرکز میانگین، آنالیز فاکتوری کاهش مرتبه و تکاملی با پنجره ثابت جهت آنالیز داده های مربوطه بکار گرفته شدند. با اعمال محدودیت های از قبیل بسته بودن و منفی نبودن در پروفیل های بدست آمده، محدوده جوابهای قابل قبول برای پروفیل های غلظتی و طیفی ترکیبات در طی فرآیند تقطیر بدست آمد. این آنالیز بر روی کاربرد روشهای مختلف کمومتریکس در بررسی داده های دو بعدی در شرایط مختلف متمرکز بوده و جزو معدود کاربردهای روشهای کمومتریکس در بررسی فرآیند تقطیر محسوب می گردد. قسمت دوم: در ادامه روشی جهت اندازه گیری غلظت آنالیت (حلال آلی) در حضور گونه های مزاحم ناشناخته (مخلوط حلالهای آلی) پیشنهاد شد. در این مطالعه، افزایش آنالیت به مخلوط موجب افزایش غلظت آنالیت و کاهش یکنواخت غلظت گونه های مزاحم خواهد شد، بطوری که چندین گونه مزاحم به صورت مزاحمی واحد رفتار خواهند کرد. با افزایش متوالی آنالیت به مخلوطی با چندین گونه مزاحم و ثبت طیف مادون قرمز نزدیک از مخلوط، ماتریس دادهای با رتبه 2 بدست خواهد آمد. با توجه به مشخص بودن مدل تغییرات غلظت آنالیت طی افزایش و طیف خالص آن، می توان سهم آنالیت را، با تخمین مناسبی از غلظت اولیه آن در مخلوط، با استفاده از روش آنالیز فاکتوری کاهش رتبه از ماتریس داده کم کرد. روش پیشنهادی جهت آنالیز داده های شبیه سازی شده، تولوئن در مخلوط تولوئن-سیکلوهگزن و همچنین بنزین به عنوان نمونه ای واقعی بکار رفت و نتایج بدست آمده قدرت بالای روش در آنالیز مخلوط حلال ها را بیش از پیش نمایان ساخت می باشد. قسمت سوم: قسمت سوم این پایان نامه به مطالعات الگوشناسی اختصاص دارد. در بخش اول این قسمت مدلی جهت طبقه بندی نمونه های خونی سالم (15 نمونه) و مبتلا به تالاسمی (13 نمونه) پیشنهاد گردید. داده ثبت شده طیفهای رزونانس مغناطیسی هسته هیدروژن مربوط به سرم های خونی بودند. ابعاد داده ها در ابتدا توسط روش تحلیل گونه اصلی کاهش یافته و سپس مدل تحلیل افتراقی خطی جهت طبقه بندی این داده ها استفاده شد. تعداد ابعاد بهینه (تعداد گونه های اصلی) مورد استفاده در مدل، توسط معتبرسازی متقاطع تک حذفی برابر با 11 بدست آمد. در ادامه مدلی جهت پیش بینی مقادیر یکسری پارامترهای خونی با استفاده از داده های رزونانس مغناطیسی هسته هیدروژن موجود و شبکه عصبی مصنوعی با تابع شعاعی ارائه شد. ابعاد داده ها در ابتدا توسط روش تحلیل گونه اصلی کاهش یافته و گونههای اصلی سری آموزش برای فرآیند یادگیری شبکه مورد استفاده قرار گرفت و نتایج قابل قبولی بدست آمد. قسمت چهارم: در ادامه مطالعات الگوشناسی، توانایی طبقه بندی نقشه های خودساختی نظارتی با روشهای دیگری همچون تحلیل افتراقی خطی، مقدار دهی برداری آموزشی و ماشینهای بردار پشتیبان مقایسه شد. جهت این بررسی جعبه ابزار نقشه های خودساختی مهیا گردید و از سه داده شبیه سازی شده که در شرایط مختلف ساخته شده بودند استفاده شد. کیفیت و پایداری روشهای مذکور در آنالیز دادههای شبیهسازی شده با توجه به توزیع درصد نرخ صحت طبقه بندی سری آزمایش (50 بار تکرار) مورد بررسی قرار گرفت. نتایج بدست آمده گواه این موضوع است که نقشه های خودساختی نظارتی، خصوصا شبکه انتشار متقابل، از توانایی درخور توجهی در آنالیز داده ها با شرایط متفاوت برخوردار می باشند. همچنین ساختار داده ها و نوع توزیع نمونه ها در فضای داده ها نیز باید همواره پیش از ساخت مدل مورد توجه قرار گیرد. قسمت پنجم: بهینه سازی روش های طبقه بندی از تاثیر ویژه ای در کیفیت و کارایی مدل بدست آمده برخوردار است. نقشه های خودساختی نظارتی از قبیل شبکه های انتشار متقابل از جمله روش های طبقه بندی هستند که افزایش روزافزون استفاده از آنها، لزوم انجام بهینه سازی مدل را بیشتر نمایان میکند. با توجه به این موضوع، روشی بر مبنای الگوریتم ژنتیک جهت بهینه سازی پارامترهای شبکههای انتشار متقابل ارائه گردید. تابع شایستگی جدیدی با تلفیق خطای سری آموزش و معتبرسازی پیشنهاد شد. با توجه به وابستگی نسبی نتایج الگوریتم ژنتیکی به جمعیت اولیه و اعضای سری آموزش و تست، بهینه سازی توسط روش فوق چندین بار تکرار شد و کروموزومهایی که فرکانس نسبی تکرار آنها در کل و میانگین مقدار تابع شایستگی آنها بالا بود به عنوان شرایط بهینه برای مدل معرفی شدند. در انتخاب کروموزوم(ها) بهینه از نموداری حبابی شکل، که از رسم فرکانس نسبی به میانگین تابع شایستگی بدست آمده بود، استفاده شد. داده های واقعی مختلفی در همین راستا مورد بررسی قرار گرفتند و نتایج قابل قبولی حاصل گردید.
سهیلا مزین مهدی وثیقی
جستار دگرگونی اقلیم از جستارهای روز و چالشهای جهانی است. آگاهی از چگونگی اقلیم کنونی و دگرگونی های آن نسبت به گذشته می تواند در برنامه ریزی های سیاسی، اجتماعی و اقتصادی انسانهای ساکن بر روی کره ی زمین کارساز باشد. از سویی برای این آگاهی تکاپوهای بسیاری بدست فیزیکدانان و اقلیم شناسان با روش های گوناگون روی داده است. با این همه در بسیاری از مسایل, نبود باور و اطمینان پدید آمده است. در این کار کوشش کرده ایم با به کارگیری از شبکه های عصبی مصنوعی با دقت بیشتری مساله دگرگونی اقلیم را بررسی کنیم. شبکه عصبی مصنوعی، یکی از روشهای تازه و رو به پیشرفت می باشد که در جستارهای گوناگون از دست پیش بینی، خوشه بندی و الگو سازی به کار گرفته می شود. شبکه عصبی مصنوعی برگرفته از شبکه عصبی مغز انسان می باشد که با دریافت داده ها از راه دندریتها در نرونها پردازش مورد نیاز روی داده و از راه آکسون فرمان یا برونرفتی فرستاده می شود. شبکه عصبی از لایه ورودی، لایه یا لایه های پنهان و لایه برونرفت تشکیل شده است. بر پایه معماری شبکه شمار نرونهای لایه های ورودی و پنهان تعیین می گردد. همواره تابعی به نام تابع پویاسازی که روی نرون نهاده شده و بر ورودی هااثرکرده و برونرفتی را فرآوری می کند پدید آمده است. شبکه عصبی باید بر پایه الگوریتم آموزشی ( روشی که وزنهای روی آکسونها بر پایه آن دگرگون می شوند تا برونرفت مورد دلخواه را بدست آوریم ) برای برونرفت دلخواه آماده سازی گردد. در این کار، به کاربرد شبکه عصبی خودسازمانگر از میان گونه های شبکه ها، در بررسی دگرگونی اقلیم پرداخته شده است. برای این کار داده های هواشناسی نوشته شده به گونه روزانه در درازای 44 سال برای ایستگاه سینوپتیکی زنجان را به کار گرفته ایم. در پایان به برآیند خوبی به ویژه در دگرگونی اقلیم در زنجان رسیدیم. برآیند نشانگر یک دگرگونی اقلیم تدریجی از هر 5 سال به 5 سال پسین و همچنین از هر دهه به دهه ی دیگر بوده و این دگرگونی ها پس از سال 1370 آشکار تر شده است و همچنین گرایش به گرم شدن در ماههای سرد سال کاملا آشکار می باشد.
فاطمه خوشخو مهدی وثیقی
تجزیه و تحلیل و تفسیر توالی های زیستی در زمره مسائل مورد توجه در حیطه بیوانفورماتیک است. عملکرد پروتئین ها وابسته به ساختار فضایی آن هاست. به عبارت دیگر می توان گفت که ساختار سه بعدی یک پروتئین ، خاصیت های عملکردی پروتئین را تعیین می کند. به منظور بررسی عملکرد پروتئین دانشمندان سعی در پیش بینی ساختار سه بعدی پروتئین از توالی اسید آمینه ی آن دارند. علی رغم مطالعات گسترده در زمینه ی ساختار پروتئین ها، تعیین ساختار سه بعدی پروتئین کماکان کار مشکلی است. با توجه به این موضوع که اسیدهای آمینه توسط رشته ای از کاراکترها نشان داده می شوند، لازمه پیش بینی ساختار پروتئین های جدید، تبدیل اسیدهای آمینه به فرمت عددی است. در این پژوهش، برای توصیف دنباله های پروتئین، از یک توصیف مبتنی بر استخراج ویژگی به نام k-mer استفاده شده است. به طور خاص برای هر توالی پروتئین، یک بردار ??? مولفه ای ایجاد می گردد. این رویکرد جدید به دلیل در نظر گرفتن همزمان ترتیب، تعداد حضور وفاصله ی آمینو اسیدها، اطلاعات بیشتری جهت طبقه بندی ساختار پروتئین ها استخراج می نماید و به طراحی مدلی دقیق تر جهت کلاس بندی منجر می گردد. به منظور طبقه بندی پروتئین ها با استفاده از اطلاعات ساختار اول از شبکه عصبی مصنوعی xy-fused استفاده شده است. این نوع شبکه عصبی مصنوعی برپایه ی نوعی از نقشه های خودسازمانده بوده که از توانایی بالایی جهت یادگیری نظارتی (طبقه بندی داده ها) برخوردار می باشد. روش پیشنهادی بر روی یکی از چالش برانگیزترین مجموعه داده ها اعمال گردید و صحت طبقه بندی توالی های بیولوژیکی توسط معتبرسازی متقاطع در حدود ??? بدست آمد که در مقایسه با سایر روش های پیشنهادی جهت آنالیز این داده ها بهبود قابل توجهی مشاهده گردید.
لیلا جعفری بهرام صادقی بی غم
تشخیص سرطان، از جمله موارد چالش برانگیزی است که در دهه ی اخیر توجه زیادی را به خود جلب کرده است. با توجه به مشکلات ساخت یک مدل طبقه بندی دقیق، روش های مختلف پردازش و آنالیز تصاویر پزشکی از جمله روش های استخراج ویژگی به همراه روش های یادگیری ماشین از قبیل شبکه های عصبی مصنوعی مورد بررسی و تحقیق بسیاری از پژوهشگران قرار گرفته است. ویژگی به عنوان مشخصه ای از تصویر، می تواند شامل ویژگی خاصی از تصویر یا ویژگی عمومی از آن همانند رنگ، شکل و بافت باشد. الگوریتم های مختلفی برای استخراج ویژگی وجود دارد که از آن جمله می توان به روش های ساختاری، آماری و مبتنی بر تبدیل اشاره کرد. در این مطالعه، تمرکز بر روی روش های آماری و محاسبه ماتریس های هم رخدادی تعمیم یافته برای تصاویر رنگی است. واضح است که استخراج حداکثر اطلاعات از تصاویر بدست آمده از بافت های سالم و ناسالم، از اهمیت بالایی برخوردار است. اطلاعات استخراج شده از انواع تصاویر بافت های بیولوژیکی، برای طبقه بندی توسط روش های یادگیری ماشین مورد استفاده قرار می گیرند. نقشه های خودسازمانده با توجه به توانایی بالا جهت طبقه بندی تصاویر در این پژوهش مورد بررسی قرار گرفته است. نتایج به دست آمده حاکی از آن است که روش ماتریس هم رخدادی تعمیم یافته برای استخراج ویژگی از تصاویر رنگی و روش های یادگیری نقشه های خودسازمانده نظارتی جهت طبقه بندی انواع بدخیمی ها کارا هستند. برای به دست آوردن کارایی مدل، از روش اعتبارسنجی متقاطع استفاده شده است. یکی از مجموعه داده های مورد بررسی در این مطالعه، تصاویر بافت های بیولوژیکی غدد لنفاوی است که شامل 374 تصویر رنگی با ابعاد ????×1040 پیکسل، نشان دهنده سه نوع بافت مربوط به غده سرطانی بافت های لنفاوی در بدن است. بهترین نتیجه برای این مجموعه داده برای ترکیب مولفه های رنگی rg برابر با ?/ 92 درصد حاصل شده است. مجموعه داده دیگر، ?? نمونه از تصاویر لکه های خونی با ابعاد ???×??? پیکسل، شامل ?? شخص بیمار مبتلا به تالاسمی و ?? شخص سالم است که توسط گروهی در دانشکده بیوفیزیک دانشگاه تحصیلات تکمیلی زنجان جمع آوری شده است. همچنین اطلاعاتی از پارامترهای خونی ?? نمونه اندازه گیری شده است و علاوه بر طبقه بندی نمونه ها بر اساس بافت های سالم و ناسالم که بهترین نتیجه برای ترکیب مولفه های rg برابر با ?/92 درصد حاصل شده، طبقه بندی بر اساس میزان پارامترهای خونی همانند hgb نیز انجام شده و نتایج خوبی حاصل شده است.
رقیه ابوالقاسمی بهرام صادقی بی غم
تجزیه، تحلیل و طبقه بندی داده های میکروآرایه یکی از موضوعات چالش برانگیز در حیطه بیوانفورماتیک است. از مهم ترین ویژگی های داده های میکروآرایه، ابعاد بسیار بالا (تعداد ژن های زیاد) در برابر تعداد کم نمونه ها می باشد. این عامل، باعث بروز مشکلات و چالش هایی در زمینه تحلیل این نوع داده ها شده است. بنابراین از روش های انتخاب ویژگی و کاهش ابعاد داده ها جهت حل این مشکلات و ارائه مدلی ساده تر و دقیق تر استفاده می شود. در این پژوهش، روشی برای یافتن ژن های حاوی اطلاعات و همچنین طبقه بندی داده های میکروآرایه ارائه گردیده است. روش پیشنهادی از سه بخش اصلی تشکیل شده است. در بخش اول، ابعاد داده ها با استفاده از شبکه عصبی som غیر نظارتی کاهش یافته و به فضایی شامل نورون ها نگاشت می شود. در بخش دوم، به وسیله الگوریتم ژنتیک، زیرمجموعه های بهینه حاوی نورون ها استخراج شده و نورون ها رتبه بندی می گردند. در آخرین بخش، ژن های حاوی اطلاعات با ارزش انتخاب می گردند. در این روش به علت استفاده از شبکه عصبی som ، ژن های خلاصه سازی شده برای انتخاب ویژگی استفاده می شوند که همین امر باعث کاهش زمان محاسباتی انتخاب ویژگی نسبت به روش هایی است که خلاصه سازی در آن ها صورت نمی گیرد. همچنین به علت عدم استفاده از روش های آماری (آزمون (t جهت رتبه بندی مجزای ویژگی ها، تمامی ژن ها یا نمایندگان آن ها در مراحل انتخاب ویژگی و ساخت مدل شرکت دارند. روش پیشنهادی بر روی یکی از مجموعه داده های پرچالش که مربوط به میکروآرایه سرطان سینه است، جهت طبقه بندی نمونه ها و انتخاب ویژگی (ژن ها) بر اساس دو نوع تومور لومینال و غیرلومینال به کار گرفته شد و توانست میانگین صحت طبقه بندی مدل ها را در اعتبارسنجی متقاطع ?? تایی، نسبت به روش های پیشنهادی قبلی بر روی همین داده ها از ?? درصد به ?? درصد برساند. علاوه بر این، ژ ن های انتخاب شده به عنوان ژن های حاوی اطلاعات با ارزش، از لحاظ عملکردهای زیستی، از عوامل موثر در تمایز دو نوع سرطان لومینال و غیرلومینال می باشند که همین امر، قدرت روش پیشنهادی را در بهبود مدل های طبقه بندی و انتخاب ویژگی های موثر هرچه بیشتر بیان می نماید.
محمد شهبازی مهدی وثیقی
داده مورد بررسی در این تحقیق، داده¬ای است که به ازای هر نمونه یک ماتریس در اختیار داریم. بدین¬ترتیب یک اصلاح بر روی شبکه¬های عصبی خود ساختی انجام خواهد ¬گرفت و به جای ارایه بردار به شبکه، یک ماتریس به شبکه ارایه خواهد ¬شد که مکانیسم رقابت بین نورون¬ها بر اساس شباهت ماتریس¬ها خواهد بود. در نهایت یک مدل طبقه بندی از داده¬های طیفی تجزیه¬ای فلورسانس (ماتریس داده تحریک-نشر برای هر نمونه) سرطان روده (نمونه¬ها شامل افراد سالم، بیمار و دارای غده خوش¬خیم می¬باشد) استخراج خواهد شد که بوسیله مدل ساخته شده می¬توان پیش¬بینی و حتی پیش¬-گیری بیماری برای نمونه¬های مجهول مربوط به افراد مختلف را انجام داد.
زهره پیروزه مهدی وثیقی
مسئله تاخوردگی پروتئین فرآیند پیش بینی ساختار سه بعدی پایدار پروتئین با استفاده از دنباله ی اسیدآمینه های آن است؛ بطوریکه ساختار پیش بینی شده در میان تمام ساختارهای سه بعدی ممکن دارای کمترین سطح انرژی آزاد باشد. به منظور کاهش پیچیدگی محاسباتی مدل های زیادی جهت ساده سازی مسئله پیشنهاد شده است که مدل hp یکی از قدرتمندترین این مدل ها می باشد. حتی در این مدل نیز ثابت شده است که مسئله ی تاخوردگی پروتئینnp-تمام است. پژوهش حاضر در زمینه ی مطالعه ی مسئله ی تاخوردگی پروتئین روی مدل hp در دو بعد می باشد و شامل افزایش کارایی الگوریتم جستجوی ممنوعه از طریق تغییر محتوای لیست ممنوعه و تنوع بخشی روی لیست کاندید، همچنین ارائه ی یک تابع انرژی بهبود یافته، می باشد.