نام پژوهشگر: محمود علیپورحیدری

روش های جانهی در داده های چند شکلی تک نوکلئوتیدی(snp) گم شده به صورت غیرتصادفی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده علوم پزشکی 1390
  محمود علیپورحیدری   حمید علوی مجد

هنگامی که با داده های گم شده سر و کار داریم، توجه به مکانیزم گم شدن داده ها در استنباط آماری از اهمیت زیادی برخوردار است. کنار گذاشتن داده های گم شده به خصوص در شرایطی که مکانیزم گم شدن تصادفی نباشد، موجب مخدوش شدن نتایج تحلیل خواهد شد. در حال حاضر با استفاده از تحلیل های آماری، ارتباط بین چندریختی تک-نوکلئوتیدی (snp) با برخی از بیماری ها مورد توجه بسیاری از محققین می باشد. همچنین داده های snp گم شده، در مطالعات ارتباط سنجی ژنتیکی متداول است. لذا در این مطالعه، ارتباط بین snpهای موجود در ژن dnmt1 از کروموزوم 19 انسان را با بیماری سرطان روده بزرگ، مورد بررسی قرار دادیم. هدف از این مطالعه، ارایه روش جانهی در داده هایی با snpهای گم شده به صورت غیرتصادفی است. در این مطالعه مورد-شاهدی، از بین بیماران مراجعه کننده به مرکز تحقیقات بیماری های گوارش و کبد دانشگاه علوم پزشکی شهید بهشتی تعداد یکصد بیمار مبتلا به بیماری سرطان روده بزرگ، به عنوان گروه مورد و یکصد نفر از سایر بیماران را به عنوان گروه شاهد تحت مطالعه قرار داده و آزمایشات ژنتیکی، جهت تعیین ژنوتیپ 6 مورد snp از ژن dnmt1 از کروموزوم 19 انسان، برای این بیماران انجام گردید. داده های حاصل با استفاده از روش رگرسیون لجستیک مورد تجزیه و تحلیل آماری قرار گرفت. سپس با حذف بخشی از داده ها به دو روش تصادفی و غیرتصادفی و جانهی آن ها با استفاده از الگوریتم em، تغییرات ضرایب رگرسیون لجستیک را قبل و بعد از این کار مقایسه نمودیم. یافته ها نشان داد که در هر دو روش گم شدن تصادفی و غیر تصادفی داده های snp، برآورد ضرایب رگرسیون لجستیک پس از جانهی توسط الگوریتم em، در مقایسه با روش حذف داده های گم شده، انطباق بیشتری با نتایج حاصل از تجزیه و تحلیل داده های کامل دارند.