نام پژوهشگر: محمد صابر زمان پور زهرایی

حل موازی معادلات اویلر روی پردازشگرهای گرافیکی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان 1390
  محمد صابر زمان پور زهرایی   محمود اشرفی زاده

بررسی جریان های تراکم پذیر از پرکاربردترین مسائل در مهندسی مکانیک می باشد. در شبیه سازی جریان های با عدد ماخ بالا به علت کاهش اثر لزجت، می توان از آن صرف نظر کرد. با حذف ترم لزجت از معادله ناویراستوکس، معادله اویلر حاصل می شود. برای تحلیل جریان های مافوق صوت و ماوراء صوت از معادله اویلر استفاده می شود. شبیه سازی جریان های تراکم پذیر به علت طولانی بودن زمان اجرا، بسیار پرهزینه است. اخیرا استفاده از پردازشگر گرافیکی برای محاسبات موازی جریان های تراکم پذیر غیرلزج رواج زیادی یافته است. کارهای انجام شده، نتایج خیره کننده ای از میزان افزایش سرعت روی پردازشگر گرافیکی نسبت به پردازشگر مرکزی نشان می دهد. در این تحقیق حل عددی معادلات حاکم برای جریان های تراکم پذیر غیرلزج با روش های hll، hllc و weno به صورت مبسوط شرح داده می شود و دقت این روش ها در حالت یک بعدی توسط حل دقیق مسأله ریمان، اعتبار سنجی و مقایسه می شوند.برای اعتبارسنجی در حالت دوبعدی از حل مسأله انفجار استفاده می شود. این حل با روش godunov مقایسه می گردد. حلگر مسأله ریمان در این مسأله همان حلگر دقیق می باشد با این تفاوت که یک ترم چشمه به آن اضافه شده است. برای شرایط مرزی در شبیه سازی جریان های دوبعدی از روش مرز شناور استفاده شده است. این روش مبتنی بر بکارگیری سیال مجازی به منظور توسعه شرایط مرزی با دقت حل بالا می باشد. با اعمال این روش می توان به جای استفاده از شبکه منطبق بر مرز ، از شبکه دکارتی مربعی استفاده نمود که باعث سادگی کار و کاهش هزینه های محاسباتی می شود. برای اعتبارسنجی روش مرز شناور، نقاط سه گانه ناشی از برخورد امواج در جریان پشت استوانه، مکانیابی می شود و با نتایج آزمایشگاهی و شبیه سازی های عددی مقایسه می گردد. برنامه های تراکم پذیر نوشته شده با استفاده از محیط کودا، قابل اجرا به صورت موازی روی پردازشگر گرافیکی می گردند. پردازنده گرافیکی مورد استفاده در این پژوهش، geforcegtx580 می باشد. این پردازنده دارای 512 هسته محاسباتی و حافظه جانبی 1536مگابایت است. سرعت انتقال اطلاعات در این پردازنده برابر 192 گیگابایت بر ثانیه می باشد. میزان افزایش سرعت با تعداد گره محاسباتی رابطه مستقیم دارد و با افزایش تعداد گره، مقدار آن افزایش می یابد. با استفاده از این پردازنده، میزان افزایش سرعت در برنامه یک بعدی hllc، 35 برابر محاسبه گردید. سرعت اجرای برنامه hll در حالت یک بعدی 30 برابر و در حالت دوبعدی بیش از 80 برابر افزایش یافته است. برای برنامه weno نیز افزایش سرعت معادل 36 برابر و 176 برابر حاصل شده است. این میزان افزایش سرعت بسیار خیره کننده است و برای اولین بار است که این میزان افزایش سرعت برای برنامه تراکم پذیر با استفاده از یک پردازنده گرافیکی به دست می آید. در این تحقیق به بررسی اثر اندازه بلوک روی میزان افزایش سرعت پرداخته شده است. نشان داده شد که بهترین اندازه بلوک در این کارت گرافیک، 1×512 می باشد. با استفاده از مرز شناور میزان افزایش سرعت کاهش می یابد اما با افزایش اندازه شبکه، این مقدار به مقدار افزایش سرعت بدون مرز شناور نزدیک تر می شود.