نام پژوهشگر: حمید رضا ابوطالبی

بررسی امکان تجمیع خدمات صدا وداده در شبکه های مبتنی بر اترنت
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1388
  اسماعیل نیک ملکی   قاسم میرجلیلی

امروزه ارائه خدمات تلفنی روی شبکه های سوئیچینگ بسته ای به عنوان یکی از موضوعات اساسی حوزه شبکه مطرح شده است تا برخی معایب سیستم های سنتی سوئیچینگ مداری (از قبیل بالابودن هزینه ارتباط و نگهداری) را مرتفع کرده و سرویس های تکمیلی را نیز ارائه دهد. از جمله اهداف کلیدی در ارائه خدمات تلفنی، حفظ کیفیت خدمات می باشد. اما شبکه های موجود معمولاً شبکه هایی بر مبنای بهترین تلاش بوده و برای کاربردهای بلادرنگ مناسب نمی باشند. این بدان معناست که در این شبکه ها هیچ تکنیک ذاتی برای کنترل تلفات و تأخیر ترافیک تلفنی وجود ندارد. برای برطرف کردن این مشکل در نخستین مرحله، ارزیابی عملکرد شبکه اهمیت فراوانی دارد تا دریابیم کدامیک از اجزای شبکه نمی تواند کیفیت خدمات مورد نظر را فراهم آورد. بنابراین در این پایان نامه ضمن معرفی استاندارد ها ، روش های کلی پیاده سازی و ملزومات خدمات تلفنی روی شبکه های سوئیچینگ بسته ای ، شیوه ای جامع بر اساس آنالیز معیارهای کمی وکیفی ارائه می شود تا آمادگی شبکه های مبتنی بر اترنت در ارائه خدمات تلفنی ارزیابی شود. برای ارزیابی معیارهای کمی، روشی نوین به منظور تعیین ظرفیت در دسترس شبکه برای پشتیبانی از خدمات صوتی با در نظر گرفتن محدودیت پهنای باند و تأخیر پیشنهاد می شود. صحت عملکرد روش پیشنهادی به کمک نرم افزار opnet که شبیه سازی توانا در عرصه شبکه می باشد بررسی می شود. در روش ارائه شده برای تحلیل پهنای باند، پس از محاسبه ظرفیت در دسترس هر یک از اجزای شبکه، گلوگاه پهنای باند با در نظر گرفتن عنصری که حداقل ظرفیت در دسترس را دارد، مشخص می شود. سپس حداکثر تماس های تلفنی پشتیبانی شده توسط این عنصر به عنوان محدودیت ناشی از پهنای باند در شبکه مفروض ارائه می شود. محدودیت ناشی از تأخیر به کمک آنالیز صف بندی بررسی می شود. در این روش تماس ها بین نقاط انتهایی شبکه بصورت مداوم اضافه می شوند. زمانی که تأخیر بسته ها به حد مجاز در نظر گرفته شده برای کاربردهای محاوره ای رسید، حداکثر تعداد تماس های با در نظر گرفتن معیار تأخیر بدست می آید. مزیت روش پیشنهادی نسبت به نرم افزار opnet در این است که در این نرم افزار هر گونه تغییر در ساختار و پروتکل های شبکه پیچیده و در بسیاری از موارد غیر ممکن است. در حالی که در روش ارائه شده شبکه بصورت ریاضی مدل می شود و براحتی می توان تغییرات را اعمال کرد. در سال های اخیر پژوهش های بسیاری مبتنی بر ارزیابی شبکه بر اساس معیارهای کیفی انجام شده است. پرکاربردترین معیار ارزیابی کیفی شبکه ، mos می باشد. که در این معیار تعداد زیادی از شنوندگان به کیفیت گفتاری که از یک سیستم مخابراتی عبور کرده، عددی بین یک تا پنج نسبت می دهند. اعمال این معیار به شبکه های بلادرنگ امکان پذیر نمی باشد. در این نوع از شبکه ها از برخی روش های محاسباتی برای تعیین این معیار کیفی استفاده می شود. در این پایان نامه extended_e_model که یک مدل محاسباتی در ارزیابی کیفیت ادراکی گفتار است به یک شبکه نمونه اعمال می شود و نتایج حاصل از معیارهای کمی وکیفی با یکدیگر مقایسه می شوند. در نهایت در بخش پایانی رساله، روشی هفت مرحله ای به منظور پیاده سازی موفق خدمات تلفنی روی شبکه های سوئیچینگ بسته ای معرفی می شود و با اعمال این روش به یک شبکه نمونه ، نحوه عملکرد آن توضیح داده می شود.

پیاده سازی پایدار عددی مدل مخفی مارکف برای تعیین نقش دستوری اجزای متن
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1389
  طاهره جان بزرگی   سید ابوالفضل شاهزاده فاضلی

یکی از وظایف اصلی در پردازش زبان طبیعی(nlp) برچسب گذاری گرامری اجزای متن است. یک سیستم برچسب گذار، نقش گرامری واژه را در متن ورودی مشخص می سازد که در بسیاری از کاربردهای nlp مانند استخراج اطلاعات، ترجمه ماشین و تبدیل متن به صدا ضروریست. فرآیند برچسب گذاری با سه نوع الگوریتم قابل پیاده سازیست: الف) برچسب گذاری بر پایه قواعد دستوری، ب) برچسب گذاری آماری و ج) برچسب گذاری ترکیبی یا بر پایه قواعد تبدیل. سیستم های برچسب گذار اولیه سعی داشتند مجموعه ای از قوانین گرامری و دستوری را با متن ورودی منطبق کنند، به این صورت که اگر واژه های ورودی در داخل مجموعه ای از قواعد و قوانین جای می گرفتند و با آن سازگار می شدند، برنامه می توانست واژه را برچسب گذاری کند. این روش به اطلاعات زبان شناسی بسیاری نیاز دارد که بدست آوردن آن ها مستلزم فرآیند پرخطا و زمان بر است. سیستم های برچسب گذار امروزی تا حد زیادی از روش های آماری یادگیری ماشین استفاده می کنند که به اطلاعات زبان شناسی کمتری نیاز دارند و به بکارگیری آن ها نتایج بهتری حاصل می شود. یکی از مدل های مسلط امروزی در این زمینه مدل مخفی مارکف است. در مدل مخفی مارکف، هدف مشخص کردن اطلاعات پنهان از سیستم، از اطلاعاتی که برای سیستم شناخته شده است می باشد که به آن مشاهدات سیستم گویند. در یک سیستم برچسب گذار بر پایه مدل مخفی مارکف، مشاهدات، دنباله ای از واژه ها هستند و می خواهیم محتمل ترین دنباله برچسب ها را برای مشاهدات بدست آوریم. کاربردهای مدل مخفی مارکف برای دنباله های طولانی مشاهدات، منجر به ماتریس های تنک با درایه هایی از احتمالات بینهایت کوچک می شود که ممکن است به ناپایداری عددی بیانجامد. در این پایان نامه به دنبال ارائه الگوریتم هایی برای حل مسأله “داده تنک” و “ ناپایداری عددی” هستیم. پیاده-سازی عملی و پایدار عددی برای این مدل می تواند راهگشای ضمیمه گرهای موجود در جهت افزایش دقت و سرعت باشد.

بهبود عملکرد جداسازی کور سیگنالهای گفتار با به کارگیری روش زیرباند
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1389
  دانیال جعفری مرام   مسعود رضا آقابزرگی صحاف

از جمله روشهای مطرح برای جداسازی چند سیگنال گفتار، که در گیرنده ها با یکدیگر ترکیب شده اند، استفاده از روشهای جداسازی کور منابع (bss) است. جداسازی کور منابع عبارت است از جداسازی و تخمین سیگنالهایی که توسط منابع در یک کانال نامعلوم تولید شده و ترکیبات آنها در گیرنده ها دریافت شده است. این ترکیبات می توانند لحظه ای یا کانولوتیو باشند که برای سیگنالهای گفتار در کاربردهای واقعی ترکیبات به صورت کانولوتیو هستند. انجام جداسازی برای ترکیبات کانولوتیو مشکل بوده و با پیچیدگی و بار محاسباتی زیادی همراه است. با رفتن به حوزه فرکانس و تبدیل عمل کانولوشن به ضرب این مسئله ساده می شود؛ اما حوزه فرکانس مشکلات و محدودیتهای خاص خود را دارد. به همین خاطر شیوه های جداسازی در حوزه زیرباند مطرح شده اند. در این پایان نامه جداسازی کور منابع و شیوه های حوزه زمان و حوزه فرکانس مرور شد. مشکلات و محدودیتهای حوزه فرکانس بررسی شد و جداسازی سیگنالها در حوزه زیرباند انجام گردید. حوزه زیرباند شامل مراحل آنالیز سیگنال، جداسازی و سنتز است. در مرحله آنالیز سیگنالها با استفاده از یک بانک فیلتر به چند زیرباند تجزیه می شوند و جداسازی در هر زیرباند انجام می گیرد و در مرحله سنتز سیگنالهای جداشده زیرباندهای مختلف با هم ترکیب شده و سیگنال باند کامل بدست می آید. برای جداسازی از یک الگوریتم دکانولوشن کور چندکاناله استفاده کردیم و توانایی الگوریتم جداساز در مرحله جداسازی سیگنالهای گفتار بررسی شد. پس از آن از این الگوریتم در مرحله جداسازی حوزه زیرباند استفاده شد. با رفتن به حوزه زیرباند عملکرد سیستم جداسازی با کاهش بار محاسباتی و افزایش سرعت همگرایی بهبود یافت.

پاکسازی توأم نویز و پژواک از روی سیگنال گفتار با فرض مدل آماری لاپلاسین
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1390
  مهدی رشیدی نژاد بشر ابادی   حمید رضا ابوطالبی

با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته است که در همه این کاربردها وجود نویز و پژواک باعث کاهش کارآیی سیستم های گفتاری می شود. بنابراین لازم است که در محیط های نویزی و دارای پژواک نیز عملکرد مناسب و دقیق تری برای این سیستم ها داشته باشیم. تاکنون تعداد زیادی از الگوریتم های بهسازی گفتار براساس تخمین گر دامنه طیف سیگنال گفتار مبتنی بر معیار mmse با فرض گوسی بودن ضرائب dft سیگنال گفتار، ارائه شده اند. در سال های اخیر محققان به دنبال وارد کردن مدل های احتمالاتی دقیق تری برای ضرائب dft سیگنال گفتار هستند. در این پایان نامه، ابتدا به بررسی سیستم های تک -کاناله تخمین دامنه سیگنال تمیز با فرض گوسی بودن ضرائب dft سیگنال گفتار می پردازیم. سپس تخمین گر ارائه شده مبتنی بر فرض توزیع لاپلاسین (lapmmse) و تقریب ارائه شده از آن (با نام aplapmmse) مورد بررسی و مطالعه قرار می دهیم. در ادامه، با توجه به پیچیده، غیرخطی و برای پیاده سازی زمانبر بودن این تقریب، با استفاده از تقریب های مناسب دیگری برای تابع بسل و برای تابع چگالی احتمال مشترک، این روش را بهبود داده و تخمین گر جدید impaplapmmse را ارائه می دهیم. در ادامه این پایان نامه، روش تخمین مرتبه متغیر mmse (?-order mmse) و نیز تخمین گرammse را نیز با فرض لاپلاسین بودن ضرائب dft مورد بازنگری قرار داده و تخمین گرهای جدید در هر مورد استخراج می کنیم. در انتها، به بررسی و تعمیم روش های تخمین دامنه طیف سیگنال گفتار به منظور کاهش نویز و پژواک از روی سیگنال گفتار و تأثیر وارد کردن مدل آماری سیگنال گفتار بر روی عملکرد این روش ها می پردازیم. در این راستا روش های پیشنهادی ?-order aplapmmse و alapmmse را برای کاهش پژواک تعمیم می دهیم. با مقایسه روش های پیشنهادی (?-order aplapmmse و alapmmse) با روش های om-lsa و ammse، تأثیر وارد کردن مدل آماری سیگنال گفتار برای کاهش پژواک را ارزیابی می کنیم. نتایج نشان می دهند با وارد کردن مدل آماری سیگنال گفتار کارآیی این تخمین گرها هنگامی که سیگنال گفتار به طور همزمان دارای نویز و پژواک است، بهتر است

مکان ِیابی منابع گفتار با استفاده از نمونه برداری فشرده
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1390
  مهدی بنی طالبی دهکردی   حمید رضا ابوطالبی

مکان یابی منابع گفتار از جمله زمینه های تحقیقاتی است که امروزه مورد توجه بسیاری از محققین قرار گرفته است. در برخی کاربردها، مکان یابی منابع صوت خود به عنوان هدف نهایی پردازش مطرح است و در برخی دیگر، مکان یابی پیش نیاز مراحل بعدی پردازش (نوعاً بهسازی گفتار) می باشد. با داشتن این اطلاعات می توان با حذف منابع تداخلی و مزاحم، سیگنال گفتار را بهسازی کرد. همچنین با داشتن اطلاعات مکان سیگنال گفتار با اعمال فیلتر فضائی می توان برای جداکردن تک گوینده در حالت چند گویندگی بهره برد. زمینه کاری این پایان نامه در مورد مکان یابی منابع صوت با استفاده از تکنیک نمونه برداری فشرده است. تخمین مکان منبع صوت می بایست با سرعت بالا و تأخیر خیلی کم انجام شود تا به اندازه کافی دقیق باشد، به همین دلیل گزینه ی استفاده از نمونه برداری فشرده به منظور کاهش حجم محاسبات و افزایش سرعت پردازش، از جمله گزینه های مطلوب برای انتخاب می باشد. در نمونه برداری فشرده ما به دنبال ایجاد تُنُکی و استفاده از شرایط مربوط به نمونه برداری تصادفی و کاهش حجم محاسبات هستیم. برای رسیدن به این هدف دو راه پیش روی ما وجود دارد، راه اول استفاده از یک سیگنال ورودی تُنُک در محاسبات مربوط به الگوریتم های مختلف مکان یابی است. در روند مطالعات انجام شده الگوریتمی ارائه شد که با استفاده از روش استخراج ویژگی مبتنی بر نمونه برداری فشرده تُنُکی مورد نظر ایجاد می گردد و در نهایت با استفاده از این کاهش بُعد مکان یابی صورت می گیرد. راه دوم استفاده از فرض تُنُکی فضایی موقعیت منابع است. در این راستا الگوریتمی ارائه شد که فضا را بر روی نقاط موجود در یک شبکه ی حلقوی نظیر می کند. این فرض باعث ایجاد تُنُکی در محاسبات می شود. در قسمت انتهایی این پایان نامه الگوریتمی ارائه شد که ترکیبی از دو راه فوق برای استفاده از نمونه برداری فشرده و درنتیجه کاهش حجم محاسبات، می باشد.

بهبود سیستم های تایید چهره با استفاده از تکنیک نمونه برداری فشرده
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1391
  یلدا عمیدی   محمد تقی صادقی

با توجه به کاربرد روزافزون سیستم های بازشناسی چهره در زندگی روزمره، بهبود عملکرد این سیستم ها مورد توجه بسیاری از پژوهش گران قرار گرفته است. در سیستم های بازشناسی الگو و کاربرد خاص آن یعنی سیستم های تایید چهره، به منظور افزایش کیفیت و کاهش پیچیدگی سیستم، با هدف کاهش بعد داده ها و حفظ هرچه بیشتر اطلاعات جداکننده دسته های مختلف، داده ها به یک فضای ویژگی مناسب نگاشت پیدا می کنند. اخیراً با ورود مفاهیم جدیدی چون تنک بودن سیگنال ها و نمایش آن ها براساس تعداد نمونه کمتر، مسئله بکارگیری تکنیک های نمایش تنک در سیستم های شناسایی آماری الگو و بینایی ماشین مطرح شده است. در این پژوهش، چگونگی بهره گیری از این تکنیک ها در مراحل استخراج ویژگی و طبقه بندی داده ها در قالب یک سیستم بازشناسی چهره مورد بررسی قرار می گیرد. برای این منظور، ابتدا عملکرد طبقه بندی کننده مبتنی بر نمایش تنک (src)با طبقه بندی کننده های پایه مبتنی بر معیارهای سنجش فاصله مقایسه شده و برتری قابل ملاحظه src در کاربرد مورد نظر اثبات می شود. سپس، عملکرد سیستم بازشناسی چهره در فضاهای مختلف ویژگی مبتنی بر تکنیک های نمایش تنک ارزیابی شده و نشان داده می شود که در سیستم تائید چهره مورد بحث، روش استخراج ویژگی«نگاشت با حفظ تنکی سیگنال محلی» در مجموع به نتایج بهتری منجر می شود. در بخش دیگری از این پژوهش، مسئله ی تعمیم طبقه بندی کننده مبتنی بر نمایش تنک، در کاربرد جداسازی زوج تصاویر سازگار و ناسازگار مورد توجه قرار گرفته و روشی نوین ارائه می شود. با بکارگیری روش پیشنهادی، داده های سازگار و ناسازگار پایگاه داده ی lfw (که تصاویر آن در شرایط کنترل نشده جمع آوری شده است) با درصد صحت قابل قبولی طبقه بندی می شوند.