مژگان فرهودی

گروه سکوهای فناوری اطلاعات، پژوهشکده فناوری اطلاعات، پزوهشگاه ارتباطات و فناوری اطلاعات، تهران، ایران

[ 1 ] - شبکه‌ی تصویری تصویرنت (تجربیات، چالش‌ها و ابزارهای بومی‌سازی شبکه‌ی تصویری ImageNet)

پایگاه های دادگان تصویری بزرگ به عنوان محتوای آموزشی در کاربردهای هوش بصری و همچنین الگوریتم های یادگیری عمیق مورد استفاده قرار میگیرند. شبکه‌ی تصویریِ تصویرنت، پایگاه داده‌ای ‌‌سلسله‌مراتبی از تصاویر و مطابق با فرهنگ ایرانی و اسلامی است که  با فراهم آوردن حدود 8 میلیون تصویر برای بیش از 30هزار واژه تهیه شده است. سلسله مراتب ترادف‌های تصویرنت مبتنی بر سلسله مراتب ترادف‌های ImageNet بوده که با اس...

[ 2 ] - Producing a Persian Text Tokenizer Corpus Focusing on Its Computational Linguistics Considerations

The main task of the tokenization is to divide the sentences of the text into its constituent units and remove punctuation marks (dots, commas, etc.). Each unit is a continuous lexical or grammatical writing chain that is an independent semantic unit. Tokenization occurs at the word level and the extracted units can be used as input to other components such as stemmer. The requirement to create...