مژگان فرهودی
گروه سکوهای فناوری اطلاعات، پژوهشکده فناوری اطلاعات، پزوهشگاه ارتباطات و فناوری اطلاعات، تهران، ایران
[ 1 ] - شبکهی تصویری تصویرنت (تجربیات، چالشها و ابزارهای بومیسازی شبکهی تصویری ImageNet)
پایگاه های دادگان تصویری بزرگ به عنوان محتوای آموزشی در کاربردهای هوش بصری و همچنین الگوریتم های یادگیری عمیق مورد استفاده قرار میگیرند. شبکهی تصویریِ تصویرنت، پایگاه دادهای سلسلهمراتبی از تصاویر و مطابق با فرهنگ ایرانی و اسلامی است که با فراهم آوردن حدود 8 میلیون تصویر برای بیش از 30هزار واژه تهیه شده است. سلسله مراتب ترادفهای تصویرنت مبتنی بر سلسله مراتب ترادفهای ImageNet بوده که با اس...
[ 2 ] - Producing a Persian Text Tokenizer Corpus Focusing on Its Computational Linguistics Considerations
The main task of the tokenization is to divide the sentences of the text into its constituent units and remove punctuation marks (dots, commas, etc.). Each unit is a continuous lexical or grammatical writing chain that is an independent semantic unit. Tokenization occurs at the word level and the extracted units can be used as input to other components such as stemmer. The requirement to create...
نویسندگان همکار