Использование тематических моделей в извлечении однословных терминов (Application of Topic Models to the Task of Single-Word Term Extraction)

نویسندگان

  • Michael Nokel
  • Natalia V. Loukachevitch
چکیده

В статье представлены результаты экспериментов по применению тематических моделей к задаче извлечения однословных терминов. В качестве текстовых коллекций была взята подборка статей из электронных банковских журналов на русском языке и англоязычная часть корпуса параллельных текстов Europarl. Эксперименты показывают, что использование тематической информации значительно улучшает качество извлечения однословных терминов независимо от предметной области и используемого языка.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Сеть естественных иерархий терминов новостных текстов по событиям «Евромайдана» (Network of Natural Hierarchies of Terms of News Messages on the "Euromaydan" Events)

Построение большой тематической онтологии – сложная и затратная проблема. Определенным этапом разработки общих онтологий является формирование словарных номенклатур, терминологических онтологий. Эффективный автоматический отбор отдельных терминов для таких конструкций на основании неразмеченных текстовых массивов – не решенная окончательно задача [5, 6]. Проблема автоматического установления св...

متن کامل

Отображениe моделей данных NoSQL в объектные спецификации (Mapping of the NoSQL Data Models to Object Specifications)

Системы баз данных, принадлежащие к классу NoSQL, используются для обеспечения горизонтального масштабирования данных и работы со сверхбольшими объёмами данных. При решении задач над множественными неоднородными информационными ресурсами необходимо их использовать. В статье рассмотрены подходы к отображению моделей NoSQL разных видов в объектную модель языка СИНТЕЗ, используемого в качестве уни...

متن کامل

Multiservice Telecommunication Systems Parametrical Synthesis by using of Multilayer Graph Mathematical Model

This study is devoted to the problem of parametric synthesis of multi-service telecommunication systems. The main characteristics of telecommunication systems, which are brought to account in an article, are multilayer structure formed by the overlayed networks and presence flows with self-similarity effect. For accounting these features of modern telecommunications systems is proposed to use a...

متن کامل

یک مدل موضوعی احتمالاتی مبتنی بر روابط محلّی واژگان در پنجره‌های هم‌پوشان

A probabilistic topic model assumes that documents are generated through a process involving topics and then tries to reverse this process, given the documents and extract topics. A topic is usually assumed to be a distribution over words. LDA is one of the first and most popular topic models introduced so far. In the document generation process assumed by LDA, each document is a distribution o...

متن کامل

Theoretical and Experimental Investigations of DNA Open States

Аннотация. Работа посвящена обзору и анализу литературных данных, касающихся свойств открытых состояний ДНК. Данные состояния возникают вследствие крупных флуктуаций дуплекса и оказывают большое влияние на целый ряд биохимических процессов, в том числе на перенос электрического заряда в ДНК. Проведён сравнительный анализ экспериментальных данных по кинетике и термодинамике открытых состояний ДН...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013