Identificación Automática del Idioma en Twitter: Adaptación de Identificadores del Estado del Arte al Contexto Ibérico
نویسندگان
چکیده
We describe here our partipation in TweetLID. After having studied the problem of language identification, the resources available, and designed a text conflation approach for this kind of tasks, we joined the competition with two systems: the first one was based in the guesser langdetect, re-trained and adapted in order to work with conflated text; the second one was an approach based on majority vote which used a set of re-trained and adapted classifiers. Results are analized both globally and at language and tweet-type levels.
منابع مشابه
Identificación de un Sistema de Fijación de Tornillos con Ruido en Mediciones
Resumen La identificación de sistemas es una tarea anterior fundamental al control de los mismos. El estado del arte en la identificación ha permitido resolver el problema de conocer el modelo de los sistemas con alta precisión, considerando que las mediciones de las variables del sistema son realizadas sin error; o bien, efectuando algún tratamiento de filtrado. Sin embargo, existen casos dond...
متن کاملTradução E Adaptação Para a Língua Portuguesa Do In-hospital Utstein Style Traducción Y Adaptación Al Idioma Portugués Del Instrumento In-hospital Utstein Style
RESUMEN El paro cardiopulmonar (PCP) es un estado potencialmente letal, donde la calidad del servicio depende de la agilidad, conocimiento y habilidad del equipo involucrado. El In-hospital Utstein Style fue elaborado en 1997. Este instrumento que recolecta datos de importancia durante un PCP fue traducido y adaptado al portugués. De esta forma fue sometido al proceso de traducción y adaptación...
متن کاملClasificación automática de la orientación semántica de opiniones mediante características lingüísticas
Resumen. En este trabajo examinamos el problema de clasificar la orientación semántica de opiniones de productos comerciales, en idioma Español. Exploramos las características de la colección de opiniones extraídas de Internet y estudiamos el uso de bigramas de afirmación como características de entrenamiento para un método supervisado. Analizamos la combinación de estas características y medim...
متن کاملGeneración Automática de Restricciones de Integridad: Estado del Arte
Resumen La aparición de la MDA (Model-Driven Architecture) y, en general, del MDD (ModelDriven Development) ha dado un nuevo impulso a la investigación acerca de la generación automática del código de una aplicación a partir de su especificación. En este artículo se estudia el soporte ofrecido por los métodos y herramientas actuales para la generación automática de las restricciones de integrid...
متن کاملExtracción de contextos definitorios en textos de especialidad a partir del reconocimiento de patrones lingüísticos
La extracción automática de definiciones a partir de textos de especialidad es una tarea cada vez más demandante para diferentes aplicaciones del Procesamiento de Lenguaje Natural, tales como lexicografía computacional, extracción de información, semántica computacional, sistemas preguntarespuesta, minería de textos, Web semántica y aprendizaje automático. Este artículo presenta un panorama de ...
متن کامل