Sofisticación y Diversidad como Medidas de Complejidad Léxica para Determinar el Perfil Colocacional de Textos Académicos en Español
نویسندگان
چکیده
En este estudio proponemos utilizar en el ámbito de las colocaciones los parámetros sofisticación y diversidad, normalmente restringidos a unidades léxicas monoverbales. Para ello, presentamos una metodologÃa que mide ambos textos académicos español. El objetivo final es comprobar su eficacia para determinar perfil colocacional dichos textos, lÃnea con Lexical Profile (Laufer & Nation, 1995) utilizado inglés. Entendemos la âsofisticaciónâ como propiedad más prototÃpicas del discurso académico se caracterizan por ser contrastivamente menos frecuentes lengua general dicho discurso. establecer niveles sofisticación, implementan dos métodos: uno basado criterios frecuencia otro Ãndices Información Mutua (IM). Por lado, âdiversidadâ nos referimos proporción repetidas un texto lo calculamos través adaptación medida TTR (Guiraud, 1954). efectividad métodos clasifican extraÃdas 48 corpus expertos noveles. Los resultados obtenidos demuestran noveles no sofisticadas académico, sino mayor inclusión baja (más propias general), asà menor valor diversidad colocacional.
منابع مشابه
Poblado automático de ontologías de perfiles académicos a partir de textos en español
Resumen. Este artículo propone un enfoque para el poblado automático de ontologías de perfiles académicos a partir de los textos, expedientes curriculares y resúmenes, de publicaciones científicas en español. El enfoque utiliza reglas semánticas y marcadores lingüísticos para extraer los individuos de clase, relaciones y valores de propiedad. Una evaluación ha sido realizada con un conjunto de ...
متن کاملMedidas de Complejidad Cuantitativas para Sistemas Expertos Basados en Reglas
La evaluación de un Sistema Basado en Conocimiento es una fase del ciclo de desarrollo en este paradigma que comúnmente busca que el sistema tenga una sintaxis correcta, una semántica válida y que el grado de usabilidad y utilidad sea alto. Sin embargo, en esta etapa no se hace una valoración de la organización que tiene la Base de Conocimiento, lo cual pudiera repercutir en la eficiencia de la...
متن کاملUna gramática de estilos para resumir textos en español
This paper describes an experiment on text summarization. A summary is made by means of a logic program executed by a computer. The logic program is an embodiment of a symbolic technique for natural language processing based on “style grammars”. These grammars, in turn, are based on a proposal by J. Williams (1990). The program obtains topics (the themes of the sentence, according to Williams) ...
متن کاملMPRO: Un programa para el análisis morfológico y sintáctico en textos en español
Johann Haller IAI –Instituto de Ciencia Aplicada de la InformaciónUniversidad de Saarland Martin-Luther-Strasse 14, 66111, Saarbrücken, Alemania [email protected] Alexis Donoso IAI –Instituto de Ciencia Aplicada de la InformaciónUniversidad de Saarland Martin-Luther-Strasse 14, 66111, Saarbrücken, Alemania [email protected] Yamile Ramírez IAI –Instituto de Ciencia Aplicada de la InformaciónU...
متن کاملDetección de menciones anidadas basada en expansión para el español
Mention detection is the first module used in coreference resolution systems. Due to that, it is important that the results obtained by this module are as high as possible. Within the field of mention detection, nested mentions are the most difficult ones to detect. In this paper, we present a nested mention detection system based on expansion, a new model for detecting nested elements in NLP b...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Revista Signos
سال: 2023
ISSN: ['0718-0934', '0035-0451']
DOI: https://doi.org/10.4067/s0718-09342023000200282