Combinación de clusterizadores difusos mediante voto posicional para clustering robusto de documentos
نویسندگان
چکیده
The combination of multiple clustering processes provides a means for building robust document clustering systems. This work focuses on the consolidation of fuzzy clusterings, proposing two consensus functions for soft cluster ensembles based on the Borda and Condorcet positional voting strategies. Experiments conducted on two document corpora reveal that the proposed soft consensus functions are capable of yielding consensus partitions of comparable or superior quality to those obtained by state-of-the-art clustering combiners, although their computational complexity is higher due to the ranking process inherent to positional voting techniques.
منابع مشابه
Sistema de almacenamiento y gestión de documentos para el desarrollo de bibliotecas digitales
El sistema propuesto se ha diseñado para el almacenamiento y gestión de documentos de una biblioteca. La arquitectura del sistema es altamente genérica, con el objetivo de no restringir la clase de documentos gestionables por él. Con ello creamos un sistema base o primario que es independiente del tipo de documento, siendo capaz de almacenar documentos sin atenerse a su formato. El sistema es a...
متن کاملClasificación semántica de textos no estructurados mediante un enfoque evolutivo
Resumen. En la actualidad, cerca del 90% de la información se encuentra plasmada tanto en documentos estructurados como no estructurados. Esto ha dado impulso a la investigación e implementación de diferentes algoritmos para el análisis y clasificación de textos de acuerdo a su orientación semántica. Por ello, en el presente trabajo se describe una manera de clasificación de textos no estructur...
متن کاملUna familia de herramientas para la edición y publicación de noticias basada en NewsML
Resumen. Presentamos en este paper una familia de aplicaciones que pretende facilitar la tarea de crear, diseñar, publicar y almacenar publicaciones periódicas. Por un lado, para la herramienta de creación del periódico, se propone utilizar la tecnología NewsML, basada en el estándar abierto XML, mediante la que representaremos cualquier tipo de información susceptible de ser publicada en un pe...
متن کاملAnálisis del desempeño del algoritmo genético en la clasificación automática de documentos
Resumen. Existen diversos algoritmos de clasificación para el proceso de clasificación automática de documentos, estos algoritmos buscan soluciones eficientes y rápidas, es por lo cual, el Algoritmo Genético es ideal para aplicar a este contexto, ya que es capaz de encontrar soluciones eficientes en unos cuantos segundos, por su capacidad de examinar el espacio de búsqueda en forma amplia y efi...
متن کاملResolución de un programa lineal posibilístico mediante programación compromiso
En este trabajo nos planteamos la resolu ci on de un programa lineal con coe cientes imprecisos cuya distribuci on de posibilidad est a de nida por n umeros difusos Para comparar n umeros difusos utilizamos una relaci on de preferencia difusa lo que nos per mitir a hablar de soluciones factibles en grado Cuanto mayor grado de factibilidad exi jamos m as restringido es el conjunto de solu ciones...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 43 شماره
صفحات -
تاریخ انتشار 2009