Una Representación Basada en Lógica Borrosa para el Clustering de páginas web con Mapas Auto-Organizativos
نویسندگان
چکیده
This article evaluates a web page-oriented representation model for document clustering, using self-organizing maps. The representation is based on heuristic combinations of criteria by means of a fuzzy rules system. The experiments show an improvement in the proposed model behaviour versus traditional representations as TF, Bin-IDF and TF-IDF, with different vector dimensions, and using a reference collection.
منابع مشابه
Mejorando la accesibilidad de las aplicaciones GIS basadas en Web
El principal problema de los formatos vectoriales activos como WebCGM y Scalable Vector Graphics (SVG), radica en la necesidad de instalar plug-ins o descargar applets que permitan su visualización en la mayoría de los navegadores web. En este artículo se presenta un servicio web cuya funcionalidad permite la transformación de mapas vectoriales activos en formato SVG en una nueva representación...
متن کاملCombinación de clasificadores para el análisis de sentimientos
Resumen. El presente trabajo, propone una arquitectura fusionando los clasificadores: SVM, árboles de decisión y Naive Bayes, mediante mayoŕıa de votos, ventanas y cascada, para explorar el desempeño de la tarea de análisis de sentimientos. Se utilizó un corpus en español de 2625 opiniones, previamente preprocesado. Para representarlo, se emplearon bigramas, bolsa de palabras con pesado tf-idf,...
متن کاملMétodos de agrupamiento no supervisado para la integración de datos genómicos y metabólicos de múltiples líneas de introgresión
Las numerosas aplicaciones de la inteligencia artificial a la bioloǵıa de sistemas han dado lugar a nuevos algoritmos, además de la adaptación y reutilización de los existentes. En tareas de mineŕıa de datos se han aplicado diversos métodos estándar, como por ejemplo el bien conocido k-medias. Sin embargo, las capacidades de estos métodos son limitadas en relación a otros algoritmos más recient...
متن کاملUn algoritmo para calcular #2SAT
Resumen. El problema de conteo de modelos en fórmulas booleanas pertenece a la clase #P-completo. Por tal motivo, no existe algoritmo qué, de forma eficiente, calcule el número exacto de modelos de una fórmula booleana. En este art́ıculo, se presenta una implementación para contar el número de modelos de una fórmula booleana basada en su representación mediante grafo. Aśı mismo se mostrará que, ...
متن کاملDiseño de una Interfaz PCI para una Tarjeta Coprocesadora Basada en el DSP TMS320C40-40
n este artículo se presenta el diseño de una interfaz orientada al bus PCI basada en el controlador S5933 de AMCC y lógica programable. La interfaz está integrada en una tarjeta de coprocesamiento basada en el DSP TMS 320C40-40 de Texas Instruments. La interfaz permite transferencias de datos en modos esclavo y maestro del bus PCI. La tarjeta coprocesadora está destinada al tratamiento de gráfi...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 42 شماره
صفحات -
تاریخ انتشار 2009