Integración de fuentes heterogéneas de datos textuales
نویسندگان
چکیده
This paper proposes an alternative to data integration from heterogeneous sources or databases. In some cases, inconsistencies may occur, and in others, the schema lacks of any attribute or entity to store the data. Some inconsistencies are consequence of using a language different with the one employed in the schema definition; others are due to the use of distinct units of measure. The object-oriented model provides characteristics that facilitate the class reuse and extension. The samples are obtained from heterogeneous Web sources belonging to the domain of computer equipment. Integration involves entities, attributes, values, and units of measurement. Manuscrito recibido el 19 de junio de 2014, aceptado para su publicación el 10 de julio de 2014, publicado el 15 de junio 2015. Benina Velázquez Ordoñez (autor correspondiente) estudia en el Instituto Politécnico Nacional (IPN), en la Escuela Superior de Ingeniería Mecánica y Eléctrica (ESIME), DF, México (correo: [email protected]). Jesús Manuel Olivares Ceja y Adolfo Guzmán Arenas trabajan en el IPN, en el Centro de Investigación en Computación (CIC), México, DF (correo: [email protected], [email protected]) Miguel Patiño Ortíz y Julián Patiño Ortíz trabajan en el IPN– ESIME, DF, México (correo: {mpatino2002, jpatinoo}@ipn.mx).
منابع مشابه
ELAN: Una Red Distribuida y Políglota de Recursos Lingüísticos Textuales
Resumen. En este artículo presentamos el proyecto MLIS-ELAN cuyo objetivo principal es la creación de una red distribuida y políglota de bases de datos de recursos lingüísticos textuales. Primero, definimos el término de “recurso lingüístico textual” y mostramos la importancia de la normalización en el marco de la representación y de la utilización de este tipo de recursos. Después, presentamos...
متن کاملIntegración de Colecciones Heterogéneas en Bibliotecas Digitales
Resumen. La heterogeneidad en las bibliotecas digitales dificulta la integración de colecciones documentales destinadas a constituir una nueva biblioteca digital. Dicha heterogeneidad puede deberse, entre otras, a las siguientes causas: distintos modelos de documentos, formatos diferentes, distintos modelos en los atributos, y distintas sintaxis en los lenguajes de consulta y en los datos que c...
متن کاملMetodología para el Análisis Visual de la Evolución de Conceptos en Bases de Datos Textuales
El análisis de los datos almacenados en las bases de datos textuales se hace cada vez más complejo debido al aumento del volumen y la entropía. Estos problemas obligan a buscar nuevos métodos para analizar el contenido de las bases de datos textuales. En este artículo presentamos una metodología que permite el seguimiento de núcleos de información, representados en forma de conceptos. Estos con...
متن کاملMDBE: Una Herramienta Automática para el Modelado Multidimensional
Los sistemas Data Warehousing tienen como objetivo ayudar en la toma de decisiones de las organizaciones. Para ello, estos sistemas integran y homogenizan los datos de la organización en un Data Warehouse (DW), con el objetivo de obtener una representación única y detallada de nuestro negocio. Por definición, un DW es una gran base de datos que, por sí misma, es incapaz de aportarnos informació...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Polibits
دوره 51 شماره
صفحات -
تاریخ انتشار 2015