Diseño de un modelo computacional de minería de datos multidimensional utilizando lattices conceptuales para la búsqueda de conocimiento en entornos OLAP

No Thumbnail Available
Date
2014
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Nacional de Trujillo
Abstract
En esta tesis se presenta un modelo de minería de datos multidimensional (basado en la arquitectura de minería analítica en línea OLAM), el cual consiste en una solución de capa tres que cuenta con motores de análisis multidimensional y minería de datos ejecutándose en conjunto, con el fin de extraer reglas de asociación exactas o aproximadas a partir de la formalización de una consulta multidimensional basada en restricciones. Este modelo fue concebido como una manera de extraer conocimiento dirigido por el descubrimiento (reglas de asociación) a partir de un cubo de datos o datamart, el cual principalmente, tiene una estructura multidimensional con capacidad de extracción de conocimiento dirigido por hipótesis._x000D_ Por tanto, este modelo de capa tres OLAM tiene la capacidad de ejecutar algoritmos_x000D_ de minería de datos dentro de un espacio de búsqueda reducido, resultado de una consulta basada en restricciones aplicada a un datamart._x000D_ Este modelo de capa tres, a través de la formalización de una consulta basada en restricciones, reduce de manera significativa el espacio de búsqueda de un cubo de datos, identificando de la consulta, las dimensiones involucradas así como sus columnas y filtros, resultando en una tabla de datos o contexto multivaluado. Este contexto es después transformado a un contexto formal binario con el uso de escalas personalizadas para cada uno de los atributos multivaluados. A partir del contexto binario resultante, un iceberg concept lattice es derivado con la finalidad de identificar un conjunto de itemsets frecuentes, los cuales son el punto de partida para el proceso de minería de reglas de asociación. Finalmente, y de acuerdo a la especificación de un soporte y confianza mínimos, las bases de Duquenne-Guigues y de Luxenburger son presentadas como resultado de la consulta inicial para su posterior análisis
Description
In this thesis, a multidimensional data mining model is proposed (based on the online analytical mining OLAM architecture), which consists of a layer three solution with both multidimensional and data mining analytical engines working together in order to extract approximate or exact association rules from the formalization of a constraint-based multidimensional query. This model was conceived as a way to extract discovery-driven knowledge (i.e. association rules mining) from a data cube or datamart which primarily has a multidimensional structure with only hypothesis validation capabilities. Thus, this OLAM layer three model is able to execute data mining algorithms within a reduced search space result of a constraint-based query applied to a datamart._x000D_ This layer three model, through the formalization of a constraint-based query, reduces significantly a cube’s search space by identifying from the query the dimensions involved as well as it’s columns and filters, resulting in a data table or multivalued context. This context is later transformed into a formal binary context with the use of personalized scales for each and every multivalued attribute. From the resulting binary context, an iceberg concep lattice is derived in order to identify a set of frequent itemsets, which is the first step to the association rules mining process. Finally, and according to the specification of a minimum support and confidence, both Duquenne-Guigues and Luxenburger basis are extracted and presented as the result of the initial query for further analysis
Keywords
Modelo computacional, OLAP
Citation