OLAP es un acrónimo de Online Analytical Processing (Procesamiento analítico en línea).
Normalmente, OLAP no se utiliza para procesamiento de transacciones, al contrario, se usa en Business Intelligence para operaciones como consulta de grandes cantidades de datos e informes en tiempos muy cortos.
Modelo multidimensional OLAP
Ya habíamos mencionado en un post acerca de los modelos estrella y copo de nieve que estos también se podían realizar en modelos multidimensionales. Pues bien, OLAP utiliza una base de datos multidimensional en donde se produce el almacenamiento de datos. Esta información se guarda un unos modelos de datos denominados cubos, en vez de organizarse en tablas.
Cubos OLAP
Los cubos son estructuras de datos en las que la información se ordena de manera jerárquica. En los cubos se pueden realizar mapeos rápidos de diferentes categorías de datos alojados en diferentes cubos y se cruzan entre ellos para acceder de manera rápida a las consultas realizadas. Los cubos no son figuras en un sentido estricto; se denominó así a la forma de alojar los datos debido a su multidimensionalidad, ya que esta recuerda la forma de un cubo. Esto se debe a que se puede mirar por distintos lados, lo cual no reduce los datos a un solo punto de vista. Las medidas y las dimensiones se albergan en los cubos.
Creación de un cubo OLAP
Cada dimensión del cubo representa una entidad. En primer lugar se deben identificar los atributos que van a ser las dimensiones. Después se debe encontrar el valor de cada entrada de la matriz multidimensional.
Ejemplifiquemos esto:
En el cubo ventas tenemos 3 dimensiones: producto, almacén y tiempo. Al mismo tiempo, se tiene la medida ventas, la cual puede sumarse. Cada celda del cubo tiene un valor, que es la mezcla de distintas dimensiones. El dato alojado en cada celda del cubo es una agregación.
Así pues, para obtener las ventas totales de un producto por un determinado tiempo y en un determinado lugar, se deben cruzar los datos alojados en producto, almacén y una de las cuatro celdas de tiempo.
Datos en OLAP
Los datos en OLAP se manejan por medio de:
Medidas
Las medidas son hechos numéricos y están clasificadas por dimensiones. Provienen de una de las columnas de la tabla de hechos o pueden calcularse gracias a estas y pertenecen al grupo de datos maestros del cubo.
Dimensiones
Las dimensiones en OLAP corresponden al punto de vista que se tiene de cada uno de los datos del cubo. Generalmente las dimensiones poseen jerarquías y estas, a su vez, están divididas en niveles.
El usuario utiliza las dimensiones para comprender los distintos niveles que existen en la base de datos y, posteriormente, las usa para hacer el análisis de datos.
Jerarquías
Es una estructura que simula a un árbol (por sus raíces, de las cuales provienen las tablas de hechos y se desprenden las tablas de dimensiones). En la jerarquía se organizan cada uno de los miembros en dos grupos:
- Miembros primarios.
- Miembros secundarios.
Todos los miembros poseen un nervio primario y cada miembro primario puede poseer tantos miembros secundarios como desee o, incluso, no poseer ninguno.
Niveles
Es la forma de organización que se puede dar dentro de la jerarquía y se divide en inferiores y superiores.
OLAP y Excel
OLAP puede trabajar con múltiples plataformas, entre ellas Excel, de la que puede sacar múltiples beneficios y características, como pueden ser:
- Mostrar datos OLAP por medio informes de tablas o gráficos dinámicos o por medio de una hoja de cálculo convertida desde una tabla dinámica.
- Crear archivos .cub que funcionan sin conexión.
- Calcular el KPI.
- Crear medidas con formatos personalizados.
- Traducir datos y errores del servidor.
Operaciones OLAP
En OLAP se pueden ejecutar varias operaciones, estas son:
- Roll up.
- Drill Down.
- Slice.
- Dice.
¿Quieres saber más?
Como has podido observar, OLAP tiene múltiples funcionalidades que pueden ser útiles en data mining o minería de datos, que permiten explorar grandes bases de datos con el objetivo de encontrar patrones repetitivos que expliquen el comportamiento de esos datos. Si quieres seguir aprendiendo sobre este tema, puedes inscribirte a nuestro Big Data, Inteligencia Artificial y Machine Learning Full Stack Bootcamp. ¡Anímate a apuntarte para convertirte en un experto!