La compilación de información y transmisión del conocimiento siempre ha sido una preocupación central en las diferentes civilizaciones humanas. Es la que motivó el surgimiento de la escritura o de cualquier representación simbólica que permita acumular saber y ampliar nuestro entendimiento de lo que nos rodea. Esta es también el origen de la temática que vamos a abordar en este post: ¿qué es una base de datos? Vayamos al grano.
¿Qué es una base de datos?
Empecemos por la cuestión que da título a este post, ¿qué es una base de datos?
Se trata de cualquier conjunto de datos que comparten una o varias características en común y que se almacenan para su consulta y explotación posterior. De esta manera, una biblioteca es una base de datos.
Sin embargo, cuando hablamos actualmente de bases de datos, nos referimos a aquellas que están en formato digital, ya que representan ahora la mayoría. En este contexto y según la definición del Diccionario panhispánico del español jurídico, el concepto se refiere a una “memoria informática en la que pueden integrarse datos dispuestos de modo que sean accesibles individualmente por medios electrónicos o de otra forma”.
En todo caso, una base de datos puede contener varios tipos de datos, ya sean cuantitativos o cualitativos, numéricos, alfabéticos o algorítmicos.
Estos datos pueden ser estructurados -cuando sus características están ya definidas y se clasifican en tablas como las fechas-, no estructurados -cuando no tienen una configuración común predeterminada como los documentos de texto o los archivos multimedia-, o semiestructurados – que poseen tanto elementos predefinidos como marcadores específicos, como los documentos HTML Y XML.
Paralelamente, una base de datos no es lo mismo que una aplicación informática de almacenamiento y visualización de la información, como las hojas de cálculo. Lo que diferencia la primera de la segunda es su nivel de complejidad y las grandes cantidades de datos que son capaces de administrar; todo ello, sin dejar de lado la eficiencia en la accesibilidad del usuario.
Por eso, las empresas e instituciones necesitan gestores de bases de datos para facilitar el acceso y aprovechamiento de la información. Estos son los Sistemas de Gestión de Bases de Datos (SGBD).
Los Sistemas de Gestión de Bases de Datos (SGBD)
Entendido qué es una base de datos, veamos cómo se articulan los sistemas que las gestionan. Un sistema de gestión de bases de datos es un conjunto de herramientas que permite almacenar, definir, consultar, actualizar, procesar, analizar, hacer copias de seguridad…, es decir, todas las acciones en torno a la administración de los datos acumulados y su explotación. En conclusión, es el entorno en el que se evalúa el funcionamiento de base de datos.
En general, cuando se habla de base de datos programación , se refiere tanto al catálogo de información en sí como al sistema de datos y su gestión. Durante mucho tiempo, Oracle Database era el líder en el sector con una estructura de tipo objeto-relacional (explicada más adelante). No obstante, ahora tiene cada vez más competidores, destacando Microsoft SQL Server y MySQL, siendo está última una de las bases de datos de código abierto más populares.
Las bases de datos se han convertido en los últimos 20 años en una pieza fundamental de cualquier empresa o institución, desde las más pequeñas a las más grandes. Si una organización no hace un seguimiento y una analítica de todos sus datos -beneficios, rentabilidad, eficiencia de sus campañas de marketing, marcadores clave de crecimiento, etcétera-, no compite. Las bases de datos permiten que un negocio escale, mejore su productividad, evalúe su rendimiento, optimice sus recursos, facilitar el trabajo de sus equipos, entre otros.
Tipos de base de datos
Ahora que hemos respondido a la pregunta qué es una base de datos y hemos visto cómo se gestiona, adentrémonos en su estructura. En función de la manera en que se distribuyen y almacenen los datos, las bases pueden ser de un tipo u otro.
Asimismo, hay que considerar la evolución de la tecnología, que también ha influido significativamente en la infraestructura de las bases de datos. Veamos a continuación los modelos más representativos, tomando como referencia la categorización de Oracle, uno de los sistemas de gestión de base de datos más populares del mercado.
Bases de datos relacionales
Este paradigma de almacenamiento y manipulación de datos fue desarrollado en los laboratorios de IBM en los años 70 y, rápidamente, se impuso como modelo predominante en los 80. Se basa en la distribución de la información en tablas, compuestas por columnas (campos) y filas (registros), y la características en común (relaciones) que existen entre ellas. SQL es el lenguaje de consulta, definición, control y manipulación de datos diseñado para la gestión de este tipo de bases.
Bases de datos orientadas a objetos
Este modelo reproduce la manera de representar la información característica de la programación orientada a objetos, que se expandió en los años 90. Por lo tanto, se suele optar por una base de datos orientada a objetos cuando se trabaja al unísono con un lenguaje de programación que se basa en este paradigma como Java o C#.
Bases de datos distribuidas
Como se puede adivinar por su nombre, la información de este tipo de bases de datos está repartida en ubicaciones diferentes, físicas o digitales. De esta manera, es necesaria una red de comunicación para conectar los diferentes archivos entre sí.
Almacenes de datos
Los denominados data warehouse en inglés son una pieza fundamental de una estructura empresarial y consisten en un sistema de base de datos que integra toda la información de una organización de manera organizada para su posterior consulta y análisis. Un aspecto importante de este modelo es que los datos no se eliminan y, si un valor varía, se añade el nuevo dato sin borrar el anterior. De esta manera, queda registrado todas las operaciones realizadas por una entidad.
Bases de datos NoSQL
Con el surgimiento de Internet y de las aplicaciones web, se puso en evidencia la necesidad de una estructura más flexible y eficiente para el procesamiento de los datos no estructurados y semiestructurados. De ahí nacen las bases de datos NoSQL que, como su nombre lo indica, abandonan SQL como lenguaje de consulta predominante (aunque también lo soportan) y el modelo relacional de distribución de los datos.
Bases de datos orientadas a grafos
Al igual que las bases de datos orientadas a objetos representan la información como objetos, en este caso, los datos se representan como grafos, es decir, una estructura de vértices y aristas que simbolizan los conjuntos de datos y las relaciones que existen entre ellos.
Bases de datos OLTP
Del inglés Online Transaction Processing, OLTP se refiere al procesamiento de transacciones en línea. Por lo tanto, a la pregunta qué es una base de datos OLTP, la respuesta es aquella que administra todo lo que tiene que ver con la estructura de los datos transaccionales de los usuarios.
Merece la pena subrayar que, más allá de los tipos propuestos en este post, se pueden categorizar las bases de datos de muchas maneras. Se puede hablar bases de datos jerárquicas, cuando la estructura de sus datos toma la forma de una árbol. Asimismo, varias de estas estructuras de árbol se pueden relacionar entre sí en una base de datos orientada a grafos, entre otras posibilidades.
En todo caso, los factores que llevan a una empresa o institución a optar por un paradigma u otro son sus necesidades específicas y el contexto tecnológico en el que se encuentre. En los últimos años, por ejemplo, hemos visto una explosión del almacenamiento y gestión de datos en la nube, una tendencia que aún está en su génesis. También están en boga la bases de datos de autogestión, abriendo el abanico de oportunidades que ofrece esta tecnología.
Ya sabes qué es una base de datos, cómo se estructura y cuáles son los principales tipos. ¿Aún así, quieres más? ¿Has pensado en dedicarte a ello? Con nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack podrás especializarte, en 9 meses y en remoto, en todo lo relativo a la ciencia de datos: captura y procesamiento, almacenamiento, visualización y análisis y mucho más. Contáctanos para más información y te facilitaremos el plan de estudios que mejor se ajuste a tus necesidades.