Roadmap de Big Data

¿Sabías que el Big Data es clave en las empresas? Y para entender todos los conceptos que abarca este campo, te presentamos este roadmap de contenido especializado y técnico sobre Big Data, IA & Machine Learning, en el que vas a encontrar una variedad de tutoriales y guías que te van a ayudar a dominar esta área tecnológica.

Desde los fundamentos de la ciencia de datos, hasta poner en práctica el Machine Learning, te daremos toda la información que necesitas para que seas un experto en la materia.

¡Acompáñanos en esta aventura digital!

Big Data

Data 101 y Protección de Datos (RGPD)

3 fundamentos del Big Data para iniciarte
¿Qué es Data Warehouse?
Arquitectura Big Data: un primer acercamiento
Deep Learning con Tensorflow: (5 ventajas)
¿Qué es Data Modeling & Design?
¿Cuál es la diferencia entre Big Data y Business Intelligence?
¿Cuáles son los beneficios del Big Data?
¿Cuál es la influencia del Big Data en el mundo multimedia?
¿Qué es la pirámide del conocimiento del Big Data?
5 ejemplos de empresas que usan Big Data
¿Qué es Data Management y cómo funciona?
Las 11 disciplinas del Data Management que debes conocer
¿Qué es el Data Governance?
Relación entre Data Governance y Data Quality
¿Qué es Data security? [5 recomendaciones para implementarlo]
¿Qué es el índice de popularidad en LinkedIn?
¿Para qué sirven las máquinas virtuales en Big data?
¿Quién puede estudiar analítica de datos?
¿Qué son los canales en Slack?
Chinchetas y marcadores en Slack
¿Cuál es el ciclo de vida del dato?
Validación de información en analítica de datos
¿Cuál fue la empresa más beneficiada con el covid-19?
¿Cuál es el valor de la huella digital en Big Data?
Fantasmas digitales: ¿existe alguien que no genere datos?
¿Qué es y cómo funciona el DIKW?
Aprendizaje supervisado y no supervisado en analítica de datos
¿Cómo funciona la pirámide de la información en Big data?
¿Cuál es el papel que juega la estrategia en el análisis de datos?
Roadmap de la analítica de datos
¿Qué es la omnicanalidad en Big data y cómo funciona?
Clasificar y depurar información en Big Data
Los 5 niveles de información en Big Data
Bases de datos SQL y NoSQL: características
¿Qué son los master data?
¿Qué son los metadatos?
Principios del data quality en la estrategia de negocio
¿Cómo funciona un normalizador de datos?
Diferencia entre BI y Big Data
3 elementos de las bases de datos relacionales
4 principios de los sistemas de información
Sistemas operacionales vs. informacionales
DataWarehouse vs. Data Mart: ¿cuál es mejor?
Modelos estrella y copo de nieve
¿Cuál es la arquitectura de un Data Warehouse?
Datificación: ¿cuántos tipos de datos existen?
Enfoque multidisciplinar en Machine Learning: 3 variables
Los 3 lenguajes de los data scientists
4 casos de uso en Big Data
4 casos de éxito en Big Data
¿Qué son las redes semánticas?
Transformación digital y Big Data
IoT en Big Data: usos y aplicaciones
Black mirror y el Big Data: ¿cómo de lejos estamos?
Llaves primarias y foráneas de las BBDD relacionales
¿Qué es OLAP?
¿Que es la granularidad del datos?
Casos de uso en Big Data: user experience y customer analytics
Casos de uso en Big Data: business analytics y RRHH analytics
Preocupaciones más comunes sobre la protección de datos
Vigilancia de los datos: más allá del reglamento de protección
Pros y contras de las regulaciones que vigilan los datos
Mapa de protección de datos en la Unión Europea
3 casos de sanciones por protección de datos antes del RGPD
Casos de sanciones por el RGPD
Reglamentos LOPD vs. RGPD: sanciones
Línea temporal del GDPR: ¿cómo ha cambiado?
Un recorrido por el GDPR: ¿qué contiene?
Función del Data Protection Officer en las empresas
¿Qué medidas tomar para proteger los datos en las empresas?
Privacidad desde el diseño en el RGPD: ¿cómo hacerlo?
¿Qué es el reglamento de protección de datos no personales?
Impacto del RGPD en el acceso a los sistemas de las empresas
Impacto del RGPD en el consentimiento de los sistemas en las empresas
La carga de los datos en las empresas y el impacto del RGPD
El RGPD y su impacto en el almacenamiento de datos en las empresas
Tratamiento de los datos en las empresas y el impacto del RGPD
¿En qué consiste el derecho de portabilidad de los datos?
¿Qué son las quiebras de seguridad?
Buenas prácticas para PD Big Data: guía de la AEPD
5 iniciativas de la ley de protección de datos

Exploración y visualización de datos

¿Qué es la exploración y visualización de datos? (3 herramientas)
Top 3 de herramientas para exploración y visualización de Datos
¿Cómo funciona una arquitectura para el análisis de datos?
Diferencias entre Tableu y PowerBI
¿Qué es Looker? La solución de Google para Big Data
5 ventajas de Tableau para visualizar datos
¿Qué es Tableau y cómo funciona?
Tableau Online vs Tableau Server: ¿cuál es la diferencia?
¿Para qué sirve Tableau Reader?
¿Cómo es la arquitectura de Tableau?
Guía Tableau para iniciarte
¿Cómo importar datos en Tableau?
¿Cómo ordenar datos en Tableau?
¿Cómo usar filtros en Tableau?
¿Qué es Tableau Server y cómo funciona?
¿Qué son los conjuntos de datos en Tableau?
5 pasos para crear conjuntos de datos en Tableau
¿Cómo usar las paletas de color en Tableau?
¿Cómo funciona la división de datos por fecha en Tableau?
¿Qué es el Mapeo geográfico de datos en Tableau?
¿Cuáles son los tipos de datos especiales en Tableau?
5 pasos para usar el Mapeo geográfico de Tableau
¿Para qué sirve el Panel de análisis en Tableau?
Guía para usar el panel de datos en Tableau
¿Cómo crear parámetros en Tableau?
¿Cómo funciona la personalización de datos en Tableau?
¿Cómo añadir una Línea de Tendencia en Tableau?
¿Para qué sirven los Clústeres en Tableau?
¿Qué son los campos calculados en Tableau?
¿Qué son los cálculos de tablas rápidas en Tableau?
¿Para qué sirve el Panel de Dashboard en Tableau?
5 acciones de Dashboard en Tableau
Visualización de relación entre valores numéricos en Tableau
Ventajas y desventajas del mezclado de conexiones en Tableau
¿Cómo combinar datos en Tableau?
9 características de la relación entre valores numéricos en Tableau
Requisitos de las relaciones Join y Blend en Tableau
¿Cómo funcionan los gráficos de dispersión en Tableau?
¿Cómo funciona el desglose de datos en Tableau?
¿Cómo visualizar distribuciones en Tableau?
Componentes del Análisis Visual en Tableau
7 ventajas del análisis visual en Tableau
¿Cómo insertar formas en el análisis visual de Tableau?
7 recomendaciones para realizar gráficos en Tableau
¿Cómo usar los colores en la visualización de datos en Tableau?
Glosario de Tableau: 7 conceptos fundamentales

Big Data Architecture

9 cosas que debe saber hacer un Big Data Architect
¿Qué es una Arquitectura de Software?
¿Cuáles son los tipos de arquitectura Big Data?
Diferencias entre sistemas distribuidos y monolíticos
Tipos de formatos de datos en Big Data
¿Qué son los datos estructurados?
JSON API: ¿qué es y para qué sirve?
5 diferencias entre los datos estructurados y no estructurados
¿Qué es Scrapy?
¿Cómo es la arquitectura de Scrapy?
Scraping vs Crawling: ¿cuál es la diferencia?
Scraping con Python requests
Ventajas y desventajas de Scrapy
Glosario Scrapy: 7 conceptos clave
JSON-LD: ¿qué es y para qué sirve?
Herramientas de Big Data en la nube
¿Cuáles son los proveedores de servicios Cloud más usados?
6 conceptos clave en arquitecturas Cloud
Soluciones Cloud en Google para Big Data
¿Qué es Google Cloud SQL?
¿Qué es Google Cloud Datastore?
¿Cómo insertar datos en bases de datos Cloud?
¿Cómo usar Cloud SQL Marketplace?
¿Cómo funciona MongoDB?
Historia del origen de las bases de datos
¿Qué es una base de datos?
¿Qué es el teorema CAP?
Diferencia entre base de datos SQL vs NoSQL
¿Cuál es la diferencia entre PostgreSQL y MongoDB?
Query en bases de datos SQL y NoSQL
Insertar datos en Postgres y MongoDB
Relacionar datos nuevos en Postgres y MongoDB
¿Qué es PostgreSQL?
¿Qué es Elastic Search?
Diferencias entre Elastic Search y Solr
Arquitectura de Elastic Search
Analyzers en Elastic Search
¿Cómo subir datos a ElasticSearch?
Uso y ejemplos de ElasticSearch
¿Qué son las Queries de ElasticSearch?
¿Cuáles son los tipos de búsqueda en ElasticSearch?
¿Para qué sirven los Indexes y maps en ElasticSearch?
¿Cómo modificar tipos de Indexes en ElasticSearch?
Manejo de documentos en ElasticSearch
Agregación y Queries complejas en ElasticSearch
¿Cómo funciona Kibana en ElasticSearch?
Glosario de ElasticSearch: 5 conceptos clave
¿Qué son Data Lakes?
Principales características de Data Lakes
Requisitos para trabajar con Metadatos
¿Cómo funciona el diseño de Data Lake?
Glosario Data Lakes: 5 conceptos base
¿Qué es Analítica como Servicio (DAaaS)?
¿Por qué usar Hadoop?
4 elementos principales de Hadoop
Hadoop desde cero
¿Qué significa POSIX?
¿Qué es HDFS?
¿Qué es YARN?
¿Qué es Scheduling (Governance)?
¿Qué son las colas de YARN?
Configurar colas de procesamiento en Hadoop
¿Qué es Hadoop Common?
¿Qué es MapReduce en Hadoop?
Cómo funcionan los ficheros de configuración en Hadoop
¿Cuáles son los tipos de directorios en Hadoop?
¿Qué es el directorio sbin?
¿Qué es el directorio bin?
¿Qué es el directorio share?
¿Qué es el directorio etc?
¿Qué es el terminal por container Master?
¿Qué es el terminal por container Slave?
¿Cómo se usa Scale en Hadoop?
¿Cómo se crea un nuevo Datanode en Hadoop?
¿Qué son los Firewalls en Hadoop?
¿Qué es Virtual Private Cloud?
¿Qué es subnet en arquitectura Cloud?
¿Cómo montar un clúster de Hadoop en la nube?
¿Qué es Docker?
¿Cómo funcionan los jobs en Dataproc?
¿Cómo ejecutar jobs sin comandos a mano en Dataproc?
¿Qué es Hive?
¿Qué es JDBC (Java Database Connectivity)?
¿Qué es ODBC (Open Database Connectivity)?
¿Qué es Apache Thrift?
¿Qué es Beeline en Hive?
Queries simples de Hive
Extracciones hacia segmentos de Google Storage en Hive
¿Cómo configurar un Hive?
Hacer queries en DataProc con GCloud, Python y Hive
Elastic Hadoop Connector: ¿qué es y para qué sirve?
¿Cómo hacer cambios en cluster de Hadoop?
Glosario Hadoop: 7 conceptos clave
¿Qué es apache Kafka?
¿Qué es PubSub?
Ejemplo de Kafka en GCP con Flume
¿Qué es Apache Flume?
¿Cómo entrar al clúster de Dataproc con Shell?
Personalizar el cluster de Dataproc al arranque
Google Cloud Storage para crear, leer, descargar ficheros
¿Cómo funciona el diseño del DAaaS?
¿Qué es GCP (Google Cloud Plataform)?

Data WareHouse & ETL

¿Qué es ETL (extraer, transformar, cargar)?
¿Para qué se utiliza ETL?
¿Cómo funciona la Fase de Extracción de ETL?
¿Cómo funciona la Fase de Transformación de ETL?
¿Cómo funciona la Fase de Carga de ETL?
¿Qué es la estrategia proyecto ETL?
¿Cuáles son las herramientas ETL?
¿Cómo es la arquitectura Centro de Información?
¿Qué es Talend Open Studio?
Interfaz de Usuario de Talend Open Studio
¿Cuáles son los menús de Talend Open Studio?
Control de versiones de Talend Open Studio
¿Qué es el Business Model en Big Data?
¿Cómo es el esquema de Talend Open Studio?
¿Cómo hacer una Query en Talend Open Studio?
Crear Jobs en Talend Open Studio
Configurar vista de edición en Talend Open Studio
Flujos de datos en Talend Open Studio
¿Cómo organizar jobs en Talend Open Studio?
Variables en Talend Open Studio
Generador de flujos de datos en Talend Open Studio
Glosario de Talend Open Studio: 7 conceptos primordiales
Data Quality: ¿qué es y cómo funciona?
¿Qué son los Filewatchers?
¿Cómo funciona la gestión masiva de ficheros?
¿Cómo construir DataWarehouse?
¿Qué es un ODS (Operational Data Store) en Big Data?
¿Cómo es el diseño de ODS y DW?
¿Cuáles son los componentes de un DataWarehouse?
¿Qué son las dimensiones SDC?
Tipos de dimensiones de Data Warehouse
¿Qué es la dimensión tipo 0 Data Warehouse?
¿Qué es la dimensión tipo 1 Data Warehouse?
¿Qué es la dimensión tipo 2 en Data Warehouse?
3 Tipos de Carga en Integración de Datos
¿Cómo funciona el Control de Cambios (CDC) en Data Warehouse?
Tips de carga en Base de datos de Data Warehouse
¿Qué es la Carga Incremental en Data Warehouse?
¿Qué es Pushdown en Data Warehouse?
Glosario ETL: 7 conceptos clave
Glosario de Data Warehouse: 7 conceptos fundamentales

Big Data Processing (Spark & Scala)

¿Qué es el Big Data Processing?
¿Qué es SBT (Simple Build Tool) en Scala?
¿Qué es REPL (Read-eval-print-loop)?
Fundamentos y conceptos básicos de Scala
val vs var en Scala
4 tipos de métodos en Scala
¿Qué es Class en Scala?
¿Qué es clase abstracta en Scala?
¿Qué es Trait en Scala?
5 expresiones lógicas de Scala
¿Qué es Pattern Matching en Scala?
¿Qué es Standard Library en Scala?
Guía de map & flatMap en Scala
¿Qué son Futures en Scala?
Glosario Scala: 7 fundamentos clave
¿Qué es Apache Spark?
¿Cómo es la arquitectura de Apache Spark?
¿Qué es Clúster Manager en Spark?
Driver en Apache Spark
¿Qué es SparkContext?
¿Qué es Worker Node en Spark?
¿Qué son los Executors en Spark?
6 fundamentos de Spark Stack
¿Qué es Spark Structured Streaming?
¿Cómo funciona Spark Core?
¿Qué es Spark Shell en Apache Spark?
¿Qué es RDD (Resilient Distributed Datasets)?
Glosario Apache Spark: 8 conceptos clave
¿Cuáles son las Transformaciones y Acciones en Spark?
¿Qué es Spark GraphX en Apache Spark?
¿Qué es Spark MLlib en Apache Spark?
¿Cómo funciona Windows en Spark Structured Streaming?
¿Cómo funciona Joins en Spark Structured Streaming?
¿Cómo funciona Deduplication en Spark Structured Streaming?
¿Qué es Spark SQL en Apache Spark?
¿Qué es Apache Parquet?
¿Qué es Apache Avro?
¿Qué es JDBC Connection en Apache Spark?
Glosario Apache Hive: 5 conceptos fundamentales
7 librerías de diseño visual para Big Data

Modern Exploration & Visualization (d3.js)

¿Qué es Data-Driven Documents?
¿Qué es NVD3.js?
Estructura de una gráfica: 5 conceptos clave
SVG vs Bitmap
Tipos de elementos gráficos en D3
5 tipos de etiquetas en D3
Funciones de obtención de datos en D3
Tratamientos de datos en D3
¿Qué es Data binding?
¿Cuál es la función de Escala en D3?
Márgenes y grupos en D3
¿Cómo funcionan los ejes en D3?
Animaciones e Interactividad en D3
¿Por qué utilizar Data-Driven Documents (D3)?
¿Cómo funciona la etiqueta SVG en D3?
¿Cómo trastear con los márgenes en D3?
¿Cómo definir las etiquetas en D3?
Glosario D3.js: 7 conceptos clave
¿Cómo crear un botón que añada círculos aleatorios en D3?
¿Para qué sirve Console.log() en D3?
Convertir los datos en enteros en D3
Convertir los datos en fechas en D3
¿Cómo crear DIVs y etiquetas en D3?
¿Qué son los eventos en D3?
¿Qué son las transiciones en D3?
¿Qué es una gráfica de globos en D3?
¿Qué es Data Call en D3?
¿Cómo definir las funciones en D3?
5 tipos de gráficos en D3
¿Cómo generar interacción con el usuario en D3?
¿Cómo es la estructura del directorio de D3?
¿Qué es el index.html en D3?
¿Qué es el sistema de coordenadas en D3?
¿Cómo es la curva de aprendizaje para D3?
¿Qué es Math.random() en D3?
¿Cómo aplicar la función enter en D3?
¿Cómo aplicar la función exit en D3?
Ejemplo práctico update y exit en D3
Tutorial de escala lineal en D3
¿Qué es el evento onmouseover en D3?
¿Qué es el evento onmouserout en D3?
¿Qué es el evento click en D3?
¿Qué es tooltip en D3?
¿Qué es el dominio de escala en D3?
¿Qué es el rango de escala en D3?
¿Qué es el patrón de actualización en D3?
¿Cómo se declara la proyección en D3?
¿Qué es la función que dibuja el mapa en D3?

Estadística

¿Cómo funciona la estadística en el Big Data?
Estadística vs Machine Learning
Introducción a R
¿Cuáles son las operaciones en R?
¿Qué son las funciones básicas en R?
Asignaciones y operaciones en R
¿Qué son las asignaciones en R?
¿Qué es el tipo de datos integer?
¿Qué es el tipo de datos double?
Diferencias entre integer y double
¿Qué es un estimador en estadística Big Data?
¿Qué son las distribuciones en estadística Big Data?
2 tipos de variables en estadística Big Data
Cadenas de texto en estadística Big Data
¿Cuáles son los tipos de media en R?
¿Cuáles son los tipos de distribuciones en estadística?
Análisis de dataset Iris en estadística Big Data
¿Qué es muestreo en estadística Big Data?
¿Cuáles son los gráficos en estadística Big Data?
¿Cuáles son las relaciones entre variables en estadística Big Data?
¿Qué son los tests estadísticos para el manejo Big Data?
4 tipos de tests estadísticos para Big Data
4 tipos de estimadores estadísticos en Big Data
3 tipos de muestreo estadístico para Big Data
¿Qué es la distribución discreta en estadística Big Data?
¿Qué es dataset con variables categóricas en R?
¿Qué es Dataset Frame en R?
¿Qué es sesgo en estadística Big Data?
¿Qué es la paradoja de Simpson en estadística Big Data?
¿Qué es la varianza en estadística Big Data?
Glosario de R: 7 conceptos clave
Glosario de estadística Big Data: 5 fundamentos
¿Cuáles son los tipos de sesgo en estadística Big Data?
Ejemplo del sesgo del superviviente en estadística Big Data
¿Qué es la estimación en estadística Big Data?
¿Qué es el margen de error estadística Big Data?
Intervalos de confianza en estadística Big Data
¿Qué son los vectores en estadística Big Data?
¿Qué son las matrices en estadística Big Data?
¿Cómo funcionan las tablas en estadística Big Data?
Valores no disponibles en estadística Big Data
¿Qué es histograma en estadística Big Data?
Función de densidad de probabilidad en estadística
Función de distribución acumulativa en estadística
Gráfico Q-Q en estadística Big Data
Distribución beta en estadística Big Data
¿Qué es correlación en estadística Big Data?
Ejemplo varianza acciones en estadística Big Data
Desigualdad de Chebyshev en estadística Big Data
Cuantiles en estadística Big Data
Comprobación teorema centrál del límite en R
Datos de strava en estadística Big Data
3 ejemplos de probabilidad en estadística Big Data
¿Qué es moda en estadística Big Data?
Listas en estadística Big Data
¿Cómo funcionan las fechas en R?
Función arrays 3D en estadística Big Data
Valores infinitos y NaN (Not a Number) en estadística
¿Qué son los valores NULL en estadística?
Ejemplo estadístico de test de embarazo
Distribución exponencial en estadística Big Data
¿Qué es la función Q(z) en estadística Big Data?
Unidad tipificada (Z-score) en estadística Big Data
Distribución chi-cuadrado en estadística Big Data
Regresión lineal en estadística Big Data
Definición de inversa de una matriz
Distribución uniforme en estadística Big Data
Distribución gaussiana en estadística Big Data
Distribución de Poisson en estadística Big Data
Distribución binominal en estadística Big Data
Distribución Bernoulli en estadística Big Data
Ejemplo estadístico del CSV de la edad española
Ejemplo de covarianza para finanzas
¿Qué es el sobreajuste en estadística Big Data?
Estimación de funciones polinómicas en estadística
Ejemplo estadístico evolución de población española
Fiabilidad de los coeficientes en estadística
Coeficiente de determinación R² en estadística
Ejemplo estadístico de la producción de cereales por hectárea
Regresión lineal múltiple en estadística Big Data
Ejemplo estadístico del peso de los niños al nacer
Clasificación estadística de Regresión logística
Dataset Anscombe en estadística Big Data
Distribución conjunta en estadística Big Data
Teorema de Bayes en estadística Big Data
Ejemplo árboles bayesianos en estadística
Análisis Causal y contrafactual en estadística
El problema de Monty Hall en estadística
Análisis estadístico de dos variables dependientes
Análisis estadístico de dos variables discretas
Ejemplo estadístico de censo

Deep Learning

¿Qué es el Deep Learning?
Contexto histórico del Deep Learning
Tipos de aprendizaje del Deep Learning
Definición de tensores en Deep Learning
Ejemplo carga de dataset externo en Deep Learning
¿Para qué sirve TensorFlow?
Sesiones iterativas y grafos en TensorFlow
Descenso de gradiente en TensorFlow
Ejemplo de regresión lineal
Ejemplo de Tensor 1D en TensorFlow
Crear una tf.Operation en TensorFlow
Ejemplo de problemas de optimización en TensorFlow
Ejemplo de regresión logística en TensorFlow
Función softmax en TensorFlow
¿Qué es una red neuronal en Deep Learning?
Principales funcionalidades de las redes neuronales
Entrenamiento de una red neuronal en Deep Learning
Forward y back propagation en Deep Learning
Backward pass en Deep Learning
Ejemplo de una neurona en Deep Learning
Descenso de gradiente en una red neuronal de TensorFlow
¿Qué es la entropía cruzada en Deep Learning?
Ejemplo: capas ocultas de las neuronas en Deep Learning
Ejemplo de una red neuronal profunda en TensorFlow
La división de datos en Deep Learning
Teoría de optimización en Deep Learning
¿Qué es Stochastic Gradient Descent en Deep Learning?
¿Qué es Mini-batch Stochastic Gradient Descent?
Optimización de hiperparámetros en Deep Learning
Learning rate en Deep Learning
Decay al Learning rate en Deep Learning
¿Qué es el batch size en Deep Learning?
Ejemplo de redes profundas en Deep Learning
Ejercicio de redes neuronales profundas
Ejemplo de redes neuronales en Deep Learning
Relación de learning rate y batch size
¿Qué es una función de pérdidas en Deep Learning?
¿Qué es una función de activación en Deep Learning?
Glosario Deep Learning: 7 conceptos clave
Ejemplo de una función de activación en Deep Learning
Inicialización de los pesos y bias en Deep Learning
Función de pérdida vs función de activación
3 funciones de activación en Deep Learning
Neurona Maxout en Deep Learning
Tipos de inicialización de pesos en Deep Learning
Distribución normal y uniforme de inicialización de pesos
¿Qué es Keras en Deep Learning?
¿Cómo generar la arquitectura de modelo en Deep Learning?
Ejemplo de Redes Neuronales Convolucionales
¿Qué es la convolución?
Ejemplo de Kernel en Deep Learning
Convolución horizontal y vertical de strides
¿Cómo la convolución detecta un patrón?
Arquitectura típica de una red neuronal convolucional
Feature extractor y classifier de red neuronal convolucional
Tipos de capas de red neuronal convolucional
Capas de Pooling en una red neuronal convolucional
Locally-connected Layers de red convolucional
Preprocesamiento de imágenes de entrada
Normalizar los datos en Deep Learning
Efecto modificación de capas en Deep Learning
¿Qué es overfitting en Deep Learning?
¿Qué es Batch-Normalization para red convolucional?
Glosario de TensorFlow: 5 conceptos clave
¿Qué es la regularización en red convolucional?
Regularización L2 en red neuronal convolucional
Regularización L1 en red neuronal convolucional
Regularización por restricción en red convolucional
Regularización por Dropout en red convolucional
¿Qué es transfer learning y fine-tuning?
Data augmentation en red convolucional
Visualización de activaciones y filtros en red convolucional
Ejemplo de clasificación de imágenes con Keras
Tipos de arquitecturas de redes convolucionales
Ejemplo de visualización de filtros
Arquitectura VGG16 y VGG19 en Deep Learning
Ejemplo de visualización de activaciones de capas
Modificación del número de capas congeladas en DL
Glosario de Keras: 5 conceptos fundamentales

BBDD relacionales, SQL & MySQL

¿Qué es una base de datos no relacional?
¿Qué es una base de datos relacional?
¿Qué son los motores de bases de datos? [6 motores]
¿Qué es MySQL?
¿Cómo crear una BBDD en Virtual Box?
Llaves primarias y foráneas de las BBDD relacionales
¿Qué son las formas normales de una base de datos?
Los 4 tipos de datos de BBDD
Ejercicio práctico en SQL con los Simpson: premisas y elementos
Pasos para crear una tabla en VirtualBox con SQL: Los Simpson
Cómo controlar la alteración de tablas con MySQL [4 comandos]
4 campos relevantes en bases de datos
Cómo poblar con registros una tabla en MySQL
Tablas del ejercicio práctico en SQL
¿Cómo definir una foreign key?
6 comandos SQL para ejercicio práctico
Cómo localizar registros duplicados con MySql
Cómo localizar valores nulos con MySql
¿Qué son las formas normales de cuarto a sexto nivel?
Cómo poblar una tabla de profesiones en ejercicio práctico
Cómo poblar tabla de mascotas en ejercicio práctico
Cómo poblar tabla de lugares en ejercicio práctico
¿Para qué se utilizan los comandos union y union all?
¿Qué es un JOIN y sus tipos?
Cómo poblar tabla de frases en ejercicio práctico
¿Cómo ver la estructura de una tabla creada con ALIAS en MySQL?
En qué consisten RIGHT OUTER JOIN e IFNULL en MySQL
Diferencias entre INNER JOIN y LEFT OUTER JOIN
¿Qué es la normalización de una tabla?
Diferencias entre RIGHT OUTER JOIN y LEFT OUTER JOIN
Otra solución a INTERSECT en MySQL
3 funciones para string en SQL: minus, mayus y longitud
4 funciones numéricas en SQL: SQRT, POW, SIGN Y ABS
3 funciones de fecha y hora en SQL: current, date, date_format
Otras funciones en SQL: BIN, CASE, COALESCE
¿Qué es una vista en MySQL?
¿Qué es minus en MySQL?
Funciones repeat y reverse para string en SQL
Funciones locate y concat para string en SQL
Funciones LPAD y RPAD para string en SQL
Funciones SUBSTR e INSTR para string en SQL
Funciones SUBSTR y SUBSTRING para string en SQL
Conoce diferentes posibilidades del date_format
Funciones STRCMP y ASCII para string en SQL
Funciones FIELD Y FIND IN SET para string en SQL
Funciones numéricas de agrupaciones SQL
Funciones de encriptación en SQL
Funciones TRIM y RTRIM para string en SQL
Funciones CONV e IF en SQL
Funciones ROUND y TRUNCATE en SQL
Funciones FLOOR y RAND en SQL
Funciones exponenciales Y logaritmicas en SQL
Otras funciones numéricas en SQL: RADIANS, DEGRESS Y PI
Diferencias entre la función CEILING y FLOOR
Funciones GREATEST y LEAST en SQL
Otras funciones para obtener fechas y tiempo en SQL
Funciones TO y FROM para fechas en SQL
¿Cómo ejecutar un hola mundo en SQL?
Funciones trigonométricas en SQL
Funciones SIN y COS en SQL
Funciones con intervals para fecha y hora en SQL
Función extract para fecha y hora en SQL
Funciones MAKEDATE y DATEDIFF en SQL
Funciones ADDDATE y SUBDATE en SQL
Cabecera de una función en MySQL
Cuerpo y resultado de una función en MySQL
Ejercicio prácitco: función comparar números en MySQL
Ejercicio prácitco: función cuenta adelante en MySQL
Ejercicio práctico: función cuenta atrás en MySQL
¿Qué son los triggers en MySQL?
¿Qué son los cursores en MySQL?
Los elementos de la interfaz de MySQL Workbench
Procedimientos de funciones en SQL

Data Management

¿Qué es la gestión de datos?
Glosario de Data Management: 5 conceptos base
¿Qué es DAMA en data management?
¿Cuáles son los principios del data governance?
Partes implicadas en la organización del data governance
4 fases en el proceso del data governance
3 herramientas para data governance
Elementos de los datos y datos críticos
Gestión de metadatos dentro de los EDC
¿Qué son los metadatos de negocio?
Roles en Metadatos management
¿Qué son los metadatos técnicos?
Qué es el ciclo de vida del desarrollo del sistema
Herramientas tecnológicas para gestionar metadatos
Modelo lógico de datos: conexión con el usuario de la BD
¿Qué es Oracle Data Modeler?
¿Qué es el derecho de acceso a los datos?
¿Qué son los stakeholders?
Crear una entidad en un modelo lógico de datos
Crear un dominio en un modelo lógico de datos
Asociar un dominio de datos a un diseño lógico
Generar modelo relacional desde un data modeler
¿Qué es un modelo entidad-relación?
Crear un glosario en Data Modeler
Crear un modelo físico de datos
Crear modelo físico de una base de datos heredada
¿Qué es un modelo de datos físicos?
¿Qué es la ingeniería inversa de una BBDD?
Modelo ER de una base de datos PostgreSQL
Niveles de abstracción de una base de datos
Diferencias entre modelos de bases de datos: modelo lógico, físico y relacional
¿Qué es Oracle SQL Developer?
¿Qué es una base de datos orientada a objetos?
¿Qué es la analítica predictiva?
Aspectos puntuales en la ingeniería inversa de una base de datos
Cambiar tipos de datos de base de datos PostgreSQL trasladada a Oracle
Definir arquitectura de origen y destino en Talend Data Integration
Ingeniería inversa de conexiones origen y destino en Talend
Crear un job en Talend Open Studio
Llenar el área de trabajo del Job Design
¿En qué consiste la integración de datos?
Crear un destino de carga en Talend Open Studio sin un modelo físico construido
Crear un repositorio de conexión en ODI
¿Cómo funciona ODI Studio?
Crear arquitectura física de origen en ODI
Crear arqutiectura física de destino en ODI
Cómo definir una arquitectura lógica en ODI
Cómo unir arquitectura física y lógica en ODI
Crear una estructura o modelo en ODI
Crear una asignación en ODI
Crear un destino de carga en ODI sin una tabla
¿Qué es Pentaho Data Integration?
¿Qué son los diagramas de flujo de datos?
¿Qué son los knowledge modules?
Crear un modelo sin tabla en ODI
¿Qué es Trifacta?
Crear un flujo en Trifacta
Importar y agregar Datasets en Trifacta
Añadir recipes en Trifacta
Barras de calidad e histogramas en Trifacta
Depurar información en Trifacta
Dividir palabras de un mismo campo en Trifacta
Aplicar configuración de un recipe en Trifacta a otro recipe
Visualizar los resultados de un recipe en Trifacta
Añadir un Dataset en Talend
Organizar y depurar información en Talend
Aplicar proceso de estandarización en Talend
Corregir errores atípicos en Talend
Crear una columna en Talend desde otra columna ya creada
Estandarizar el campo de email en Talend
Segmentar un campo con Talend
Fusión por lookup en Talend
Ofuscación en Talend
Exportar una fuente limpia en Talend

Data Mining

2 libros sobre data mining que tienes que conocer
Aprendizaje máquina, estadística y minería de datos: diferencias
El aforismo «todos los modelos son erróneos» en estadística
Aprendizaje supervisado en data mining
Aprendizaje no supervisado en data mining
¿Qué es la optimización en data mining?
Criterios de convergencia en data mining
Mínimos en data mining: mínimo local y global
Método de descenso de gradientes
¿Qué es una derivada?
Método de Newton
Calcular el gradiente y la matriz Hessiana en R
Funciones para optimización en R
Grid search en Python
¿Qué son los multiplicadores de Lagrange?
Ejemplo de cartera de fondo de inversión en R
¿Qué son los quants?
Pseudoinversa Moore-Penrose
¿Qué es el histograma de residuos en R?
¿Qué es una generalización estadística?
Calcular producción de energía neta con R
¿Qué es la distancia de Cook?
Ejercicio de aplicación: predecir dureza del hormigón con R
¿Qué son las variables categóricas?
Codificación de variables categóricas
¿Qué son los contrastes en R?
Dividir los datos en train y testing
Lenguajes de programación más usados en quant trading
Regresión lineal con t-student y ANOVA
Reordenar factores en R
¿Qué es la regresión cuantílica?
Ejercicio práctico de regresión lineal con t-student y ANOVA
Efectividad de una dieta: ejercicio de aplicación en R
¿Qué es el preprocesado en R?
Ejercicio de preprocesado en R: el dogma central de la biología molecular
Ejercicio de preprocesado en R aplicando regresión lineal
Estandarizar datos de preprocesamiento en R
¿Qué es model drift en machine learning?
¿Qué es la transformación de variables en R?
Ejercicio práctico de transformación de variables con R
Valores no disponibles en R
Outliers en R
Regularización en R y ejemplo
Regularización Lasso en R y ejemplo
Cross validation en R
Regularización ridge en R
Ejercicio de regularización en R para predecir la dureza del hormigón
¿Qué es el overfitting?
¿Qué es la regresión logística?
¿Qué es la razón de momios u odds ratio?
Matriz de confusión en R
Medidas de calidad en matrices de confusión
¿Qué es la curva ROC?
¿Qué es el criterio de información Akaike AIC?
¿Qué ocurre cuando hay errores que no siguen una distribución normal en estadística?
Estimadores de máxima verosimilitud
¿Qué es una función de enlace o link function?
Función de enlace Probit
Interpretabilidad de modelos en machine learning
3 podcast sobre data mining que debes escuchar
Ejemplo de distribución exponencial en R
Predicción de covid con big data: ¿cómo funcionó en los primeros meses?
Test A/B con GLM
Ejercicio con regresión de Poisson
¿Qué es el clustering o agrupamiento en machine learning?
Métodos de clustering
Medir de calidad de un clúster
Ejemplo de clustering con dataset Iris
Ejercicio práctico de clustering con proteínas
Medidas de calidad con Average Silhouette Width (ASW)
¿Qué son los algoritmos jerárquicos?
¿Qué es el Hierarchical DBSCAN (HDBSCAN)?
Ejercicio de aplicación de clustering con los tipos de aceite
Clustering con ejemplo de expresión genética de la levadura
¿Qué es el biclustering en biología y Big Data?
¿Qué es el cluster por densidad?
Ejemplo de cluster por densidad con la clasificación de estrellas
Ejercicio de cluster por densidad con dataset Iris
¿Qué son los modelos de caja negra?

Machine Learning 101

¿Qué es PCA en estadística?
¿Cómo calcular un PCA en R?
Calcular PCA con predict en R
Aplicar PCA a dataset Iris
Aplicar PCA a dataset de proteínas
Ejemplo de regresión logística con PCA
Desarrollo de algoritmo Eigenfaces: primera etapa
Desarrollo de algoritmo Eigenfaces: segunda etapa
Aplicar PCA al reconocimiento facial
Transformar una imagen en el dominio PC
¿Cómo obtener una matriz original sin perder información?
¿Qué son los autovectores y cuál es su importancia?
Clasificación usando PCA
Reconocimiento facial con kNN
Reconocimiento facial con regresión logística
Explicación de ejercicio de reconocimiento facial
Regularización de algoritmo de reconocimiento facial
¿Qué es el análisis discriminante lineal (LDA)?
¿Cómo obtener un AUC más alto separando las curvas de densidad?
Análisis comparativo entre LDA y GLM por medio de un ejercicio de regresión logística
LDA para clases múltiples
Ejemplo de LDA para clases múltiples
Comparación entre LDA y PCA
El perceptrón y el origen de las redes neuronales
El libro «Perceptrons» y la revolución de las redes neuronales
Recesión de la inteligencia artificial
El backpropagation y la solución a los problemas del perceptrón multicapa
Origen del Deep learning y el renacimieto de las redes neuronales
¿Qué ocurre en regresión logística cuando tenemos dos variables correlacionadas estrechamente?
Ejemplo de clasificación estadística usando un dataset de asteroides
¿Cómo interceptar un problema de clasificación estadística desde el principio?
El cartpole y el aprendizaje por refuerzo de una IA
Ejercicio con un algoritmo de Machine Learning: definir qué es un gato
¿Cómo se refleja el machine learning en el día a día?
El algoritmo DL que derrotó a los mejores jugadores de Starcraft II
Tipos de machine learning
Fórmula matemática del aprendizaje supervisado
Glosario de 4 términos relacionados con el machine learning
Algoritmos paramétricos vs. no paramétricos
¿Cómo funciona el algoritmo de vecinos más próximos o K-NN?
3 páginas en las que puedes descargar datasets
¿Clasificación o regresión en Python? [Ejercicio práctico]
¿Cómo medir las prestaciones de un clasificador?
Librería Pandas: aspectos más importantes
Entrenar un modelo K-NN
Explicación de la gráfica de complejidad de un modelo frente a la precisión
Limitaciones de la división train y test
Solución al problema de la división train y test
Entrenamiento y test en la evaluación de un modelo
¿Para qué sirve el train_test_split?
¿Qué es la estratificación en machine learning?
Representar las prestaciones del algoritmo K-NN en train y test para distintos valores de n_neighbors
¿Cómo escoger el valor óptimo de n_neighbors?
¿Qué es GridSearchCV?
¿Qué es NumPy y cómo funciona?
¿Qué es Matplotlib y cómo funciona?
¿Qué es un array en Python y cómo crear uno?
¿Cómo funcionan las clases y objetos en Python?
Algunas funcionalidades de la librería pandas
¿Cómo elegir el algoritmo adecuado en ML?
¿Qué es el compromiso sesgo-varianza?
Ejemplo de compromiso sesgo-varianza
¿Por qué es necesario aplicar validación cruzada en un ejercicio de sesgo-varianza?
Representar el MSE para distintos niveles de complejidad de un algoritmo de regresión lineal
Principios del aprendizaje en machine learning
Ciclo de vida de un proyecto en machine learning
Regresión lineal en problemas de overfitting
Regularización Ridge en problemas de overfitting
Regularización Lasso en problemas de overfitting
Regularización sobre algoritmos de regresión
Regularización sobre regresión Ridge
Entrenar un modelo Ridge para distintos valores de a
Entrenar un modelo Lasso para distintos valores de a
Regularización sobre algoritmos de clasificación
Algoritmo de regresión logística variando el valor de C
Calcular el valor óptimo de C en un algoritmo de clasificación
Qué es la selección de características en machine learning
Métodos de filtrado para selección de características en machine learning
Análisis exploratorio básico de BD sobre estimación del precio de una vivienda
Ejercicio de cargar datos con dataset sobre estimación del precio de una vivienda
Ejercicio de análisis exploratorio con dataset sobre estimación del precio de una vivienda
Visualizar outliers con variables categóricas
¿Qué es la colinealidad y cómo corregirla?
Métodos de filtrado para regresión
Métodos de filtrado para clasificación linealmente separable
Métodos de filtrado para clasificación no linealmente separable
Métodos de filtrado en machine learning sobre problema realista
Todo lo que necesitas saber sobre los métodos wrapper
Ejercicio con métodos wrapper
Métodos embebidos en machine learning
¿Qué es la intuición artificial en machine learning?
Construcción de un árbol de decisión
Árboles de decisión sobre series temporales
Ejemplo de árboles de decisión
Árboles de clasificación sobre ejemplo realista
Árboles de regresión
Remuestreo bootstrap y bagging
¿Qué es random forest?
np-where y LabelEncoder: convertir una variable booleana en numérica
¿Cómo hacer una transformación de variables?
Entrenar un árbol de decisión individual
Ejemplo de bagging y random forest
Importancia de las variables en los algoritmos basados en árboles
Ejemplo de regresión con árbol de decisión y random forest
Ejemplo de bagging
Boosted trees y la revolución del Machine learnig
Ejemplo de boosted trees con clasificación
Construir el conjunto de test de un boosted tree
Árbol de decisión de un conjunto de test
Ejercicio de boosted trees
¿Qué son las SVM o Support Vector Machines?
Caso linealmente no separable de SVM
SVR o SVM en regresión
Ejemplos sintéticos de SVM en problemas de clasificación
¿Cómo funciona el k-nn en regresión?
Importancia de los Kernels para los SVM
2 características de los boosted trees: hiperparámetros e interpretabilidad
Representar la importancia de las variables en un ejercicio de boosted trees
Operaciones sobre kernels
Ejemplo realista de SVM en problemas de clasificación
Ejercicio de RFE sobre validación cruzada
Ejemplo realista en regresión
¿Qué es el Kernel Ridge Regression?
¿Qué es el Kernel PCA?
Métricas en clasificación: algunas generalidades
Métricas en clasificación: tasas de interés en estadística
Métrica en clasificación de la curva ROC
¿Qué son los problemas desbalanceados en ML?
Calcular el ratio de desbalanceo de un problema
Ejercicio de preprocesamiento de variables
Representar un mapa de correlación entre variables
Calcular distintas métricas de clasificación a partir de una matriz de confusión
Parámetro class_weight en regresión logística
Clasificación multiclase de imágenes
¿Cuál es la relación entre álgebra lineal y Big Data?
Tipos de variables en python
Operadores aritméticos en Python
Operaciones matemáticas con Python
Listas en Python
Representación gráfica de un conjunto en Python
Cardinalidad y pertenencia de conjuntos en Python
Determinación de un conjunto en Python
Igualdad de dos conjuntos en Python
Conjunto universal E en Python
Ejercicios de conjuntos en Python
Tuplas en Python
Diccionarios en Python
Funciones range y zip en Python
Función Reversed en Python

Algebra, Cálculo & Geometría

¿Qué son los vectores?
Esquema del problema de machine learning
¿Qué es la loss function?
Explicación de la fórmula de loss function
Optimización con ecuaciones polinómicas
¿Qué son las funciones convexas?
El método más simple para calcular errores en un modelo de ML
Tipos de vectores matemáticos
¿Qué es la dimensionalidad de vectores?
Suma y resta de vectores (arrays)
Representar un array visualmente
Suma de un escalar a un array
La lógica detrás de algunas operaciones con vectores
Multiplicar un escalar por un vector
Producto escalar o interno
Fórmula matemática del producto escalar
¿Qué es la ortogonalidad de vectores?
Similitud entre vectores o cosine similarity
Ejercicio de similitud entre vectores
Ejemplo de similitud de coseno
Ejemplo del producto escalar en Python
¿Qué es la norma de un vector?
Visualización de vectores con Python
Ejercicio sobre el producto escalar
Ejercicio sobre similitud entre vectores
Ejercicio de similitud entre dos frases
¿Qué son los algoritmos word embedding?
Ejercicio de similitud: calcular similitud entre frases
¿Qué es el producto vectorial?
Atributos de los Numpy arrays
Indexing y slicing en Python
Reshaping y joining and splitting en Python
Estructura de un espacio vectorial
Combinaciones lineales entre vectores
Visualización de una combinación lineal
Dependencia lineal de vectores con sympy
Dependencia lineal de vectores con solve de numpy
Espacio nulo de una matriz
Espacio fila y espacio columna en una matriz
Graficación de vectores: eje de coordenadas
Ejemplo de graficación de vectores
Ejemplo de la ley de gravitación universal de Newton
¿Cómo generar imágenes usando Numpy?
Figuras geométricas y fractales con Matplotlib
Ejercicio sobre espacios vectoriales
Ejemplo de word embedding
Una variación de las word embeddings
Cosine similarity en espacios vectoriales
Crear gráficos con Matplotlib
Ejemplos de fractales en Python
¿Qué es una matriz?
Relación entre la transformación lineal y las matrices
Ejemplo de matrices en la transformación lineal
Tipos de matrices
Definir matrices en Python
Suma de matrices
Multiplicación de matrices
¿Qué es una matriz traspuesta?
Matriz inversa usando Gauss
Rango de una matriz: qué es y cómo calcularlo
Relación entre el rango de una matriz y el machine learning
Rango de una matriz con Python
Factorización LU (Lower-Upper)
Cambio de base en espacios vectoriales
¿Qué es el determinante de una matriz?
Calcular determinantes en Python
¿Qué es el menor complementario?
¿Qué es una matriz invertible?
Sistemas de ecuaciónes y combinaciones lineales
Sistemas de ecuaciones: todo lo que necesitas saber
Ejercicio sobre sistemas de ecuaciones
¿Qué es el sistema compatible indeterminado?
¿Qué es el PageRank?
Los perceptrones y las ecuaciones lineales
Introducción a Numba for CUDA (en Python)
Sistema de ecuaciones sin solución
Ejemplo de sistemas de ecuaciones lineales
El papel de la hipótesis en una función lineal
Diferencias: underfitting vs overfitting
Tiempo de espera y erupción actual en eje de coordenadas
¿Qué son los mínimos cuadrados?
Mínimos cuadrados en forma matricial
Ampliar una regresión lineal
Un resumen sobre las regresiones
¿Qué es el gradient descent?
El arg min en un gradiente descendente
Fórmula matemática del descenso de gradiente
¿Qué es el learning rate en el descenso de gradiente?
Descenso de gradiente para regresión lineal
Algunas generalidades sobre la regularización en machine learning
El cálculo en Sympy
Tensores: todo lo que necesitas saber
Operaciones con tensores: división y producto tensor
Autovalores y autovectores (Eigenvalores || Eigenvectores)
Autovalores y autovectores con Python
Autovalores y autovectores en ML
Comprimir datos con autovalores y autovectores
Singular value decomposition (SVD)
SVD demo: compresión de imágenes
Algunas tareas en NLP
Texto y habla en NLP
Preprocesado de texto para NLP en Python
Técnicas de normalización para NLP
Las vocales con acento en Python
Eliminar puntuación y acento en Python
Conversión de números a texto y stopwords en Python
Lematización en Python
Pipeline de preprocesamiento en NLP
¿Cómo funciona spaCy de Python?
Normalización de texto con spaCy
PoS tagging con spaCy
Reconocimiento de entidades nombradas (NER)
Lematización en spaCy
Similitud de palabras en NLP
Tokenización con NLTK
Algunas características de NLTK: stopwords, stemmas y lematización
Pipeline con NLTK
Spelling corrector en NLP
Ejercicio sobre spelling corrector en NLP
¿Qué son los algoritmos de matching?
Ejemplo de algoritmos de matching
Estructura de datos DAWG
Jellyfish y la distancia entre textos
Visualización de datos en NLP
Visualización de datos: dispersión léxica y wordcloud
¿Qué es Google Ngram Viewer?
¿Qué es la Ley de Zipf?
¿Cómo implementar un modelo NER?
Qué se necesita para entrenar un modelo NER
Entrenamiento de un modelo NER
Transiciones entre etiquetas en NLP: probabilidad y estados
Formas de representar un texto en NLP
¿Qué es el count vectorizer?
Algunas funciones del count vectorizer: stopwords y max features
N-grams como features en count vectorizer
max_df y min_df con count vectorizer
¿Qué es el TF-IDF Vectorizer?
Ejercicio de detección de spam con Python (Parte 1)
Ejercicio de detección de spam con Python (Parte 2)
Análisis de sentimientos en NLP (Parte 1)
Ejercicio de análisis de sentimientos en NLP (Parte 2)
Entrenamiento de ejercicio de análisis de sentimientos
¿Qué es el modelo LDA?
¿Qué es el topic modeling?
Ejercicio de topic modeling: preprocesado
Entrenar un modelo LDA por medio de un ejercicio de topic modeling
Obtener el número óptimo de topics en un topic modeling
Diferentes operaciones con topic modeling
Ejercicio de aplicación con Word2Vec
¿Qué son las OOV Words o palabras fuera del vocabulario?
Doc2Vec: ejercicio [Parte 1]
Algunas generalidades sobre los Word Embeddings
Deep learning en NLP: las redes neuronales

Big Data

Otros roadmaps

IMPULSA TU CARRERA A TU MEDIDA