¿Sabías que el Big Data es clave en las empresas? Y para entender todos los conceptos que abarca este campo, te presentamos este roadmap de contenido especializado y técnico sobre Big Data, IA & Machine Learning, en el que vas a encontrar una variedad de tutoriales y guías que te van a ayudar a dominar esta área tecnológica.
Desde los fundamentos de la ciencia de datos, hasta poner en práctica el Machine Learning, te daremos toda la información que necesitas para que seas un experto en la materia.
¡Acompáñanos en esta aventura digital!
Big Data
- 3 fundamentos del Big Data para iniciarte
- ¿Qué es Data Warehouse?
- Arquitectura Big Data: un primer acercamiento
- Deep Learning con Tensorflow: (5 ventajas)
- ¿Qué es Data Modeling & Design?
- ¿Cuál es la diferencia entre Big Data y Business Intelligence?
- ¿Cuáles son los beneficios del Big Data?
- ¿Cuál es la influencia del Big Data en el mundo multimedia?
- ¿Qué es la pirámide del conocimiento del Big Data?
- 5 ejemplos de empresas que usan Big Data
- ¿Qué es Data Management y cómo funciona?
- Las 11 disciplinas del Data Management que debes conocer
- ¿Qué es el Data Governance?
- Relación entre Data Governance y Data Quality
- ¿Qué es Data security? [5 recomendaciones para implementarlo]
- ¿Qué es el índice de popularidad en LinkedIn?
- ¿Para qué sirven las máquinas virtuales en Big data?
- ¿Quién puede estudiar analítica de datos?
- ¿Qué son los canales en Slack?
- Chinchetas y marcadores en Slack
- ¿Cuál es el ciclo de vida del dato?
- Validación de información en analítica de datos
- ¿Cuál fue la empresa más beneficiada con el covid-19?
- ¿Cuál es el valor de la huella digital en Big Data?
- Fantasmas digitales: ¿existe alguien que no genere datos?
- ¿Qué es y cómo funciona el DIKW?
- Aprendizaje supervisado y no supervisado en analítica de datos
- ¿Cómo funciona la pirámide de la información en Big data?
- ¿Cuál es el papel que juega la estrategia en el análisis de datos?
- Roadmap de la analítica de datos
- ¿Qué es la omnicanalidad en Big data y cómo funciona?
- Clasificar y depurar información en Big Data
- Los 5 niveles de información en Big Data
- Bases de datos SQL y NoSQL: características
- ¿Qué son los master data?
- ¿Qué son los metadatos?
- Principios del data quality en la estrategia de negocio
- ¿Cómo funciona un normalizador de datos?
- Diferencia entre BI y Big Data
- 3 elementos de las bases de datos relacionales
- 4 principios de los sistemas de información
- Sistemas operacionales vs. informacionales
- DataWarehouse vs. Data Mart: ¿cuál es mejor?
- Modelos estrella y copo de nieve
- ¿Cuál es la arquitectura de un Data Warehouse?
- Datificación: ¿cuántos tipos de datos existen?
- Enfoque multidisciplinar en Machine Learning: 3 variables
- Los 3 lenguajes de los data scientists
- 4 casos de uso en Big Data
- 4 casos de éxito en Big Data
- ¿Qué son las redes semánticas?
- Transformación digital y Big Data
- IoT en Big Data: usos y aplicaciones
- Black mirror y el Big Data: ¿cómo de lejos estamos?
- Llaves primarias y foráneas de las BBDD relacionales
- ¿Qué es OLAP?
- ¿Que es la granularidad del datos?
- Casos de uso en Big Data: user experience y customer analytics
- Casos de uso en Big Data: business analytics y RRHH analytics
- Preocupaciones más comunes sobre la protección de datos
- Vigilancia de los datos: más allá del reglamento de protección
- Pros y contras de las regulaciones que vigilan los datos
- Mapa de protección de datos en la Unión Europea
- 3 casos de sanciones por protección de datos antes del RGPD
- Casos de sanciones por el RGPD
- Reglamentos LOPD vs. RGPD: sanciones
- Línea temporal del GDPR: ¿cómo ha cambiado?
- Un recorrido por el GDPR: ¿qué contiene?
- Función del Data Protection Officer en las empresas
- ¿Qué medidas tomar para proteger los datos en las empresas?
- Privacidad desde el diseño en el RGPD: ¿cómo hacerlo?
- ¿Qué es el reglamento de protección de datos no personales?
- Impacto del RGPD en el acceso a los sistemas de las empresas
- Impacto del RGPD en el consentimiento de los sistemas en las empresas
- La carga de los datos en las empresas y el impacto del RGPD
- El RGPD y su impacto en el almacenamiento de datos en las empresas
- Tratamiento de los datos en las empresas y el impacto del RGPD
- ¿En qué consiste el derecho de portabilidad de los datos?
- ¿Qué son las quiebras de seguridad?
- Buenas prácticas para PD Big Data: guía de la AEPD
- 5 iniciativas de la ley de protección de datos
- ¿Qué es la exploración y visualización de datos? (3 herramientas)
- Top 3 de herramientas para exploración y visualización de Datos
- ¿Cómo funciona una arquitectura para el análisis de datos?
- Diferencias entre Tableu y PowerBI
- ¿Qué es Looker? La solución de Google para Big Data
- 5 ventajas de Tableau para visualizar datos
- ¿Qué es Tableau y cómo funciona?
- Tableau Online vs Tableau Server: ¿cuál es la diferencia?
- ¿Para qué sirve Tableau Reader?
- ¿Cómo es la arquitectura de Tableau?
- Guía Tableau para iniciarte
- ¿Cómo importar datos en Tableau?
- ¿Cómo ordenar datos en Tableau?
- ¿Cómo usar filtros en Tableau?
- ¿Qué es Tableau Server y cómo funciona?
- ¿Qué son los conjuntos de datos en Tableau?
- 5 pasos para crear conjuntos de datos en Tableau
- ¿Cómo usar las paletas de color en Tableau?
- ¿Cómo funciona la división de datos por fecha en Tableau?
- ¿Qué es el Mapeo geográfico de datos en Tableau?
- ¿Cuáles son los tipos de datos especiales en Tableau?
- 5 pasos para usar el Mapeo geográfico de Tableau
- ¿Para qué sirve el Panel de análisis en Tableau?
- Guía para usar el panel de datos en Tableau
- ¿Cómo crear parámetros en Tableau?
- ¿Cómo funciona la personalización de datos en Tableau?
- ¿Cómo añadir una Línea de Tendencia en Tableau?
- ¿Para qué sirven los Clústeres en Tableau?
- ¿Qué son los campos calculados en Tableau?
- ¿Qué son los cálculos de tablas rápidas en Tableau?
- ¿Para qué sirve el Panel de Dashboard en Tableau?
- 5 acciones de Dashboard en Tableau
- Visualización de relación entre valores numéricos en Tableau
- Ventajas y desventajas del mezclado de conexiones en Tableau
- ¿Cómo combinar datos en Tableau?
- 9 características de la relación entre valores numéricos en Tableau
- Requisitos de las relaciones Join y Blend en Tableau
- ¿Cómo funcionan los gráficos de dispersión en Tableau?
- ¿Cómo funciona el desglose de datos en Tableau?
- ¿Cómo visualizar distribuciones en Tableau?
- Componentes del Análisis Visual en Tableau
- 7 ventajas del análisis visual en Tableau
- ¿Cómo insertar formas en el análisis visual de Tableau?
- 7 recomendaciones para realizar gráficos en Tableau
- ¿Cómo usar los colores en la visualización de datos en Tableau?
- Glosario de Tableau: 7 conceptos fundamentales
- 9 cosas que debe saber hacer un Big Data Architect
- ¿Qué es una Arquitectura de Software?
- ¿Cuáles son los tipos de arquitectura Big Data?
- Diferencias entre sistemas distribuidos y monolíticos
- Tipos de formatos de datos en Big Data
- ¿Qué son los datos estructurados?
- JSON API: ¿qué es y para qué sirve?
- 5 diferencias entre los datos estructurados y no estructurados
- ¿Qué es Scrapy?
- ¿Cómo es la arquitectura de Scrapy?
- Scraping vs Crawling: ¿cuál es la diferencia?
- Scraping con Python requests
- Ventajas y desventajas de Scrapy
- Glosario Scrapy: 7 conceptos clave
- JSON-LD: ¿qué es y para qué sirve?
- Herramientas de Big Data en la nube
- ¿Cuáles son los proveedores de servicios Cloud más usados?
- 6 conceptos clave en arquitecturas Cloud
- Soluciones Cloud en Google para Big Data
- ¿Qué es Google Cloud SQL?
- ¿Qué es Google Cloud Datastore?
- ¿Cómo insertar datos en bases de datos Cloud?
- ¿Cómo usar Cloud SQL Marketplace?
- ¿Cómo funciona MongoDB?
- Historia del origen de las bases de datos
- ¿Qué es una base de datos?
- ¿Qué es el teorema CAP?
- Diferencia entre base de datos SQL vs NoSQL
- ¿Cuál es la diferencia entre PostgreSQL y MongoDB?
- Query en bases de datos SQL y NoSQL
- Insertar datos en Postgres y MongoDB
- Relacionar datos nuevos en Postgres y MongoDB
- ¿Qué es PostgreSQL?
- ¿Qué es Elastic Search?
- Diferencias entre Elastic Search y Solr
- Arquitectura de Elastic Search
- Analyzers en Elastic Search
- ¿Cómo subir datos a ElasticSearch?
- Uso y ejemplos de ElasticSearch
- ¿Qué son las Queries de ElasticSearch?
- ¿Cuáles son los tipos de búsqueda en ElasticSearch?
- ¿Para qué sirven los Indexes y maps en ElasticSearch?
- ¿Cómo modificar tipos de Indexes en ElasticSearch?
- Manejo de documentos en ElasticSearch
- Agregación y Queries complejas en ElasticSearch
- ¿Cómo funciona Kibana en ElasticSearch?
- Glosario de ElasticSearch: 5 conceptos clave
- ¿Qué son Data Lakes?
- Principales características de Data Lakes
- Requisitos para trabajar con Metadatos
- ¿Cómo funciona el diseño de Data Lake?
- Glosario Data Lakes: 5 conceptos base
- ¿Qué es Analítica como Servicio (DAaaS)?
- ¿Por qué usar Hadoop?
- 4 elementos principales de Hadoop
- Hadoop desde cero
- ¿Qué significa POSIX?
- ¿Qué es HDFS?
- ¿Qué es YARN?
- ¿Qué es Scheduling (Governance)?
- ¿Qué son las colas de YARN?
- Configurar colas de procesamiento en Hadoop
- ¿Qué es Hadoop Common?
- ¿Qué es MapReduce en Hadoop?
- Cómo funcionan los ficheros de configuración en Hadoop
- ¿Cuáles son los tipos de directorios en Hadoop?
- ¿Qué es el directorio sbin?
- ¿Qué es el directorio bin?
- ¿Qué es el directorio share?
- ¿Qué es el directorio etc?
- ¿Qué es el terminal por container Master?
- ¿Qué es el terminal por container Slave?
- ¿Cómo se usa Scale en Hadoop?
- ¿Cómo se crea un nuevo Datanode en Hadoop?
- ¿Qué son los Firewalls en Hadoop?
- ¿Qué es Virtual Private Cloud?
- ¿Qué es subnet en arquitectura Cloud?
- ¿Cómo montar un clúster de Hadoop en la nube?
- ¿Qué es Docker?
- ¿Cómo funcionan los jobs en Dataproc?
- ¿Cómo ejecutar jobs sin comandos a mano en Dataproc?
- ¿Qué es Hive?
- ¿Qué es JDBC (Java Database Connectivity)?
- ¿Qué es ODBC (Open Database Connectivity)?
- ¿Qué es Apache Thrift?
- ¿Qué es Beeline en Hive?
- Queries simples de Hive
- Extracciones hacia segmentos de Google Storage en Hive
- ¿Cómo configurar un Hive?
- Hacer queries en DataProc con GCloud, Python y Hive
- Elastic Hadoop Connector: ¿qué es y para qué sirve?
- ¿Cómo hacer cambios en cluster de Hadoop?
- Glosario Hadoop: 7 conceptos clave
- ¿Qué es apache Kafka?
- ¿Qué es PubSub?
- Ejemplo de Kafka en GCP con Flume
- ¿Qué es Apache Flume?
- ¿Cómo entrar al clúster de Dataproc con Shell?
- Personalizar el cluster de Dataproc al arranque
- Google Cloud Storage para crear, leer, descargar ficheros
- ¿Cómo funciona el diseño del DAaaS?
- ¿Qué es GCP (Google Cloud Plataform)?
- ¿Qué es ETL (extraer, transformar, cargar)?
- ¿Para qué se utiliza ETL?
- ¿Cómo funciona la Fase de Extracción de ETL?
- ¿Cómo funciona la Fase de Transformación de ETL?
- ¿Cómo funciona la Fase de Carga de ETL?
- ¿Qué es la estrategia proyecto ETL?
- ¿Cuáles son las herramientas ETL?
- ¿Cómo es la arquitectura Centro de Información?
- ¿Qué es Talend Open Studio?
- Interfaz de Usuario de Talend Open Studio
- ¿Cuáles son los menús de Talend Open Studio?
- Control de versiones de Talend Open Studio
- ¿Qué es el Business Model en Big Data?
- ¿Cómo es el esquema de Talend Open Studio?
- ¿Cómo hacer una Query en Talend Open Studio?
- Crear Jobs en Talend Open Studio
- Configurar vista de edición en Talend Open Studio
- Flujos de datos en Talend Open Studio
- ¿Cómo organizar jobs en Talend Open Studio?
- Variables en Talend Open Studio
- Generador de flujos de datos en Talend Open Studio
- Glosario de Talend Open Studio: 7 conceptos primordiales
- Data Quality: ¿qué es y cómo funciona?
- ¿Qué son los Filewatchers?
- ¿Cómo funciona la gestión masiva de ficheros?
- ¿Cómo construir DataWarehouse?
- ¿Qué es un ODS (Operational Data Store) en Big Data?
- ¿Cómo es el diseño de ODS y DW?
- ¿Cuáles son los componentes de un DataWarehouse?
- ¿Qué son las dimensiones SDC?
- Tipos de dimensiones de Data Warehouse
- ¿Qué es la dimensión tipo 0 Data Warehouse?
- ¿Qué es la dimensión tipo 1 Data Warehouse?
- ¿Qué es la dimensión tipo 2 en Data Warehouse?
- 3 Tipos de Carga en Integración de Datos
- ¿Cómo funciona el Control de Cambios (CDC) en Data Warehouse?
- Tips de carga en Base de datos de Data Warehouse
- ¿Qué es la Carga Incremental en Data Warehouse?
- ¿Qué es Pushdown en Data Warehouse?
- Glosario ETL: 7 conceptos clave
- Glosario de Data Warehouse: 7 conceptos fundamentales
- ¿Qué es el Big Data Processing?
- ¿Qué es SBT (Simple Build Tool) en Scala?
- ¿Qué es REPL (Read-eval-print-loop)?
- Fundamentos y conceptos básicos de Scala
- val vs var en Scala
- 4 tipos de métodos en Scala
- ¿Qué es Class en Scala?
- ¿Qué es clase abstracta en Scala?
- ¿Qué es Trait en Scala?
- 5 expresiones lógicas de Scala
- ¿Qué es Pattern Matching en Scala?
- ¿Qué es Standard Library en Scala?
- Guía de map & flatMap en Scala
- ¿Qué son Futures en Scala?
- Glosario Scala: 7 fundamentos clave
- ¿Qué es Apache Spark?
- ¿Cómo es la arquitectura de Apache Spark?
- ¿Qué es Clúster Manager en Spark?
- Driver en Apache Spark
- ¿Qué es SparkContext?
- ¿Qué es Worker Node en Spark?
- ¿Qué son los Executors en Spark?
- 6 fundamentos de Spark Stack
- ¿Qué es Spark Structured Streaming?
- ¿Cómo funciona Spark Core?
- ¿Qué es Spark Shell en Apache Spark?
- ¿Qué es RDD (Resilient Distributed Datasets)?
- Glosario Apache Spark: 8 conceptos clave
- ¿Cuáles son las Transformaciones y Acciones en Spark?
- ¿Qué es Spark GraphX en Apache Spark?
- ¿Qué es Spark MLlib en Apache Spark?
- ¿Cómo funciona Windows en Spark Structured Streaming?
- ¿Cómo funciona Joins en Spark Structured Streaming?
- ¿Cómo funciona Deduplication en Spark Structured Streaming?
- ¿Qué es Spark SQL en Apache Spark?
- ¿Qué es Apache Parquet?
- ¿Qué es Apache Avro?
- ¿Qué es JDBC Connection en Apache Spark?
- Glosario Apache Hive: 5 conceptos fundamentales
- 7 librerías de diseño visual para Big Data
- ¿Qué es Data-Driven Documents?
- ¿Qué es NVD3.js?
- Estructura de una gráfica: 5 conceptos clave
- SVG vs Bitmap
- Tipos de elementos gráficos en D3
- 5 tipos de etiquetas en D3
- Funciones de obtención de datos en D3
- Tratamientos de datos en D3
- ¿Qué es Data binding?
- ¿Cuál es la función de Escala en D3?
- Márgenes y grupos en D3
- ¿Cómo funcionan los ejes en D3?
- Animaciones e Interactividad en D3
- ¿Por qué utilizar Data-Driven Documents (D3)?
- ¿Cómo funciona la etiqueta SVG en D3?
- ¿Cómo trastear con los márgenes en D3?
- ¿Cómo definir las etiquetas en D3?
- Glosario D3.js: 7 conceptos clave
- ¿Cómo crear un botón que añada círculos aleatorios en D3?
- ¿Para qué sirve Console.log() en D3?
- Convertir los datos en enteros en D3
- Convertir los datos en fechas en D3
- ¿Cómo crear DIVs y etiquetas en D3?
- ¿Qué son los eventos en D3?
- ¿Qué son las transiciones en D3?
- ¿Qué es una gráfica de globos en D3?
- ¿Qué es Data Call en D3?
- ¿Cómo definir las funciones en D3?
- 5 tipos de gráficos en D3
- ¿Cómo generar interacción con el usuario en D3?
- ¿Cómo es la estructura del directorio de D3?
- ¿Qué es el index.html en D3?
- ¿Qué es el sistema de coordenadas en D3?
- ¿Cómo es la curva de aprendizaje para D3?
- ¿Qué es Math.random() en D3?
- ¿Cómo aplicar la función enter en D3?
- ¿Cómo aplicar la función exit en D3?
- Ejemplo práctico update y exit en D3
- Tutorial de escala lineal en D3
- ¿Qué es el evento onmouseover en D3?
- ¿Qué es el evento onmouserout en D3?
- ¿Qué es el evento click en D3?
- ¿Qué es tooltip en D3?
- ¿Qué es el dominio de escala en D3?
- ¿Qué es el rango de escala en D3?
- ¿Qué es el patrón de actualización en D3?
- ¿Cómo se declara la proyección en D3?
- ¿Qué es la función que dibuja el mapa en D3?
- ¿Cómo funciona la estadística en el Big Data?
- Estadística vs Machine Learning
- Introducción a R
- ¿Cuáles son las operaciones en R?
- ¿Qué son las funciones básicas en R?
- Asignaciones y operaciones en R
- ¿Qué son las asignaciones en R?
- ¿Qué es el tipo de datos integer?
- ¿Qué es el tipo de datos double?
- Diferencias entre integer y double
- ¿Qué es un estimador en estadística Big Data?
- ¿Qué son las distribuciones en estadística Big Data?
- 2 tipos de variables en estadística Big Data
- Cadenas de texto en estadística Big Data
- ¿Cuáles son los tipos de media en R?
- ¿Cuáles son los tipos de distribuciones en estadística?
- Análisis de dataset Iris en estadística Big Data
- ¿Qué es muestreo en estadística Big Data?
- ¿Cuáles son los gráficos en estadística Big Data?
- ¿Cuáles son las relaciones entre variables en estadística Big Data?
- ¿Qué son los tests estadísticos para el manejo Big Data?
- 4 tipos de tests estadísticos para Big Data
- 4 tipos de estimadores estadísticos en Big Data
- 3 tipos de muestreo estadístico para Big Data
- ¿Qué es la distribución discreta en estadística Big Data?
- ¿Qué es dataset con variables categóricas en R?
- ¿Qué es Dataset Frame en R?
- ¿Qué es sesgo en estadística Big Data?
- ¿Qué es la paradoja de Simpson en estadística Big Data?
- ¿Qué es la varianza en estadística Big Data?
- Glosario de R: 7 conceptos clave
- Glosario de estadística Big Data: 5 fundamentos
- ¿Cuáles son los tipos de sesgo en estadística Big Data?
- Ejemplo del sesgo del superviviente en estadística Big Data
- ¿Qué es la estimación en estadística Big Data?
- ¿Qué es el margen de error estadística Big Data?
- Intervalos de confianza en estadística Big Data
- ¿Qué son los vectores en estadística Big Data?
- ¿Qué son las matrices en estadística Big Data?
- ¿Cómo funcionan las tablas en estadística Big Data?
- Valores no disponibles en estadística Big Data
- ¿Qué es histograma en estadística Big Data?
- Función de densidad de probabilidad en estadística
- Función de distribución acumulativa en estadística
- Gráfico Q-Q en estadística Big Data
- Distribución beta en estadística Big Data
- ¿Qué es correlación en estadística Big Data?
- Ejemplo varianza acciones en estadística Big Data
- Desigualdad de Chebyshev en estadística Big Data
- Cuantiles en estadística Big Data
- Comprobación teorema centrál del límite en R
- Datos de strava en estadística Big Data
- 3 ejemplos de probabilidad en estadística Big Data
- ¿Qué es moda en estadística Big Data?
- Listas en estadística Big Data
- ¿Cómo funcionan las fechas en R?
- Función arrays 3D en estadística Big Data
- Valores infinitos y NaN (Not a Number) en estadística
- ¿Qué son los valores NULL en estadística?
- Ejemplo estadístico de test de embarazo
- Distribución exponencial en estadística Big Data
- ¿Qué es la función Q(z) en estadística Big Data?
- Unidad tipificada (Z-score) en estadística Big Data
- Distribución chi-cuadrado en estadística Big Data
- Regresión lineal en estadística Big Data
- Definición de inversa de una matriz
- Distribución uniforme en estadística Big Data
- Distribución gaussiana en estadística Big Data
- Distribución de Poisson en estadística Big Data
- Distribución binominal en estadística Big Data
- Distribución Bernoulli en estadística Big Data
- Ejemplo estadístico del CSV de la edad española
- Ejemplo de covarianza para finanzas
- ¿Qué es el sobreajuste en estadística Big Data?
- Estimación de funciones polinómicas en estadística
- Ejemplo estadístico evolución de población española
- Fiabilidad de los coeficientes en estadística
- Coeficiente de determinación R² en estadística
- Ejemplo estadístico de la producción de cereales por hectárea
- Regresión lineal múltiple en estadística Big Data
- Ejemplo estadístico del peso de los niños al nacer
- Clasificación estadística de Regresión logística
- Dataset Anscombe en estadística Big Data
- Distribución conjunta en estadística Big Data
- Teorema de Bayes en estadística Big Data
- Ejemplo árboles bayesianos en estadística
- Análisis Causal y contrafactual en estadística
- El problema de Monty Hall en estadística
- Análisis estadístico de dos variables dependientes
- Análisis estadístico de dos variables discretas
- Ejemplo estadístico de censo
- ¿Qué es el Deep Learning?
- Contexto histórico del Deep Learning
- Tipos de aprendizaje del Deep Learning
- Definición de tensores en Deep Learning
- Ejemplo carga de dataset externo en Deep Learning
- ¿Para qué sirve TensorFlow?
- Sesiones iterativas y grafos en TensorFlow
- Descenso de gradiente en TensorFlow
- Ejemplo de regresión lineal
- Ejemplo de Tensor 1D en TensorFlow
- Crear una tf.Operation en TensorFlow
- Ejemplo de problemas de optimización en TensorFlow
- Ejemplo de regresión logística en TensorFlow
- Función softmax en TensorFlow
- ¿Qué es una red neuronal en Deep Learning?
- Principales funcionalidades de las redes neuronales
- Entrenamiento de una red neuronal en Deep Learning
- Forward y back propagation en Deep Learning
- Backward pass en Deep Learning
- Ejemplo de una neurona en Deep Learning
- Descenso de gradiente en una red neuronal de TensorFlow
- ¿Qué es la entropía cruzada en Deep Learning?
- Ejemplo: capas ocultas de las neuronas en Deep Learning
- Ejemplo de una red neuronal profunda en TensorFlow
- La división de datos en Deep Learning
- Teoría de optimización en Deep Learning
- ¿Qué es Stochastic Gradient Descent en Deep Learning?
- ¿Qué es Mini-batch Stochastic Gradient Descent?
- Optimización de hiperparámetros en Deep Learning
- Learning rate en Deep Learning
- Decay al Learning rate en Deep Learning
- ¿Qué es el batch size en Deep Learning?
- Ejemplo de redes profundas en Deep Learning
- Ejercicio de redes neuronales profundas
- Ejemplo de redes neuronales en Deep Learning
- Relación de learning rate y batch size
- ¿Qué es una función de pérdidas en Deep Learning?
- ¿Qué es una función de activación en Deep Learning?
- Glosario Deep Learning: 7 conceptos clave
- Ejemplo de una función de activación en Deep Learning
- Inicialización de los pesos y bias en Deep Learning
- Función de pérdida vs función de activación
- 3 funciones de activación en Deep Learning
- Neurona Maxout en Deep Learning
- Tipos de inicialización de pesos en Deep Learning
- Distribución normal y uniforme de inicialización de pesos
- ¿Qué es Keras en Deep Learning?
- ¿Cómo generar la arquitectura de modelo en Deep Learning?
- Ejemplo de Redes Neuronales Convolucionales
- ¿Qué es la convolución?
- Ejemplo de Kernel en Deep Learning
- Convolución horizontal y vertical de strides
- ¿Cómo la convolución detecta un patrón?
- Arquitectura típica de una red neuronal convolucional
- Feature extractor y classifier de red neuronal convolucional
- Tipos de capas de red neuronal convolucional
- Capas de Pooling en una red neuronal convolucional
- Locally-connected Layers de red convolucional
- Preprocesamiento de imágenes de entrada
- Normalizar los datos en Deep Learning
- Efecto modificación de capas en Deep Learning
- ¿Qué es overfitting en Deep Learning?
- ¿Qué es Batch-Normalization para red convolucional?
- Glosario de TensorFlow: 5 conceptos clave
- ¿Qué es la regularización en red convolucional?
- Regularización L2 en red neuronal convolucional
- Regularización L1 en red neuronal convolucional
- Regularización por restricción en red convolucional
- Regularización por Dropout en red convolucional
- ¿Qué es transfer learning y fine-tuning?
- Data augmentation en red convolucional
- Visualización de activaciones y filtros en red convolucional
- Ejemplo de clasificación de imágenes con Keras
- Tipos de arquitecturas de redes convolucionales
- Ejemplo de visualización de filtros
- Arquitectura VGG16 y VGG19 en Deep Learning
- Ejemplo de visualización de activaciones de capas
- Modificación del número de capas congeladas en DL
- Glosario de Keras: 5 conceptos fundamentales
- ¿Qué es una base de datos no relacional?
- ¿Qué es una base de datos relacional?
- ¿Qué son los motores de bases de datos? [6 motores]
- ¿Qué es MySQL?
- ¿Cómo crear una BBDD en Virtual Box?
- Llaves primarias y foráneas de las BBDD relacionales
- ¿Qué son las formas normales de una base de datos?
- Los 4 tipos de datos de BBDD
- Ejercicio práctico en SQL con los Simpson: premisas y elementos
- Pasos para crear una tabla en VirtualBox con SQL: Los Simpson
- Cómo controlar la alteración de tablas con MySQL [4 comandos]
- 4 campos relevantes en bases de datos
- Cómo poblar con registros una tabla en MySQL
- Tablas del ejercicio práctico en SQL
- ¿Cómo definir una foreign key?
- 6 comandos SQL para ejercicio práctico
- Cómo localizar registros duplicados con MySql
- Cómo localizar valores nulos con MySql
- ¿Qué son las formas normales de cuarto a sexto nivel?
- Cómo poblar una tabla de profesiones en ejercicio práctico
- Cómo poblar tabla de mascotas en ejercicio práctico
- Cómo poblar tabla de lugares en ejercicio práctico
- ¿Para qué se utilizan los comandos union y union all?
- ¿Qué es un JOIN y sus tipos?
- Cómo poblar tabla de frases en ejercicio práctico
- ¿Cómo ver la estructura de una tabla creada con ALIAS en MySQL?
- En qué consisten RIGHT OUTER JOIN e IFNULL en MySQL
- Diferencias entre INNER JOIN y LEFT OUTER JOIN
- ¿Qué es la normalización de una tabla?
- Diferencias entre RIGHT OUTER JOIN y LEFT OUTER JOIN
- Otra solución a INTERSECT en MySQL
- 3 funciones para string en SQL: minus, mayus y longitud
- 4 funciones numéricas en SQL: SQRT, POW, SIGN Y ABS
- 3 funciones de fecha y hora en SQL: current, date, date_format
- Otras funciones en SQL: BIN, CASE, COALESCE
- ¿Qué es una vista en MySQL?
- ¿Qué es minus en MySQL?
- Funciones repeat y reverse para string en SQL
- Funciones locate y concat para string en SQL
- Funciones LPAD y RPAD para string en SQL
- Funciones SUBSTR e INSTR para string en SQL
- Funciones SUBSTR y SUBSTRING para string en SQL
- Conoce diferentes posibilidades del date_format
- Funciones STRCMP y ASCII para string en SQL
- Funciones FIELD Y FIND IN SET para string en SQL
- Funciones numéricas de agrupaciones SQL
- Funciones de encriptación en SQL
- Funciones TRIM y RTRIM para string en SQL
- Funciones CONV e IF en SQL
- Funciones ROUND y TRUNCATE en SQL
- Funciones FLOOR y RAND en SQL
- Funciones exponenciales Y logaritmicas en SQL
- Otras funciones numéricas en SQL: RADIANS, DEGRESS Y PI
- Diferencias entre la función CEILING y FLOOR
- Funciones GREATEST y LEAST en SQL
- Otras funciones para obtener fechas y tiempo en SQL
- Funciones TO y FROM para fechas en SQL
- ¿Cómo ejecutar un hola mundo en SQL?
- Funciones trigonométricas en SQL
- Funciones SIN y COS en SQL
- Funciones con intervals para fecha y hora en SQL
- Función extract para fecha y hora en SQL
- Funciones MAKEDATE y DATEDIFF en SQL
- Funciones ADDDATE y SUBDATE en SQL
- Cabecera de una función en MySQL
- Cuerpo y resultado de una función en MySQL
- Ejercicio prácitco: función comparar números en MySQL
- Ejercicio prácitco: función cuenta adelante en MySQL
- Ejercicio práctico: función cuenta atrás en MySQL
- ¿Qué son los triggers en MySQL?
- ¿Qué son los cursores en MySQL?
- Los elementos de la interfaz de MySQL Workbench
- Procedimientos de funciones en SQL
- ¿Qué es la gestión de datos?
- Glosario de Data Management: 5 conceptos base
- ¿Qué es DAMA en data management?
- ¿Cuáles son los principios del data governance?
- Partes implicadas en la organización del data governance
- 4 fases en el proceso del data governance
- 3 herramientas para data governance
- Elementos de los datos y datos críticos
- Gestión de metadatos dentro de los EDC
- ¿Qué son los metadatos de negocio?
- Roles en Metadatos management
- ¿Qué son los metadatos técnicos?
- Qué es el ciclo de vida del desarrollo del sistema
- Herramientas tecnológicas para gestionar metadatos
- Modelo lógico de datos: conexión con el usuario de la BD
- ¿Qué es Oracle Data Modeler?
- ¿Qué es el derecho de acceso a los datos?
- ¿Qué son los stakeholders?
- Crear una entidad en un modelo lógico de datos
- Crear un dominio en un modelo lógico de datos
- Asociar un dominio de datos a un diseño lógico
- Generar modelo relacional desde un data modeler
- ¿Qué es un modelo entidad-relación?
- Crear un glosario en Data Modeler
- Crear un modelo físico de datos
- Crear modelo físico de una base de datos heredada
- ¿Qué es un modelo de datos físicos?
- ¿Qué es la ingeniería inversa de una BBDD?
- Modelo ER de una base de datos PostgreSQL
- Niveles de abstracción de una base de datos
- Diferencias entre modelos de bases de datos: modelo lógico, físico y relacional
- ¿Qué es Oracle SQL Developer?
- ¿Qué es una base de datos orientada a objetos?
- ¿Qué es la analítica predictiva?
- Aspectos puntuales en la ingeniería inversa de una base de datos
- Cambiar tipos de datos de base de datos PostgreSQL trasladada a Oracle
- Definir arquitectura de origen y destino en Talend Data Integration
- Ingeniería inversa de conexiones origen y destino en Talend
- Crear un job en Talend Open Studio
- Llenar el área de trabajo del Job Design
- ¿En qué consiste la integración de datos?
- Crear un destino de carga en Talend Open Studio sin un modelo físico construido
- Crear un repositorio de conexión en ODI
- ¿Cómo funciona ODI Studio?
- Crear arquitectura física de origen en ODI
- Crear arqutiectura física de destino en ODI
- Cómo definir una arquitectura lógica en ODI
- Cómo unir arquitectura física y lógica en ODI
- Crear una estructura o modelo en ODI
- Crear una asignación en ODI
- Crear un destino de carga en ODI sin una tabla
- ¿Qué es Pentaho Data Integration?
- ¿Qué son los diagramas de flujo de datos?
- ¿Qué son los knowledge modules?
- Crear un modelo sin tabla en ODI
- ¿Qué es Trifacta?
- Crear un flujo en Trifacta
- Importar y agregar Datasets en Trifacta
- Añadir recipes en Trifacta
- Barras de calidad e histogramas en Trifacta
- Depurar información en Trifacta
- Dividir palabras de un mismo campo en Trifacta
- Aplicar configuración de un recipe en Trifacta a otro recipe
- Visualizar los resultados de un recipe en Trifacta
- Añadir un Dataset en Talend
- Organizar y depurar información en Talend
- Aplicar proceso de estandarización en Talend
- Corregir errores atípicos en Talend
- Crear una columna en Talend desde otra columna ya creada
- Estandarizar el campo de email en Talend
- Segmentar un campo con Talend
- Fusión por lookup en Talend
- Ofuscación en Talend
- Exportar una fuente limpia en Talend
- 2 libros sobre data mining que tienes que conocer
- Aprendizaje máquina, estadística y minería de datos: diferencias
- El aforismo «todos los modelos son erróneos» en estadística
- Aprendizaje supervisado en data mining
- Aprendizaje no supervisado en data mining
- ¿Qué es la optimización en data mining?
- Criterios de convergencia en data mining
- Mínimos en data mining: mínimo local y global
- Método de descenso de gradientes
- ¿Qué es una derivada?
- Método de Newton
- Calcular el gradiente y la matriz Hessiana en R
- Funciones para optimización en R
- Grid search en Python
- ¿Qué son los multiplicadores de Lagrange?
- Ejemplo de cartera de fondo de inversión en R
- ¿Qué son los quants?
- Pseudoinversa Moore-Penrose
- ¿Qué es el histograma de residuos en R?
- ¿Qué es una generalización estadística?
- Calcular producción de energía neta con R
- ¿Qué es la distancia de Cook?
- Ejercicio de aplicación: predecir dureza del hormigón con R
- ¿Qué son las variables categóricas?
- Codificación de variables categóricas
- ¿Qué son los contrastes en R?
- Dividir los datos en train y testing
- Lenguajes de programación más usados en quant trading
- Regresión lineal con t-student y ANOVA
- Reordenar factores en R
- ¿Qué es la regresión cuantílica?
- Ejercicio práctico de regresión lineal con t-student y ANOVA
- Efectividad de una dieta: ejercicio de aplicación en R
- ¿Qué es el preprocesado en R?
- Ejercicio de preprocesado en R: el dogma central de la biología molecular
- Ejercicio de preprocesado en R aplicando regresión lineal
- Estandarizar datos de preprocesamiento en R
- ¿Qué es model drift en machine learning?
- ¿Qué es la transformación de variables en R?
- Ejercicio práctico de transformación de variables con R
- Valores no disponibles en R
- Outliers en R
- Regularización en R y ejemplo
- Regularización Lasso en R y ejemplo
- Cross validation en R
- Regularización ridge en R
- Ejercicio de regularización en R para predecir la dureza del hormigón
- ¿Qué es el overfitting?
- ¿Qué es la regresión logística?
- ¿Qué es la razón de momios u odds ratio?
- Matriz de confusión en R
- Medidas de calidad en matrices de confusión
- ¿Qué es la curva ROC?
- ¿Qué es el criterio de información Akaike AIC?
- ¿Qué ocurre cuando hay errores que no siguen una distribución normal en estadística?
- Estimadores de máxima verosimilitud
- ¿Qué es una función de enlace o link function?
- Función de enlace Probit
- Interpretabilidad de modelos en machine learning
- 3 podcast sobre data mining que debes escuchar
- Ejemplo de distribución exponencial en R
- Predicción de covid con big data: ¿cómo funcionó en los primeros meses?
- Test A/B con GLM
- Ejercicio con regresión de Poisson
- ¿Qué es el clustering o agrupamiento en machine learning?
- Métodos de clustering
- Medir de calidad de un clúster
- Ejemplo de clustering con dataset Iris
- Ejercicio práctico de clustering con proteínas
- Medidas de calidad con Average Silhouette Width (ASW)
- ¿Qué son los algoritmos jerárquicos?
- ¿Qué es el Hierarchical DBSCAN (HDBSCAN)?
- Ejercicio de aplicación de clustering con los tipos de aceite
- Clustering con ejemplo de expresión genética de la levadura
- ¿Qué es el biclustering en biología y Big Data?
- ¿Qué es el cluster por densidad?
- Ejemplo de cluster por densidad con la clasificación de estrellas
- Ejercicio de cluster por densidad con dataset Iris
- ¿Qué son los modelos de caja negra?
- ¿Qué es PCA en estadística?
- ¿Cómo calcular un PCA en R?
- Calcular PCA con predict en R
- Aplicar PCA a dataset Iris
- Aplicar PCA a dataset de proteínas
- Ejemplo de regresión logística con PCA
- Desarrollo de algoritmo Eigenfaces: primera etapa
- Desarrollo de algoritmo Eigenfaces: segunda etapa
- Aplicar PCA al reconocimiento facial
- Transformar una imagen en el dominio PC
- ¿Cómo obtener una matriz original sin perder información?
- ¿Qué son los autovectores y cuál es su importancia?
- Clasificación usando PCA
- Reconocimiento facial con kNN
- Reconocimiento facial con regresión logística
- Explicación de ejercicio de reconocimiento facial
- Regularización de algoritmo de reconocimiento facial
- ¿Qué es el análisis discriminante lineal (LDA)?
- ¿Cómo obtener un AUC más alto separando las curvas de densidad?
- Análisis comparativo entre LDA y GLM por medio de un ejercicio de regresión logística
- LDA para clases múltiples
- Ejemplo de LDA para clases múltiples
- Comparación entre LDA y PCA
- El perceptrón y el origen de las redes neuronales
- El libro «Perceptrons» y la revolución de las redes neuronales
- Recesión de la inteligencia artificial
- El backpropagation y la solución a los problemas del perceptrón multicapa
- Origen del Deep learning y el renacimieto de las redes neuronales
- ¿Qué ocurre en regresión logística cuando tenemos dos variables correlacionadas estrechamente?
- Ejemplo de clasificación estadística usando un dataset de asteroides
- ¿Cómo interceptar un problema de clasificación estadística desde el principio?
- El cartpole y el aprendizaje por refuerzo de una IA
- Ejercicio con un algoritmo de Machine Learning: definir qué es un gato
- ¿Cómo se refleja el machine learning en el día a día?
- El algoritmo DL que derrotó a los mejores jugadores de Starcraft II
- Tipos de machine learning
- Fórmula matemática del aprendizaje supervisado
- Glosario de 4 términos relacionados con el machine learning
- Algoritmos paramétricos vs. no paramétricos
- ¿Cómo funciona el algoritmo de vecinos más próximos o K-NN?
- 3 páginas en las que puedes descargar datasets
- ¿Clasificación o regresión en Python? [Ejercicio práctico]
- ¿Cómo medir las prestaciones de un clasificador?
- Librería Pandas: aspectos más importantes
- Entrenar un modelo K-NN
- Explicación de la gráfica de complejidad de un modelo frente a la precisión
- Limitaciones de la división train y test
- Solución al problema de la división train y test
- Entrenamiento y test en la evaluación de un modelo
- ¿Para qué sirve el train_test_split?
- ¿Qué es la estratificación en machine learning?
- Representar las prestaciones del algoritmo K-NN en train y test para distintos valores de n_neighbors
- ¿Cómo escoger el valor óptimo de n_neighbors?
- ¿Qué es GridSearchCV?
- ¿Qué es NumPy y cómo funciona?
- ¿Qué es Matplotlib y cómo funciona?
- ¿Qué es un array en Python y cómo crear uno?
- ¿Cómo funcionan las clases y objetos en Python?
- Algunas funcionalidades de la librería pandas
- ¿Cómo elegir el algoritmo adecuado en ML?
- ¿Qué es el compromiso sesgo-varianza?
- Ejemplo de compromiso sesgo-varianza
- ¿Por qué es necesario aplicar validación cruzada en un ejercicio de sesgo-varianza?
- Representar el MSE para distintos niveles de complejidad de un algoritmo de regresión lineal
- Principios del aprendizaje en machine learning
- Ciclo de vida de un proyecto en machine learning
- Regresión lineal en problemas de overfitting
- Regularización Ridge en problemas de overfitting
- Regularización Lasso en problemas de overfitting
- Regularización sobre algoritmos de regresión
- Regularización sobre regresión Ridge
- Entrenar un modelo Ridge para distintos valores de a
- Entrenar un modelo Lasso para distintos valores de a
- Regularización sobre algoritmos de clasificación
- Algoritmo de regresión logística variando el valor de C
- Calcular el valor óptimo de C en un algoritmo de clasificación
- Qué es la selección de características en machine learning
- Métodos de filtrado para selección de características en machine learning
- Análisis exploratorio básico de BD sobre estimación del precio de una vivienda
- Ejercicio de cargar datos con dataset sobre estimación del precio de una vivienda
- Ejercicio de análisis exploratorio con dataset sobre estimación del precio de una vivienda
- Visualizar outliers con variables categóricas
- ¿Qué es la colinealidad y cómo corregirla?
- Métodos de filtrado para regresión
- Métodos de filtrado para clasificación linealmente separable
- Métodos de filtrado para clasificación no linealmente separable
- Métodos de filtrado en machine learning sobre problema realista
- Todo lo que necesitas saber sobre los métodos wrapper
- Ejercicio con métodos wrapper
- Métodos embebidos en machine learning
- ¿Qué es la intuición artificial en machine learning?
- Construcción de un árbol de decisión
- Árboles de decisión sobre series temporales
- Ejemplo de árboles de decisión
- Árboles de clasificación sobre ejemplo realista
- Árboles de regresión
- Remuestreo bootstrap y bagging
- ¿Qué es random forest?
- np-where y LabelEncoder: convertir una variable booleana en numérica
- ¿Cómo hacer una transformación de variables?
- Entrenar un árbol de decisión individual
- Ejemplo de bagging y random forest
- Importancia de las variables en los algoritmos basados en árboles
- Ejemplo de regresión con árbol de decisión y random forest
- Ejemplo de bagging
- Boosted trees y la revolución del Machine learnig
- Ejemplo de boosted trees con clasificación
- Construir el conjunto de test de un boosted tree
- Árbol de decisión de un conjunto de test
- Ejercicio de boosted trees
- ¿Qué son las SVM o Support Vector Machines?
- Caso linealmente no separable de SVM
- SVR o SVM en regresión
- Ejemplos sintéticos de SVM en problemas de clasificación
- ¿Cómo funciona el k-nn en regresión?
- Importancia de los Kernels para los SVM
- 2 características de los boosted trees: hiperparámetros e interpretabilidad
- Representar la importancia de las variables en un ejercicio de boosted trees
- Operaciones sobre kernels
- Ejemplo realista de SVM en problemas de clasificación
- Ejercicio de RFE sobre validación cruzada
- Ejemplo realista en regresión
- ¿Qué es el Kernel Ridge Regression?
- ¿Qué es el Kernel PCA?
- Métricas en clasificación: algunas generalidades
- Métricas en clasificación: tasas de interés en estadística
- Métrica en clasificación de la curva ROC
- ¿Qué son los problemas desbalanceados en ML?
- Calcular el ratio de desbalanceo de un problema
- Ejercicio de preprocesamiento de variables
- Representar un mapa de correlación entre variables
- Calcular distintas métricas de clasificación a partir de una matriz de confusión
- Parámetro class_weight en regresión logística
- Clasificación multiclase de imágenes
- ¿Cuál es la relación entre álgebra lineal y Big Data?
- Tipos de variables en python
- Operadores aritméticos en Python
- Operaciones matemáticas con Python
- Listas en Python
- Representación gráfica de un conjunto en Python
- Cardinalidad y pertenencia de conjuntos en Python
- Determinación de un conjunto en Python
- Igualdad de dos conjuntos en Python
- Conjunto universal E en Python
- Ejercicios de conjuntos en Python
- Tuplas en Python
- Diccionarios en Python
- Funciones range y zip en Python
- Función Reversed en Python
- ¿Qué son los vectores?
- Esquema del problema de machine learning
- ¿Qué es la loss function?
- Explicación de la fórmula de loss function
- Optimización con ecuaciones polinómicas
- ¿Qué son las funciones convexas?
- El método más simple para calcular errores en un modelo de ML
- Tipos de vectores matemáticos
- ¿Qué es la dimensionalidad de vectores?
- Suma y resta de vectores (arrays)
- Representar un array visualmente
- Suma de un escalar a un array
- La lógica detrás de algunas operaciones con vectores
- Multiplicar un escalar por un vector
- Producto escalar o interno
- Fórmula matemática del producto escalar
- ¿Qué es la ortogonalidad de vectores?
- Similitud entre vectores o cosine similarity
- Ejercicio de similitud entre vectores
- Ejemplo de similitud de coseno
- Ejemplo del producto escalar en Python
- ¿Qué es la norma de un vector?
- Visualización de vectores con Python
- Ejercicio sobre el producto escalar
- Ejercicio sobre similitud entre vectores
- Ejercicio de similitud entre dos frases
- ¿Qué son los algoritmos word embedding?
- Ejercicio de similitud: calcular similitud entre frases
- ¿Qué es el producto vectorial?
- Atributos de los Numpy arrays
- Indexing y slicing en Python
- Reshaping y joining and splitting en Python
- Estructura de un espacio vectorial
- Combinaciones lineales entre vectores
- Visualización de una combinación lineal
- Dependencia lineal de vectores con sympy
- Dependencia lineal de vectores con solve de numpy
- Espacio nulo de una matriz
- Espacio fila y espacio columna en una matriz
- Graficación de vectores: eje de coordenadas
- Ejemplo de graficación de vectores
- Ejemplo de la ley de gravitación universal de Newton
- ¿Cómo generar imágenes usando Numpy?
- Figuras geométricas y fractales con Matplotlib
- Ejercicio sobre espacios vectoriales
- Ejemplo de word embedding
- Una variación de las word embeddings
- Cosine similarity en espacios vectoriales
- Crear gráficos con Matplotlib
- Ejemplos de fractales en Python
- ¿Qué es una matriz?
- Relación entre la transformación lineal y las matrices
- Ejemplo de matrices en la transformación lineal
- Tipos de matrices
- Definir matrices en Python
- Suma de matrices
- Multiplicación de matrices
- ¿Qué es una matriz traspuesta?
- Matriz inversa usando Gauss
- Rango de una matriz: qué es y cómo calcularlo
- Relación entre el rango de una matriz y el machine learning
- Rango de una matriz con Python
- Factorización LU (Lower-Upper)
- Cambio de base en espacios vectoriales
- ¿Qué es el determinante de una matriz?
- Calcular determinantes en Python
- ¿Qué es el menor complementario?
- ¿Qué es una matriz invertible?
- Sistemas de ecuaciónes y combinaciones lineales
- Sistemas de ecuaciones: todo lo que necesitas saber
- Ejercicio sobre sistemas de ecuaciones
- ¿Qué es el sistema compatible indeterminado?
- ¿Qué es el PageRank?
- Los perceptrones y las ecuaciones lineales
- Introducción a Numba for CUDA (en Python)
- Sistema de ecuaciones sin solución
- Ejemplo de sistemas de ecuaciones lineales
- El papel de la hipótesis en una función lineal
- Diferencias: underfitting vs overfitting
- Tiempo de espera y erupción actual en eje de coordenadas
- ¿Qué son los mínimos cuadrados?
- Mínimos cuadrados en forma matricial
- Ampliar una regresión lineal
- Un resumen sobre las regresiones
- ¿Qué es el gradient descent?
- El arg min en un gradiente descendente
- Fórmula matemática del descenso de gradiente
- ¿Qué es el learning rate en el descenso de gradiente?
- Descenso de gradiente para regresión lineal
- Algunas generalidades sobre la regularización en machine learning
- El cálculo en Sympy
- Tensores: todo lo que necesitas saber
- Operaciones con tensores: división y producto tensor
- Autovalores y autovectores (Eigenvalores || Eigenvectores)
- Autovalores y autovectores con Python
- Autovalores y autovectores en ML
- Comprimir datos con autovalores y autovectores
- Singular value decomposition (SVD)
- SVD demo: compresión de imágenes
- Algunas tareas en NLP
- Texto y habla en NLP
- Preprocesado de texto para NLP en Python
- Técnicas de normalización para NLP
- Las vocales con acento en Python
- Eliminar puntuación y acento en Python
- Conversión de números a texto y stopwords en Python
- Lematización en Python
- Pipeline de preprocesamiento en NLP
- ¿Cómo funciona spaCy de Python?
- Normalización de texto con spaCy
- PoS tagging con spaCy
- Reconocimiento de entidades nombradas (NER)
- Lematización en spaCy
- Similitud de palabras en NLP
- Tokenización con NLTK
- Algunas características de NLTK: stopwords, stemmas y lematización
- Pipeline con NLTK
- Spelling corrector en NLP
- Ejercicio sobre spelling corrector en NLP
- ¿Qué son los algoritmos de matching?
- Ejemplo de algoritmos de matching
- Estructura de datos DAWG
- Jellyfish y la distancia entre textos
- Visualización de datos en NLP
- Visualización de datos: dispersión léxica y wordcloud
- ¿Qué es Google Ngram Viewer?
- ¿Qué es la Ley de Zipf?
- ¿Cómo implementar un modelo NER?
- Qué se necesita para entrenar un modelo NER
- Entrenamiento de un modelo NER
- Transiciones entre etiquetas en NLP: probabilidad y estados
- Formas de representar un texto en NLP
- ¿Qué es el count vectorizer?
- Algunas funciones del count vectorizer: stopwords y max features
- N-grams como features en count vectorizer
- max_df y min_df con count vectorizer
- ¿Qué es el TF-IDF Vectorizer?
- Ejercicio de detección de spam con Python (Parte 1)
- Ejercicio de detección de spam con Python (Parte 2)
- Análisis de sentimientos en NLP (Parte 1)
- Ejercicio de análisis de sentimientos en NLP (Parte 2)
- Entrenamiento de ejercicio de análisis de sentimientos
- ¿Qué es el modelo LDA?
- ¿Qué es el topic modeling?
- Ejercicio de topic modeling: preprocesado
- Entrenar un modelo LDA por medio de un ejercicio de topic modeling
- Obtener el número óptimo de topics en un topic modeling
- Diferentes operaciones con topic modeling
- Ejercicio de aplicación con Word2Vec
- ¿Qué son las OOV Words o palabras fuera del vocabulario?
- Doc2Vec: ejercicio [Parte 1]
- Algunas generalidades sobre los Word Embeddings
- Deep learning en NLP: las redes neuronales