Existen muchos libros sobre data mining que pueden ayudar al lector en esta disciplina y enseñarle conceptos de estadística y, por tanto, de data mining. En este artículo te mostraremos, entre todas las opciones que encontrarás, 2 libros sobre data mining que debes conocer si te interesa este mundo.
An introduction to Statitical Learning
El libro An introduction to Statitical Learning with Applications in R, escrito por Gareth James, Daniela Witten, Trevor Hastie y Rob Tibshirani, fue ganador del premio Erick Ziegel 2014 de Technometrics.
Tiene 2 ediciones
Primera edición (24 de junio de 2013)
Esta primera edición incluye temas como:
- Métodos dispersos para clasificación y regresión.
- Árboles de decisión.
- Boosting.
- Máquinas de vectores de soporte.
- Clustering.
Segunda edición (2021)
Esta edición añade temas como:
- Deep learning.
- Análisis de supervivencia.
- Pruebas múltiples.
- Clasificador Naive Bayes y modelos lineales generalizados.
- Árboles de regresión aditivos bayesianos.
- Llenado de matrices.
Está entre los libros sobre data mining más leídos.
Este libro permite obtener un determinado conocimiento sobre estadística, data mining, deep learning y machine learning. Asimismo, busca guiar al lector en el desarrollo de diferentes técnicas de minería de datos y aprendizaje automático.
El libro tiene 12 temáticas que abordan los diferentes autores, que son:
- Aprendizaje estadístico (statistical learning).
- Regresión linear (linear regression).
- Clasificación (classification).
- Métodos de resampling (resampling methods).
- Selección y regularización del modelo linear.
- Más allá de la linealidad (moving beyond linearity).
- Métodos basados en árboles (tree-Based Methods).
- Máquinas de vectores de soporte (support vector machines).
- Aprendizaje profundo (deep learning).
- Análisis de supervivencia y datos censurados (Survival Analysis and Censored Data).
- Aprendizaje no supervisado (unsupervised learning).
- Pruebas múltiples (multiple testing).
Pattern Recognition and Machine Learning
El libro Pattern Recognition and Machine Learning, escrito por Christopher M. Bishop, fue publicado en 2006 por Springer y es uno de los libros sobre data mining más conocidos.
El objetivo del presente libro es mostrar los desarrollos recientes de los métodos bayesianos, mientras proporciona una introducción completa a los campos del reconocimiento de patrones y el aprendizaje automático.
Con el apoyo de conferencias, diapositivas y figuras, se procura instruir al lector respecto a un tema jamás escrito en libros: el reconocimiento de patrones desde el punto de vista bayesiano. Todo esto se hace por medio de algoritmos de inferencia aproximada que dan respuestas rápidas aproximadas en situaciones donde no se pueden dar respuestas exactas.
El libro aborda 13 títulos:
- Distribuciones de probabilidad (probability distributions).
- Modelos lineales de regresión (linear models for regression).
- Modelos lineales de clasificación (linear models for classification).
- Redes neuronales (neural networks).
- Métodos de Kernel (Kernel methods).
- Máquinas de vectores de soporte (sparse kernel machines).
- Modelos gráficos (graphical models).
- Modelos de mezcla y algoritmo esperanza-maximización (mixture models and EM).
- Inferencia aproximada (approximate inference).
- Métodos de muestreo (sampling methods).
- Variables latentes (continuous latent variables).
- Datos secuenciales (sequential data).
- Combinando modelos (combining models).
Ambos libros sobre data mining son bastante completos y ofrecen mucha información que nos interesa, aunque, si solo quieres elegir uno de ellos, te recomendamos el primer libro, ya que tiene la ventaja de poseer explicaciones en lenguaje R de algunas temáticas que se abordan y ejercicios de aplicación en R.
R es un lenguaje que se utiliza mucho en Big Data, ya que permite crear visualizaciones muy didácticas de los datos. Además, tiene un entorno flexible y de fácil manejo, ya que no consiste tanto en programar, sino en hacer uso interactivo del lenguaje para las ejecuciones estadísticas que necesitemos.
¿Quieres seguir aprendiendo?
Si bien estos libros sobre data mining te pueden ayudar a entender un poco más sobre la minería de datos y el Big Data en general, necesitarás ahondar más en el tema si lo que quieres es convertirte en un profesional del sector. Para eso tenemos nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp a tu disposición, con el que te podrás instuir en pocos meses de manera tanto teórica como práctica para incursionar rápidamente en el mundo laboral. ¡Anímate a solicitar más información y cambia tu vida!