¿Sabes cuáles son los principios del aprendizaje en machine learning? Un principio es el punto de que parte, nace o surge algo.
Así pues, los principios del aprendizaje y, específicamente, los principios del aprendizaje en machine learning son una serie de fundamentos teóricos a tener en cuenta en el momento en el que decidas empezar en este ámbito. A continuación, veremos cuáles son.
Principios del aprendizaje en machine learning
Navaja de Ockham
Uno de los principios del aprendizaje en machine learning es el de la Navaja de Ockham, también conocido como Principio de economía o Principio de parsimonia, atribuido a un fraile franciscano seguidor de la escolástica conocido como Guillermo de Ockham.
Este principio dicta que, en igualdad de condiciones, la explicación más simple es la correcta. Esto, trasladado a nuestro campo, quedaría así: el modelo más simple es el más plausible.
Las frases originales propuestas por Ockham y que aparecen en algunos de sus libros son:
- Pluralitas non est ponenda sine neccesitate (la pluralidad no se impone sin necesidad).
- Frustra fit per plura quod potest fieri per pauciora (la frustración hace con más lo que se puede hacer con menos).
Este se convierte en uno de los principios del aprendizaje en machine learning, porque nos ayuda a entender que no es necesario complicar los primeros modelos con los que vayamos a entrenar.
Es decir, no tiene que ser una regresión lineal, tampoco tiene que ser una cosa muy simple que se convierta en surrealista, pero podemos probar con algo en un término intermedio, como un árbol de decisión, un random forest básico. En definitiva, algo que podamos entender fácilmente y que nos permita más adelante recrear modelos más complejos, como redes neuronales.
Sesgo en la población
El sesgo en la población es uno de los principios del aprendizaje en machine learning que dice que, si tenemos un sesgo en nuestros datos, el aprendizaje también estará sesgado.
Veamos un ejemplo simple de este principio. Una entrevistadora le pregunta a una mujer que acaba de salir de un concurso de perros, que está paseando un perro y tiene un buzo de perro, si le gustan más los perros o los gatos. Es bastante evidente la respuesta, ¿no? La persona va a preferir los perros.
No hay ningún problema, pero si esa entrevistadora saca todo su espacio muestral (es decir, todos sus registros) de ese mismo lugar, los datos van a estar claramente sesgados hacia uno de la dos opciones de respuesta; en este caso, son los perros.
Otro ejemplo podría ser preguntar por la intención de voto a personas que se encuentran en determinado sector hiperpolitizado.
En conclusión, este se encuentra entre los principios del aprendizaje en machine learning más importantes porque nos muestra cuán frágil puede ser nuestro modelo si no tomamos decisiones inteligente ni los conjuntos de datos necesarios y óptimos para los algoritmos de machine learning.
Si tenemos un espacio muestral sesgado, no sirve de nada explorar los datos etiquetados, hacer el mejor tratamiento de datos y aplicarle el mejor modelo, porque al final el resultado que vamos a obtener no va a ser el esperado, ya que los datos no son representativos.
Hacemos énfasis en este punto porque es uno de los principios del aprendizaje en machine learning primordiales. Si no tenemos un sesgo claro, este inmediatamente se detecta. En este caso, la única opción es parar la etapa en la que sea que vayamos y conseguir un nuevo conjunto de datos, porque va a ser imposible seguir con un conjunto de datos sesgado.
Manipulación en el conjunto de datos de test
Entre los principios del aprendizaje en machine learning, este es muy importante, ya que cada tipo de conjunto de datos puede manejar diferentes técnicas.
Por ejemplo, si hacemos normalización de variables o un escalado, estos procesos se hacen mirando train, no mirando ambas (que serían train y test). Lo mismo pasa con la selección de características, que se hace mirando train, no mirando todo el conjunto de datos.
Como has podido comprobar, existen muchísimos aspectos a tener en el machine learning. Si sientes curiosidad hacia este tema y quieres seguir aprendiendo, tenemos para ti el Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, una formación intensiva en la que podrás adquirir todas las herramientas y conocimientos teóricos y prácticos para incursionar en un mundo lleno de oportunidades. ¡Atrévete a dar el paso que cambiará tu futuro y solicita ahora más información!