La loss function es una función que se utiliza para optimizar nuestros modelos de machine learning. Veamos en este artículo cómo funciona en los algoritmos de machine learning y en los problemas de clasificación.
Loss function
La loss function es un método increíblemente útil para evaluar lo bien que nuestro algoritmo modela su conjunto de datos. Si las predicciones que hacemos están erradas, nuestra loss function o función de pérdida generará un número más alto. Si son bastante buenas, la loss function generará un número más bajo. A medida que vamos modificando nuestro algoritmo, la loss function nos va indicando si vamos por un buen o por un mal camino.
La fórmula de la loss function es:
1 N
arg min —— ∑ (yi – h (xi))2
N L:1
Esta ecuación es la de mínimos cuadrados o least squeares. Es una ecuación muy usada en diferentes esferas. En ingeniería, por ejemplo, se emplea mucho en diseño 3D, para calcular las mayas o las superficies geométricas, entre otras muchas.
Entonces, la que acabamos de definir es una loss function. Aquí hay varios aspectos muy importantes que mencionar:
- En la ecuación tenemos una yi y una h (xi).
- Lo primero que hay que entender es que esta función la aplicamos, por ejemplo, cuando tenemos un conjunto de datos de la siguiente forma:
S = {(x1, y1), (x2, y2), (x3, y3), … (xi, yi)}
- Es básicamente la forma matemática que utilizamos para aprendizaje supervisado. Cuando nos referimos a aprendizaje supervisado, solo hacemos alusión a la parte en la que denotamos los datos, porque en un problema de aprendizaje supervisado lo que queremos es obtener algo así: y = f (x)
Expliquémoslo por partes: en machine leaarning tenemos dos tipos de aprendizaje, que son el aprendizaje supervisado o supervised learning y el aprendizaje no supervisado o unsupervised learning. La diferencia es que en uno usamos labels y en otro no. ¿Esto qué quiere decir? Pues que, por ejemplo, si tenemos dos categorías, como podrían ser coches y color, en coches ponemos Tesla y en color ponemos azul; luego ponemos Porsche/amarillo; etc.
coches | colores |
Tesla | azul |
Porsche | amarillo |
… | … |
Podemos predecir el color del coche usando estos datos. Los coches serían la x y el color la y. Lo que intentamos en aprendizaje supervisado es encontrar una función f (x) (f de x) que nos permita obtener y. Esto, matemáticamente, es un mapeo que realizamos de una función para obtener un valor resultante, que en este caso sería y.
No obstante, esto no es lo importante de este ejercicio. Lo relevante aquí es cómo hemos definido los datos de forma matemática. Lo que estamos diciendo es que tenemos un conjunto de datos que consta de pares de datos, donde tenemos:
coches | colores | |
Tesla | azul | x1, y1 |
Porsche | amarillo | x2, y2 |
… | … | xi, yi |
¿Qué tipos de loss function existen?
Existen diferentes tipos de loss function:
- El mean squared error (MSE) o error cuadrático medio.
- Función de pérdida de probabilidad o likelihood loss.
- Función de pérdida de registro, pérdida de entropía cruzada o log loss (cross entropy loss).
¿Quieres seguir aprendiendo sobre Big Data?
El Big Data es una de las áreas en las que más trabajos se ofertan. Si quieres ser uno de los afortunados que pueden acceder a este tipo de opciones laborales, tenemos para ti el Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, una formación intensiva en la que adquirirás todos los conocimientos teóricos y prácticos que te permitirán obtener el trabajo de tus sueños. Estarás acompañado de los mejores profesionales en todo tu proceso formativo para que puedas lograr las metas que te propongas. ¡No esperes más para seguir tu camino hacia el éxito y solicita información ahora!