¿Sabías que existen diferentes tasas de interés en estadística y machine learning? En este post te contaremos cómo funcionan algunas tasas de interés en estadística.
Si contamos el sentido de los errores en un problema de clasificación binaria, tenemos cuatro posibilidades:
- True Positive (TP)
- True Negative (TN)
- False Positive (FP)
- False Negative (FN)
Tasas de interés en estadística: explicación
Existen 4 posibilidades en el problema de clasificación binaria. Ahora, expliquémoslo mejor con una imagen:
Tenemos una clasificación binaria para los datos, divididos en azul (equivalente a 0) y rojo (equivalente a 1). Cada una de las flechas representa una posibilidad (hay cuatro posibilidades en total). La flecha roja representa los valores true positive, es decir, los valores en rojo (1).
Existe en el medio, como parte de los valores rojos, una parte sombreada, señalada con la primera flecha negra. Estos valores son azules, pero están en la clasificación errónea, es decir, en el lado rojo; por tanto, son catalogados como false positive, porque hemos dicho que son positivos, pero no lo son. Estos son datos que han sufrido un solapamiento, por lo que están mal clasificados.
El pico del lado izquierdo, que corresponde a la segunda flecha negra, sufre el mismo solapamiento que el caso anterior, solo que aquí se catalogan como el inverso, es decir, como false negative, porque parece que son negativos, pero en realidad no lo son.
Los valores señalados con la flecha azul son catalogados como true negative, dado que efectivamente son azules.
Representación de tasas de interés en estadística
Las tasas de interés en estadística normalmente se representan con una matriz de confusión:
A partir de estas métricas de tasas de interés en estadística se pueden definir otras métricas:
Compromiso entre métricas
Hay un compromiso entre las métricas de las tasas de interés en estadística (no se puede tener todo).
Si umbral ⇒, entonces TP↓, TN↑, FP,↓ FN↑
- SEN↓, ESP↑, PP↑
¿Qué sigue?
Para que cumplas tus sueños y sigas aprendiendo sobre el mundo tecnológico, que ofrece excelentes oportunidades para desarrolladores y aspirantes a data scientist, tenemos para ti el Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp. En esta formación intensiva adquirirás todos los conocimientos teóricos y prácticos para que sigas tu camino hacia el éxito. ¡No esperes más para obtener lo que quieres y solicita información ahora!