Pseudoinversa Moore-Penrose

| Última modificación: 24 de julio de 2024 | Tiempo de Lectura: 2 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

¿Sabes en qué consiste la pseudoinversa Moore-Penrose? En este artículo te lo contamos.

Pseudoinversa Moore-Penrose: contextualización

Supongamos que tenemos un modelo de regresión lineal simple que convertimos en una matriz. ¿Qué ocurre si la matriz que queremos invertir no es cuadrada? El sistema de ecuaciones no tendría una única solución o, simplemente, no tendría solución.

Tenemos la siguiente función de regresión lineal simple:

función

Esta función la expandimos del siguiente modo:

expansión de la función

Donde:

  • yi: i-ésimo valor de la variable dependiente.
  • xi: i-ésimo valor de la variable independiente.
  • B0.B1: parámetros a determinar que un dato conjunto de xi produce los mejores yi.
  • B0: puede llamarse sesgo, bias, intercept o término constante. Indica el corte en el eje Y.
  • B1: puede llamarse pendiente o slope. Indica cuánto aumenta Y por cada incremento de X.
  • Ei: error, valor aleatorio.

La matriz quedaría así:

matriz de la función

Lo que se puede simplificar como:

simplificación de la matriz

Donde:

explicación de la matriz

Podemos usar la matriz inversa para resolver ecuaciones:

matriz inversa

O podemos usar la pseudoinversa Moore-Penrose para minimizar el error cuadrático medio.

Para números reales se define como:

pseudoinversa de Moore-Penrose

El problema original consistía en querer calcular ẞ de tal forma que se minimice la influencia de E:

En nuestro sistema es desconocido, pero sabemos que tiene una media de cero y varianza finita. Así que simplificamos el siguiente sistema de ecuaciones:

sistema de ecuaciones

Ahora, tenemos a partir de X e Y una estimación. Podemos, a partir de valores conocidos de X, calcular una estimación de Y.

Evidentemente:

estimación de y

Llamaremos residuo (error) a la diferencia entre el valor real y el valor estimado.

El método anterior garantiza que el error cuadrático medio sea mínimo:

error cuadrático

Es decir, nuestra tarea consiste en minimizar la función MSE para que nuestro modelo Y sea óptimo. La función MSE es convexa y cuadrática.

La pseudoinversa Moore-Penrose sirve para minimizar el error cuadrático medio. Al final, para explicarlo y para entender cómo funciona, existe un gran inconveniente: los programas no funcionan con pseudoinversa, funcionan minimizando el error cuadrático medio.

El resultado es el mismo, pero calcular la pseudoinversa es difícil y puede darte unos valores altos, incluso infinitos.

No obstante, es importante aprender sobre todos los modos de proceder respecto a la resolución de problemas relacionados con el Big Data. Por eso, te invitamos a unirte a nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, en el que abordaremos todas las temáticas necesarias para que, en poco tiempo, puedas destacar en el mercado laboral. ¡Te esperamos!

Sandra Navarro

Business Intelligence & Big Data Advisor & Coordinadora del Bootcamp en Data Science, Big Data & Machine Learning.

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado