¿Qué relación guardan el concepto de rango de una matriz y el machine learning?
Recordemos que el rango de una matriz es la cantidad de información única (es decir, no repetida) que tiene nuestra matriz.
Al principio puede ser confuso entender cómo el rango de una matriz y el machine learning o cualquier disciplina relacionada, como el Big Data y la inteligencia artificial, pueden tener algo en común. No obstante, en este post veremos que no es tan descabellado o tan extraño como parece.
Relación entre el rango de una matriz y el machine learning
Dictionary learning
En machine learning existen unos algoritmos que se llaman dictionary learning. Dentro de este conjunto hay muchísimos tipos, entre ellos el PCA (Principal component analysis o Análisis de componentes principales, donde reducimos la dimensionalidad de un vector), el k-means o el SVD (Singular Valid Decomposition). Dentro de los dictionary learning también hay unos algoritmos denominados NMF, que quiere decir non negative matrix factorization.
Lo único que queremos aprender con los algoritmos que están dentro de este conjunto, que son los dictionary learning y nos muestran cómo es que el rango de una matriz y el machine learning tienen algo que ver, es construir una matriz que nos permita construir la matriz original.
Si entramos en detalle, estos algoritmos tienen una forma como la siguiente:
(A – DR) = 0
Esta es la forma general para los algoritmos de todo el conjunto del dictionary learning. Para cada uno de los algoritmos dentro del algoritmo principal, la fórmula cambia.
La matriz A correspondería a nuestros datos. Las matrices D y R representarían lo que queremos aprender. Entonces, lo que buscamos es reconstruir la matriz A a partir de las matrices D y R.
La fórmula general corresponde a la loss function, donde queremos que la matriz original (A) al restarle la multiplicación de las dos matrices (DR) sea igual a 0.
Todo esto quiere decir que si nosotros tenemos una matriz A, que son nuestros datos, y le restamos el conjunto DR (o simplemente R), que es lo que vamos a calcular con nuestro modelo, lo que queremos es la reconstrucción de la matriz A. Esto se logra si el resultado de estas operaciones es cero o, al menos, se acerca a este resultado. Este producto 0 significaría que las matrices son tan parecidas a los datos originales que este sería el resultado que debería dar.
Non Negative Matrix Factorization
Lo importante aquí para entender qué tienen que ver el rango de una matriz y el machine learning es que en este conjunto de algoritmos del dictionary learning hay un algoritmo específico: el de los Non negative matrix factorization, donde se le exige en la función de pérdida al modelo que el rango sea lo menor posible.
Lo que intentamos aquí es reconstruir la matriz original, los datos originales, pero lo que verdaderamente nos interesa es que este procedimiento se haga con la mínima cantidad de información posible.
Así pues, para entender cómo funciona el rango de una matriz y el machine learning, tenemos esta pequeña construcción en donde se añade una constraint, es decir, restringimos la optimización de un problema con base en el rango de una matriz.
Cada algoritmo dentro del dictionary learning tiene ciertas aplicaciones. Por ejemplo, el PCA nos ayuda a reducir la dimensionalidad de los vectores. El NMF nos permite, si tenemos una imagen con ruido, reconstruir la imagen y quitar el ruido para poder obtener una imagen nítida. El SVD sirve para algo parecido, pero además nos permite revisar, por ejemplo, los sistemas de recomendaciones.
Ahora que hemos visto cuál es la relación existente entre el rango de una matriz y el machine learning, puedes seguir aprendiendo sobre Big Data. Si quieres acceder a una de las disciplinas más demandadas y mejor pagadas del mundo laboral, no te pierdas el Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, una formación intensiva e íntegra en la que adquirirás, en menos de un año, todos los conocimientos teóricos y prácticos que te ayudarán a lograr el trabajo de tus sueños. ¡Entra ya para solicitar información y anímate a transformar tu vida!