Ejemplo de similitud de coseno

| Última modificación: 19 de abril de 2024 | Tiempo de Lectura: 2 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

En este artículo veremos un ejemplo de similitud de coseno. Para calcular la similitud de coseno debemos tener presente la siguiente ecuación:

En ella, tenemos el producto escalar dividido por el módulo de los vectores.

Veamos, pues, un ejemplo de similitud de coseno.

Similitud de coseno

Tenemos una imagen estática:

Ejemplo de similitud de coseno

La imagen estática la podemos considerar como si fuera una matriz.

En la matriz, cada píxel es un valor. Entonces, esta imagen se puede extrapolar, es decir, se puede escribir de forma matricial:

De modo que si nuestra imagen tiene 256×256 píxeles, la matriz que elaboremos tendrá 256 filas x 256 columnas, donde cada componente va a tener el valor del píxel. Un píxel nos da un valor, dependiendo del color que tenga, y ese valor va a ser el mismo que el del espacio que ocupe en la matriz.

Ejemplo de similitud de coseno

Para este ejemplo de similitud de coseno supongamos que tenemos dos imágenes.

Imagen 1: tenemos una matriz que tiene:

[236 2 32 56

20 72 31 8] píxeles por píxeles

Imagen 2: tenemos otra matriz con valores distintos:

[52 2 20 25

72 241 23 7] píxeles por píxeles

Estas imágenes las podemos convertir en vectores de la siguiente forma, por medio de un ejercicio o ejemplo de similitud de coseno:

En la primera fila tenemos [236 2 32 56], que concatenamos inmediatamente a la segunda fila [20 72 31 8], con lo cual quedaría [236 2 32 56 20 72 31 8], y así sucesivamente, si tuviéramos más filas las concatenaríamos de manera seguida para formar un vector.

El vector resultante tendría 256 x 256: R256 x 256. En el primer caso, es decir, en el caso de la matriz, ese 256×256 se está refiriendo al número de filas y columnas, respectivamente. En el segundo caso, ese número hace referencia o, más bien, se traduce como una multiplicación, porque estamos concatenando uno tras otro.

Con la segunda imagen hacemos exactamente lo mismo que con la anterior, por lo que nos quedaría: [52 2 20 25 72 241 23 7].

Tendríamos dos vectores con la misma cantidad de componentes y esto nos permitiría calcular la similitud entre las dos imágenes.

Entonces, esto nos permite ver un ejemplo de similitud de coseno en donde transformamos de matriz a vector.

Este modo de transformación de las imágenes se utiliza mucho en redes convolucionales, concatenándose los píxeles de una imagen tras otra.

¿Quieres seguir aprendiendo?

Como podemos observar, este tipo de temáticas son muy usadas en el campo del machine learning. Ahora que hemos visto cómo funciona la similitud de coseno, podemos seguir aprendiendo sobre Big Data, una de las disciplinas más demandadas de la actualidad y mejor pagadas. Para ello, tenemos el Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, una formación intensiva e íntegra en la que podrás adquirir todos los conocimientos teóricos y prácticos necesarios para incursionar en el mercado laboral de manera rápida y eficiente. ¡Anímate a seguir cambiando tu futuro y entra ahora para solicitar más información!

Sandra Navarro

Business Intelligence & Big Data Advisor & Coordinadora del Bootcamp en Data Science, Big Data & Machine Learning.

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado