Explicación de ejercicio de reconocimiento facial

| Última modificación: 31 de octubre de 2024 | Tiempo de Lectura: 2 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

En este post te explicaremos el ejercicio de reconocimiento facial con el algoritmo Eigenfaces, con el que ya hemos trabajado en otros artículos del blog, como puedes ver en el desarrollo del algoritmo Eigenfaces.

Tratamiento de imágenes

Lo que queríamos lograr con este ejercicio de reconocimiento facial era determinar, entre varias imágenes, si una o varias de ellas correspondían o no al rostro de George Bush.

En este ejercicio de reconocimiento facial teníamos n imágenes, 947 imágenes en entrenamiento de 250×250. Hemos convertido estas imágenes en una matriz de n tantas filas como imágenes y 62500 columnas. Esto significa que todos los píxeles los hemos estirado en una fila. A esta matriz le hemos dado el nombre de “es o no es George Bush”.

A todo este procedimiento en el ejercicio de reconocimiento facial le hemos aplicado PCA, es decir, hemos generado una matriz de rotación PCA que tiene 62500 filas y 947 columnas. Luego, todos estos pasos previos han hecho posible la generación de una matriz transformada. De esta matriz, que originalmente tenía 947 columnas, hemos sacado un total de 150; el resto de las columnas las hemos eliminado, ya que sus autovalores eran de 0 a partir de 947.

La matriz de 150 columnas es la que le hemos metido en un modelo de regresión lineal binomial generalizado (GLM binomial). Aquí ya tenemos el modelo entrenado y tenemos dos cajas: GLM binomial y matriz de rotación PCA. Esas dos cajas son las que llevaremos a producción.

Entrenamiento

Detección/testing

Estamos en la fase de detección de nuestro ejercicio de reconocimiento facial.

Supongamos que la webcam detecta una nueva foto. ¿Qué sería lo primero que tendríamos que hacer? Pues antes de nada habría que centrarla. Luego, esa imagen que ingresa la convertimos en una fila de 62500 píxeles. Posteriormente, aplicamos la matriz de rotación que teníamos antes y con esto transformamos la imagen, que pasa de 62500 píxeles a 947. Aun así, siguen siendo demasiados píxeles, así que lo reducimos a 150.

Esos 150 píxeles se los pasamos a la regresión lineal binomial generalizada. La binomial será la que nos dará la predicción, es decir, si es o no el rostro de George Bush.

¿Qué sigue?

Ahora que hemos entendido mejor cómo funciona este ejercicio de reconocimiento facial, podemos pasar al siguiente nivel y aprender muchas otras cosas. Para ello, te recomendamos nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, una formación intensiva en la que adquirirás todos los conocimientos necesarios para incursionar rápidamente en el mercado laboral. ¡Anímate y solicita más información!

Sandra Navarro

Business Intelligence & Big Data Advisor & Coordinadora del Bootcamp en Data Science, Big Data & Machine Learning.

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado