Explicación de ejercicio de reconocimiento facial

Autor: | Última modificación: 16 de noviembre de 2022 | Tiempo de Lectura: 2 minutos
Temas en este post:

Algunos de nuestros reconocimientos:

Premios KeepCoding

En este post te explicaremos el ejercicio de reconocimiento facial con el algoritmo Eigenfaces, con el que ya hemos trabajado en otros artículos del blog, como puedes ver en el desarrollo del algoritmo Eigenfaces.

Tratamiento de imágenes

Lo que queríamos lograr con este ejercicio de reconocimiento facial era determinar, entre varias imágenes, si una o varias de ellas correspondían o no al rostro de George Bush.

En este ejercicio de reconocimiento facial teníamos n imágenes, 947 imágenes en entrenamiento de 250×250. Hemos convertido estas imágenes en una matriz de n tantas filas como imágenes y 62500 columnas. Esto significa que todos los píxeles los hemos estirado en una fila. A esta matriz le hemos dado el nombre de «es o no es George Bush».

A todo este procedimiento en el ejercicio de reconocimiento facial le hemos aplicado PCA, es decir, hemos generado una matriz de rotación PCA que tiene 62500 filas y 947 columnas. Luego, todos estos pasos previos han hecho posible la generación de una matriz transformada. De esta matriz, que originalmente tenía 947 columnas, hemos sacado un total de 150; el resto de las columnas las hemos eliminado, ya que sus autovalores eran de 0 a partir de 947.

La matriz de 150 columnas es la que le hemos metido en un modelo de regresión lineal binomial generalizado (GLM binomial). Aquí ya tenemos el modelo entrenado y tenemos dos cajas: GLM binomial y matriz de rotación PCA. Esas dos cajas son las que llevaremos a producción.

Entrenamiento

Detección/testing

Estamos en la fase de detección de nuestro ejercicio de reconocimiento facial.

Supongamos que la webcam detecta una nueva foto. ¿Qué sería lo primero que tendríamos que hacer? Pues antes de nada habría que centrarla. Luego, esa imagen que ingresa la convertimos en una fila de 62500 píxeles. Posteriormente, aplicamos la matriz de rotación que teníamos antes y con esto transformamos la imagen, que pasa de 62500 píxeles a 947. Aun así, siguen siendo demasiados píxeles, así que lo reducimos a 150.

Esos 150 píxeles se los pasamos a la regresión lineal binomial generalizada. La binomial será la que nos dará la predicción, es decir, si es o no el rostro de George Bush.

¿Qué sigue?

Ahora que hemos entendido mejor cómo funciona este ejercicio de reconocimiento facial, podemos pasar al siguiente nivel y aprender muchas otras cosas. Para ello, te recomendamos nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, una formación intensiva en la que adquirirás todos los conocimientos necesarios para incursionar rápidamente en el mercado laboral. ¡Anímate y solicita más información!

👉 Descubre más del Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp ¡Descarga el temario!

👉 Prueba el Bootcamp Gratis por una Semana ¡Empieza ahora mismo!

👉 Conoce nuestros otros Bootcamps en Programación y Tecnología

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado