La selección de características en machine learning es una funcionalidad que busca reducir el número de características basadas en filtros para obtener así subconjuntos de características.
Lo que hace el algoritmo de selección es crear métodos de selección que hacen la eliminación de una o más características dentro de un conjunto de datos.
Selección de características en machine learning
Existen diversas motivaciones para ejecutar un proceso de selección de características en machine learning. Entre ellas están:
Interpretabilidad
A menos variables de entrada, más fácil es explicar luego cómo afecta cada una de ellas en el resultado final. Esto se puede hacer de dos formas:
- Eliminando variables irrelevantes: si resulta que tenemos una variable que no nos está aportando nada de información, es mejor quitarla, así tenemos un modelo más simple en cierto sentido y no estamos perdiendo nada.
- Entendiendo mejor los datos.
Reducir costos computacionales del entrenamiento
Usar la selección de características en machine learning para reducir costos no debería ser un factor demasiado crítico. Si estuviéramos hablando de deep learning, este sí sería bastante relevante, pero en el caso del ML no.
Existen mejores soluciones a este problema que asumir una pérdida de información y un potencial empeoramiento de los resultados para reducir los costos del entrenamiento con la selección de características en machine learning.
No obstante y pese a todo esto, es cierto que la selección de características en machine learning reduce los costos computacionales; para ello lo que se hace es buscar una solución dispersa.
Evitar el sobreajuste u overfitting
Podríamos decir que es la más importante, si lo miramos a simple vista, pero en realidad no es así, ya que en el análisis exploratorio que se hace de los datos (en la selección de características en machine learning que se hace inicialmente) se suele enfocar la atención en la interpretabilidad.
Es decir, en los análisis previos se busca quitar las variables que no están aportando información. Ya después de eso, si resulta que entrenamos con esos datos restantes y estamos en overfitting, volvemos y hacemos una selección de características, pero mayor.
Ejemplo de selección de características en machine learning
Tenemos la siguiente imagen:
¿Cómo funciona el ejercicio que se evidencia en la imagen?
Se quería realizar un test para la detección temprana del autismo en niños. El test en cuestión era una variación del M-CHAT-R, un test estándar para este tipo de procedimientos, y lo que se buscaba con ello era automatizar el test usando un robot; es decir, el que iba a hacer el test era el robot, en vez de ser un terapeuta. El terapeuta iba a estar presente en la escena, pero solo como observador, sin intención de intervenir.
La interacción iba a ser con un robot, porque había estudios relacionados con el tema que decían que esa interacción podía ser beneficiosa para los niños por varias cuestiones. Entre ellas estaban su tamaño, porque era más amable, porque tenía luces y un sinfín de características que le daban una puntuación bastante positiva a la interacción entre niños y robots, en aras de buscar que los niños se sintieran más cómodos en este proceso.
La finalidad era automatizar el test. La cuestión era que habían preguntas que, debido a su naturaleza, no eran automatizables y el rango de sensores de movimiento que tenía el robot del que se disponía no era el óptimo para este tipo de intervenciones.
Lo que se hizo, entonces, fue evaluar la importancia de los parámetros con un dataset del test original para decidir, junto con el equipo de terapeutas, si se podía prescindir de algunas de las preguntas. El resultado no fue positivo, ya que no se pudieron eliminar algunas de esas preguntas sin alterar el resultado del test. Sin embargo, sí se observó que es posible evaluar el valor relativo de los parámetros (mostrados en el gráfico de barras) por medio de la selección de características en machine learning.
¿Qué sigue?
Si quieres seguir aprendiendo sobre una de las disciplinas mejor pagadas en la actualidad y con más oportunidades laborales, tenemos para ti el Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, una formación intensiva de 8 meses en la que podrás adquirir toda la fundamentación teórica y práctica en esta área. Podrás incursionar en uno de los mercados laborales más prolíficos que existen actualmente. ¡Anímate a impulsar tu carrera y solicita más información ahora!