LDA para clases múltiples

Autor: | Última modificación: 18 de noviembre de 2022 | Tiempo de Lectura: 2 minutos

El LDA para clases múltiples es donde podemos sacarle verdadero partido al LDA, ya que para clasificar 2 clases es prácticamente igual a la regresión logística. Cuando tenemos múltiples clases, como en el ejemplo del conjunto de datos Iris, donde teníamos tres clases (versicolor, setosa y virgínica), la idea es la misma: encontrar un plano sobre el que proyectar. Para eso utilizaremos el análisis discriminante lineal o LDA para clases múltiples con sus respectivas funciones discriminantes.

¿Cómo funciona el LDA para clases múltiples?

Consideremos que tenemos dos clases (LDA para clases múltiples) y un vector sobre el que proyectaremos las dos clases, de forma que podamos resumir el valor de cada muestra en una sola dimensión.

LDA para clases múltiples

Donde:

  • X son los datos que queremos clasificar X E RNxp (X tiene N siglas y p columnas)
  • w es el vector de proyección, w E RpxI
  • y son los datos proyectados, y E RNxI

Lo que queremos es que los datos proyectados se separen al final entre todas las clases lo máximo posible.

Podemos generalizar a K clases el problema, suponiendo que y tiene más columnas, una por cada clase que queremos clasificar:

LDA para clases múltiples 1
  • wk es el vector de proyección, w E RpxI que diferencia la clase k del resto
  • yk son los datos proyectados que maximizan la separación entre la clase k y el resto, yk E RNxI

Podemos crear la matriz Y combinando todas las yk:

LDA para clases múltiples 2
  • W es la matriz de proyección, w E RpxK
  • Y son los datos proyectados de forma que cada columna k maximiza la separación entre la clase k y el resto, Y E RNxK

Recordemos que Fisher lo que busca es el máximo del cociente:

LDA para clases múltiples 3

Definimos la media global y para cada clase:

LDA para clases múltiples 4

Sbetween es la varianza que hay entre clases, cómo se separa cada clase de la media global.

Para dos clases era:

LDA para clases múltiples 5

La generalización para K clases (LDA para clases múltiples) es:

LDA para clases múltiples 6

Donde Swithin es la suma de las varianzas de cada grupo. Como varían las muestras dentro de cada clase, para dos clases era:

LDA para clases múltiples 7

La generalización para K clases es:

LDA para clases múltiples 8

El máximo de J(w) se consigue cuando:

LDA para clases múltiples 9

La solución viene dada por los autovectores, cuyos K – 1 autovalores son mayores.

¿Qué sigue?

Como hemos visto, el LDA es muchísimo más útil para clases múltiples que para clases individuales o solamente para dos clases. Recuerda que si quieres seguir aprendiendo sobre estas temáticas, aquí tenemos la mejor opción para ti: el Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp. Se trata de una formación intensiva de 8 meses en la que adquirirás todos los conocimientos necesarios para incursionar rápidamente en el mercado laboral. ¡Solicita más información y emprende tu camino hacia el éxito profesional!

👉 Descubre más del Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp ¡Descarga el temario!

👉 Prueba el Bootcamp Gratis por una Semana ¡Empieza ahora mismo!

👉 Conoce nuestros otros Bootcamps en Programación y Tecnología

[email protected]

¿Trabajo? Aprende a programar y consíguelo.

¡No te pierdas la próxima edición del Aprende a Programar desde Cero Full Stack Jr. Bootcamp!

 

Prepárate en 4 meses, aprende las últimas tecnologías y consigue trabajo desde ya. 

 

Solo en España hay más de 120.400 puestos tech sin cubrir, y con un sueldo 11.000€ por encima de la media nacional. ¡Es tu momento!

 

🗓️ Próxima edición: 13 de febrero

 

Reserva tu plaza descubre las becas disponibles.