Criterios de convergencia en data mining

| Última modificación: 18 de abril de 2024 | Tiempo de Lectura: 3 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

¿Sabías que los criterios de convergencia en data mining se utilizan para hacer analítica predictiva?

En otros artículos hemos hablado de la optimización en data mining y de cómo hacer análisis predictivos por medio de la ejecución de ciertos algoritmos. Hasta ahora hablamos ejecutado nuestro algoritmo un número N de iteraciones, pero deberíamos parar cuando la función converge al mínimo.

Convergencia en data mining

La convergencia en matemáticas es la propiedad de aproximación que tiene una variable hacia un límite, a medida que aumenta o disminuye el argumento de la función o aumenta el número de términos de la serie.

Una serie es la suma de los términos de una secuencia numérica. Se dice que una serie es convergente cuando la sucesión de sumas parciales tiene un límite en un espacio determinado.

Por ejemplo, la función y=1/x converge hacia cero cuando x aumenta.

Pruebas de convergencia

Los test para evaluar criterios de convergencia en data mining son modos de evaluar la convergencia y sus distintas representaciones.

Existen variadas pruebas para determinar criterios de convergencia en data mining:

  • Límite del sumando.
  • Criterio de d’Alembert.
  • Criterio de la raíz de Cauchy.
  • Test de la integral.
  • Test por comparación directa.
  • Test de comparación de límites.
  • Criterio de condensación de Cauchy.
  • Test de Abel.
  • Test para series alternadas.

Ejemplos de criterios de convergencia en data mining

En nuestro post sobre qué es la optimización en data mining puedes ver cómo minimizar la función de error, que es la manera en la que se ajusta la curva de predicción a la curva real.

Los criterios de convergencia en data mining son útiles siempre que nos ayuden a determinar cuándo se llega al mínimo, que es lo que se busca minimizando la función de error.

En una operación de predict puedes parar al cabo de x iteraciones (de 10, 20, 100 o las que quieras) o puedes alcanzar un criterio de convergencia, es decir, cuando esté lo suficientemente cerca del mínimo. Dicho de otro modo, esto último se refiere a cuando, de una iteración a la siguiente, el cambio es muy pequeño.

Así pues, tendríamos dos criterios de convergencia en data mining:

  1. Número de iteraciones.
  2. Acercamiento al mínimo.

A la hora de definir los criterios de convergencia en data mining hay que tener en cuenta:

  • Si es demasiado restrictivo, es posible que nunca se llegue.
  • Si es demasiado laxo, no conseguiremos optimizar todo lo posible.

Existen varias formas de definirlo:

  • Si tras M iteraciones no se consigue disminuir el valor de la función a optimizar.
  • Si la derivada es prácticamente 0.
In [ ]: x_0<-7
delta <- 0.8
h< 0.001
criterio convergencia<-0.05
x_historico<-c()

for (1 in 1:50)
      x_new <- x_0 - derivada_myfunc(x_0,h,myfunc)*delta
      if (abs(myfunc(x_new)-myfunc(x_0))<criterio_convergencia){
          x<-ifelse(myfunc(x_new) < myfunc(x_0), myfunc  
          (x_new),myfunc(x_0))
          break;
      }
      x_0 <- x_new
      x_historico<-c(x_historico,x_0)
}
plot(x_historico,t="o")
grid()

Lo anterior graficado se vería del siguiente modo:

En el gráfico se aprecian los valores de x que estamos probando (-4, 2, 1…) y van todos convergiendo al valor de x=0, que es donde se encuentra el mínimo.

¿Quieres seguir aprendiendo?

Los criterios de convergencia en data mining son muy útiles a la hora de hacer analítica predictiva, ya que permiten determinar más fácilmente cuándo se da la “mayor” minimización del error, es decir, cuándo se está llegando al límite.

En data mining este es un tema base, por ello, te invitamos a que sigas aprendiendo sobre él por medio de nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp. Con la guía de esta formación intensiva podrás, en unos pocos meses, instruirte en todo lo necesario para incursionar en el mercado laboral. ¡Inscríbete ya y continúa tu camino hacia el éxito!

Sandra Navarro

Business Intelligence & Big Data Advisor & Coordinadora del Bootcamp en Data Science, Big Data & Machine Learning.

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado