Coeficiente de determinación R² en estadística

Autor: | Última modificación: 1 de agosto de 2022 | Tiempo de Lectura: 3 minutos
Temas en este post:

El coeficiente de determinación R² en estadística es uno de los cálculos que siguen al modelo que implementes en tu procesamiento de los macrodatos. En efecto, contar con este tipo de conocimiento te ayudará a comprender el principal propósito de la estadística, es decir, entender las variables y las diferentes relaciones que se encuentran entre ellas.

De hecho, este tipo de cálculos cumplen el propósito de facilitar los procesos y asegurar resultados más precisos, gracias a los que se destaca el valor de la información. Por este motivo, en este post, te explicamos qué es y cómo funciona el coeficiente de determinación R² en estadística para el manejo de los macrodatos.

Coeficiente de determinación R² en estadística

El coeficiente de determinación R² en estadística proporciona una medida que te permite saber lo bien que la medida sigue al modelo utilizado. En suma, este estadístico se calcula por medio de la siguiente fórmula:

Coeficiente de determinación R² en estadística 1

En la que:

Coeficiente de determinación R² en estadística 2

es la suma del cuadrado de los residuos:

Coeficiente de determinación R² en estadística 3

Además:

Coeficiente de determinación R² en estadística 4

es proporcional a la varianza de Y:

Coeficiente de determinación R² en estadística 5

De esta forma, el coeficiente de determinación R² en estadística determina que cuanto más cercano a 1, mejor seguirá la predicción a los datos reales.

Por otra parte, responde a la pregunta: ¿cómo de mejor es mi modelo respecto a uno que siempre devuelva el valor medio?

Rsq <- 1-(sum((Y-est_Y)^2))/(sum((Y-mean(Y))^2))
print(paste("El coeficiente de determinación es:",Rsq))

[1] «El coeficiente de determinación es: 0.985188061001936»

summary(model)
Coeficiente de determinación R² en estadística 6

A continuación, para que profundices en cómo funciona el coeficiente de determinación R² en estadística, te exponemos otro ejemplo:

options(repr.plot.height=4,repr.plot.width=6)
n<-40
xn<-rnorm(n,sd=1)
yn<-xn*2+rnorm(n,mean=2,sd=1)
datos<-data.frame(y=yn,X=xn)
model=lm(datos, formula=y~X+0)


plot(xn,yn,col="blue")
abline(c(0,model$coefficients),col="red")
summary(model)$r.squared

0.493914310299537

Esto llevado a la esquematización apunta a un gráfico de dispersión que sería el siguiente:

Coeficiente de determinación R² en estadística 7
summary(model)
Coeficiente de determinación R² en estadística 8
options(repr.plot.height=2,repr.plot.width=6)

vcov_matrix<-as.numeric(t(model$residuals)%*%model$residuals/(length(model$residuals)-2))*solve(t(xn)%*%xn)


ggplot(data=datos, aes(x=X)) +     
    stat_function(fun=mydt,args = list(df = df,mn=model$coefficients[1],sd=sqrt(diag(vcov_matrix))[1]),color="#2222BB")+
    geom_vline(xintercept=qt(0.975,df)*sqrt(diag(vcov_matrix))[1]+model$coefficients[1])+
    geom_vline(xintercept=qt(0.025,df)*sqrt(diag(vcov_matrix))[1]+model$coefficients[1])+
    xlim(-20,20)
Coeficiente de determinación R² en estadística 9
cnf_int<-confint(model)
cnf_int
La imagen tiene un atributo ALT vacío; su nombre de archivo es image-374.png
Coeficiente de determinación R² en estadística 10
options(repr.plot.height=4,repr.plot.width=6)

datos<-datos[order(datos$X),]
pred<-predict(model,datos,interval="confidence")
est_Y <- pred[,"fit"]
plot(xn,yn,col="blue")
points(datos$X,est_Y,col="red")

#lines(datos$X,pred[,"fit"],col="red")
#lines(datos$X,pred[,"lwr"],col="black")
#lines(datos$X,pred[,"upr"],col="black")
#abline(c(0,cnf_int[2]),col="gray")
#abline(c(0,cnf_int[1]),col="gray")
Coeficiente de determinación R² en estadística 11

Por último, te animamos a seguir practicando este cálculo de coeficiente de determinación R² en estadística por medio de más ejemplos prácticos.

Aprende más del Big Data

A través de este post, has podido identificar qué es el coeficiente de determinación R² en estadística para Big Data. No obstante, este desarrollo exige continuar practicando para ganar experiencia. Si no tienes claro cómo puedes empezar, ¡desde KeepCoding te traemos la mejor opción!

Nuestro Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning cuenta con once módulos que te prepararán y pondrán a prueba tus destrezas con las principales herramientas desarrolladas para el procesamiento de los macrodatos en el transcurso de sus 11 módulos. Para ello, también contarás con el apoyo de una serie de expertos en Big Data que te guiarán en los procesos tanto teóricos como prácticos. ¡No esperes más, inscríbete y empieza ahora!

👉 Descubre más del Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp ¡Descarga el temario!

👉 Prueba el Bootcamp Gratis por una Semana ¡Empieza ahora mismo!

👉 Conoce nuestros otros Bootcamps en Programación y Tecnología

[email protected]

¿Trabajo? Aprende a programar y consíguelo.

¡No te pierdas la próxima edición del Aprende a Programar desde Cero Full Stack Jr. Bootcamp!

 

Prepárate en 4 meses, aprende las últimas tecnologías y consigue trabajo desde ya. 

 

Solo en España hay más de 120.400 puestos tech sin cubrir, y con un sueldo 11.000€ por encima de la media nacional. ¡Es tu momento!

 

🗓️ Próxima edición: 13 de febrero

 

Reserva tu plaza descubre las becas disponibles.