Cuestiones como los tipos de media en R forman parte de las estadísticas que te ayudan a comprender cómo se comporta determinada población de datos a partir de una estrategia que se encuentra dentro de los tipos de estimador estadístico en el manejo del Big Data.
La estadística de los macrodatos cuenta con ciertas estrategias más, como los estimadores, los percentiles, la varianza, la moda, los tests estadísticos, las operaciones, las asignaciones, etc.
Llegar a identificar cómo se produce cada una de estas herramientas que sustraen ciertos valores de una muestra de datos para hacer un resumen estadístico se convierte en un conocimiento necesario para esta rama del procesamiento de los macrodatos. Por esta razón, en este post, te explicamos cuáles son los tipos de media en R.
¿Cuáles son los tipos de media en R?
La media en R forma parte de las estrategias que ofrece un estimador estadístico (una función de la muestra) para estimar un parámetro desconocido de la población de datos estudiada. Ahora, existen diferentes tipos de media en R que te compartimos a continuación a partir del siguiente ejemplo:
alturas<-c (1.80,1.60,1.50,1.90,1.75,1.63,1.65)
Media aritmética
En matemáticas y estadística, la media aritmética (también llamada promedio o media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos, que es el objeto de estudio que parte del principio de la esperanza matemática o valor esperado. Se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos:
En R, la función de la media se podría definir de esta forma:
myMean<-function(X){
# A rellenar
}
myMean(alturas)
Evidentemente, R tiene una función para la media cuya ejecución es mucho más rápida que la función y es esta:
mean(alturas)
Media truncada
La media truncada se utiliza cuando quieres quitar los elementos más extremos (elementos por arriba y por abajo) del array del cómputo de la media. La media truncada es un estimador más robusto que la media.
En R se utiliza la función mean con el parámetro trim, que indica qué porcentaje de elementos del array eliminamos antes de hacer la media:
alturas2 <- c(alturas,1000)
alturas2
mean(alturas2)
mean(alturas,trim = 0.2)
?mean
Media geométrica
La media geométrica de una cantidad arbitraria de números (por decir n números) es la raíz n-ésima del producto de todos los números.
En definitiva, esto es equivalente a:
myGeometricMean<-function(X,na.rm=F){
# A rellenar
}
Por ejemplo
¿Cuál es el TAE medio en el cambio Bitcoins en dólares desde 2011?
En el siguiente ejemplo podrás ver el precio en dólares a principios de cada año, junto con su revalorización porcentual durante ese año:
year<-c(2010,2011,2012,2013,2014,2015,2016,2017,2018,2019,2020,2021,2022)
value<-c(0.3, 4.7,13.2,760,316,430,980,12000,13400,3200,6500,32000,47000)
ratio<-c(NA,value[2:length(value)]/value[1:length(value)-1])
rate<-(ratio-1)*100
bitcoinValue<-data.frame(año=year, valor=value, TAE=round(rate,2), ratio=round(ratio,4))
bitcoinValue
print(paste0(“La media aritmética de todos los intereses TAE es:”,
round(mean(bitcoinValue$TAE,na.rm=T),2),”%”))
myGeometricMean(bitcoinValue$ratio,na.rm=T)
realTAEmean<-(myGeometricMean(bitcoinValue$ratio,na.rm=T)-1)*100
print(paste0(“La media real de todos los intereses TAE es:”,
round(realTAEmean,2),”%”))
initialAmount<-10
print(paste0(“Si se hubiera invertido $”,initialAmount,” a un interés del “, round(realTAEmean,2), “% TAE, 12 años después tendrías $”, round(initialAmount*(realTAEmean/100+1)^7)))
Por medio de este post, has podido identificar cuáles son los tipos de media en R para el desarrollo de un análisis estadístico en el procesamiento del Big Data. No obstante, estas son solo algunas de las estrategias de un estimador estadístico, puesto que también podrás contar con los cuartiles, la varianza, la mediada, etc.
Para facilitarte el proceso de aprendizaje, desde KeepCoding te brindamos el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning, a través del cual podrás convertirte en un experto del sector IT en el ámbito del Big Data en muy poco tiempo. En suma, te formarás en el proceso de ingesta, clasificación, resguardo, procesamiento y presentación de los macrodatos gracias al uso de diferentes herramientas, sistemas y lenguajes de programación. Por otra parte, este bootcamp está enfocado en conceptos de arquitectura, como disponibilidad, escalabilidad y resiliencia, entre otros. ¡No esperes más para empezar e inscríbete ahora!