¿Qué son las funciones básicas en R?

| Última modificación: 18 de abril de 2024 | Tiempo de Lectura: 3 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

La estadística dentro del Big Data trata de entender las variables de la información y su relación entre ellas. La estadística te ayudan a comprender cómo es tu población de los datos. Para ello, esta cuenta con ciertos elementos, como pueden ser los estimadores, los percentiles, la varianza, la moda, las operaciones, los tests estadísticos, las asignaciones, etc.

Dentro de estas dinámicas, podrás encontrar las funciones básicas en R, puesto que estas se encargan de llevar a cabo las operaciones principales para un análisis estadístico del Big Data de manera efectiva y funcional.

Por esta razón, en este post, te presentamos qué son las funciones básicas en R para que puedas llevar a cabo un estudio estadístico en tu procesamiento de los macrodatos.

¿Qué son las funciones básicas en R?

Las funciones básicas en R para un análisis estadístico del Big Data son operaciones básicas que ayudan a las resolución de problemas de tipo data. A continuación, te presentamos cuáles son las funciones básicas en R:

  • runif(x,min=a,max=b): esta es una de las primeras funciones básicas en R, puesto que genera x números aleatorios.
  • dunif(x,min=a,max=b): esta función de R es de carácter de densidad en el punto x (likelihood).
  • punif(x,min=a,max=b): consiste en la probabilidad acumulada P(X<x)=p.
  • qunif(p,min=a,max=b): por último, esta es la función inversa a la de la probabilidad acumulada y su comando se produce de esta forma: P(X<x)=p.

Por otra parte, también podrás generar una variable aleatoria que siga una distribución uniforme mediante la función runif().

Por ejemplo

Si quisieras generar 10000 muestras de una distribución uniforme entre 2 y 7, basta con ejecutar:

set.seed(1)

myUnifVector<-runif(10000,min=2,max=7)
summary(myUnifVector)
length(myUnifVector)

Entonces, podrás ver como el histograma de myUnifVector se parece bastante a la función de densidad de probabilidad esperada:

library(ggplot2)

Otras funciones en R

Además de las funciones básicas en R, también podrás contar con otro tipo de funciones, como la media, en las funciones comunes de este lenguaje de programación. A continuación, te compartimos algunas de las medias más importantes:

Media aritmética

En matemáticas y estadística, la media aritmética (también llamada promedio o media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza matemática o valor esperado. Se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos:

En R la función de la media se podría definir así:

myMean<-function(X){

# A rellenar

}

myMean(alturas)

Evidentemente, R tiene una función para la media cuya ejecución es mucho más rápida que la función:

mean(alturas)

Media truncada

La media truncada se utiliza cuando quieres quitar los elementos más extremos (elementos por arriba y por abajo) del array del cómputo de la media. La media truncada es un estimador más robusto que la media.

En R se utiliza la función mean con el parámetro trim, que indica qué porcentaje de elementos del array eliminamos antes de hacer la media:

alturas2 <- c(alturas,1000)
alturas2

mean(alturas2)

mean(alturas,trim = 0.2)

?mean

En el desarrollo de este post, has podido identificar qué son las funciones básicas en R para el desarrollo de un análisis estadístico del Big Data. Sin embargo, estas operaciones son solo una de las series con las que podrás contar en el desarrollo de un estudio de tipo estadístico en el procesamiento de los macrodatos.

Por ello, desde KeepCoding te presentamos el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning. Por medio del mismo, podrás aprender más sobre la suite de Talend Open Studio junto a las demás herramientas Big Data a través de diferentes módulos, como el de Big Data Architecture. Allí, verás una imagen completa del proceso de carga, clasificación, resguardo, gestión y presentación de los datos a través de diferentes herramientas, sistemas y lenguajes. Además, podrás instruirte tanto de manera teórica como práctica. ¡No esperes más y apúntate ya!

Sandra Navarro

Business Intelligence & Big Data Advisor & Coordinadora del Bootcamp en Data Science, Big Data & Machine Learning.

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado