¿Qué son las funciones básicas en R?

Autor: | Última modificación: 7 de julio de 2022 | Tiempo de Lectura: 4 minutos
Temas en este post: ,

La estadística dentro del Big Data trata de entender las variables de la información y su relación entre ellas. La estadística te ayudan a comprender cómo es tu población de los datos. Para ello, esta cuenta con ciertos elementos, como pueden ser los estimadores, los percentiles, la varianza, la moda, las operaciones, los tests estadísticos, las asignaciones, etc.

Dentro de estas dinámicas, podrás encontrar las funciones básicas en R, puesto que estas se encargan de llevar a cabo las operaciones principales para un análisis estadístico del Big Data de manera efectiva y funcional.

Por esta razón, en este post, te presentamos qué son las funciones básicas en R para que puedas llevar a cabo un estudio estadístico en tu procesamiento de los macrodatos.

¿Cómo es el lenguaje de programación R?

Una de las cuestiones que más destaca en este lenguaje de programación con respecto a los demás es que se diseñó y está orientado a la estadística, por lo que cuenta con una multitud de paquetes que complementan su funcionalidad.

Por otra parte, es de código abierto (open source), lo que significa que podrás descargar el código y contribuir, como con casi todas las herramientas que existen hoy en día, a la ciencia de los datos. Asimismo, se entrega bajo la licencia GPL (General Public License o Licencia Pública General).

Además, es muy parecido al software SPSS (Statistical Package for Social Sciences o Paquete Estadístico para las Ciencias Sociales, en español) y también a Matlab (MATrix LABoratory o Laboratorio de Matices, en español).

¿Qué son las funciones básicas en R?

Las funciones básicas en R para un análisis estadístico del Big Data son operaciones básicas que ayudan a las resolución de problemas de tipo data. A continuación, te presentamos cuáles son las funciones básicas en R:

  • runif(x,min=a,max=b): esta es una de las primeras funciones básicas en R, puesto que genera x números aleatorios.
  • dunif(x,min=a,max=b): esta función de R es de carácter de densidad en el punto x (likelihood).
  • punif(x,min=a,max=b): consiste en la probabilidad acumulada P(X<x)=p.
  • qunif(p,min=a,max=b): por último, esta es la función inversa a la de la probabilidad acumulada y su comando se produce de esta forma: P(X<x)=p.

Por otra parte, también podrás generar una variable aleatoria que siga una distribución uniforme mediante la función runif().

Por ejemplo

Si quisieras generar 10000 muestras de una distribución uniforme entre 2 y 7, basta con ejecutar:

set.seed(1)

myUnifVector<-runif(10000,min=2,max=7)
summary(myUnifVector)
length(myUnifVector)

Entonces, podrás ver como el histograma de myUnifVector se parece bastante a la función de densidad de probabilidad esperada:

library(ggplot2)

Otras funciones en R

Además de las funciones básicas en R, también podrás contar con otro tipo de funciones, como la media, en las funciones comunes de este lenguaje de programación. A continuación, te compartimos algunas de las medias más importantes:

Media aritmética

En matemáticas y estadística, la media aritmética (también llamada promedio o media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza matemática o valor esperado. Se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos:

¿Qué son las funciones básicas en R? 1

En R la función de la media se podría definir así:

myMean<-function(X){

# A rellenar

}

myMean(alturas)

Evidentemente, R tiene una función para la media cuya ejecución es mucho más rápida que la función:

mean(alturas)

Media truncada

La media truncada se utiliza cuando quieres quitar los elementos más extremos (elementos por arriba y por abajo) del array del cómputo de la media. La media truncada es un estimador más robusto que la media.

¿Qué son las funciones básicas en R? 2

En R se utiliza la función mean con el parámetro trim, que indica qué porcentaje de elementos del array eliminamos antes de hacer la media:

alturas2 <- c(alturas,1000)
alturas2

mean(alturas2)

mean(alturas,trim = 0.2)

?mean

¿Cómo continuar aprendiendo sobre el Big Data?

En el desarrollo de este post, has podido identificar qué son las funciones básicas en R para el desarrollo de un análisis estadístico del Big Data. Sin embargo, estas operaciones son solo una de las series con las que podrás contar en el desarrollo de un estudio de tipo estadístico en el procesamiento de los macrodatos.

Por ello, desde KeepCoding te presentamos el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning. Por medio del mismo, podrás aprender más sobre la suite de Talend Open Studio junto a las demás herramientas Big Data a través de diferentes módulos, como el de Big Data Architecture. Allí, verás una imagen completa del proceso de carga, clasificación, resguardo, gestión y presentación de los datos a través de diferentes herramientas, sistemas y lenguajes. Además, podrás instruirte tanto de manera teórica como práctica. ¡No esperes más y apúntate ya!

👉 Descubre más del Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp ¡Descarga el temario!

👉 Prueba el Bootcamp Gratis por una Semana ¡Empieza ahora mismo!

👉 Conoce nuestros otros Bootcamps en Programación y Tecnología

[email protected]

¿Sabías que hay más de 5.000 vacantes para desarrolladores de Big Data sin cubrir en España? 

En KeepCoding llevamos desde 2012 guiando personas como tú a áreas de alta empleabilidad y alto potencial de crecimiento en IT con formación de máxima calidad.

 

Porque creemos que un buen trabajo es fuente de libertad, independencia, crecimiento y eso ¡cambia historias de vida!


¡Da el primer paso!