El lenguaje de programación R es uno de los lenguajes de programación más empleados en el mundo Big Data, por lo que resulta imprescindible para el desarrollo de múltiples procesos que se dedican a destacar el valor de los macrodatos, como, por ejemplo, el análisis estadístico.
Funciones básicas en R
Las funciones básicas en el lenguaje R para un análisis estadístico del Big Data son operaciones básicas que ayudan a las resolución de problemas de tipo data.
- Las funciones siempre finalizan en ().
- Pueden recibir un número variable de parámetros.
- Pueden existir parámetros por defecto.
- Ver las variables en memoria, función ls().
Asignaciones
Las asignaciones en el lenguaje de programación R consisten en el proceso de añadir determinado valor a los datos, de manera que puedan crearse ciertas variables para la clasificación y el análisis estadístico en el manejo del Big Data.
Operaciones en el lenguaje R
Las operaciones en el lenguaje R hacen referencia a la serie de alternativas que puedes establecer en la consola para llevar a cabo determinadas funciones, por medio de operaciones de álgebra básica que te compartimos a continuación:
- #suma: a+b: si buscas sumar dos datos para el análisis, el comando será a+b.
- #potencia: a^b: si quieres realizar una potencia, debes tener en cuenta que, para llevarla a cabo, es necesario utilizar este operador (a^b).
- #módulo: a %% b: dentro de las operaciones en el lenguaje R también podrás contar con el módulo que, desde la sintaxis de comando, se escribe así, con dos símbolos de porcentaje: (a %% b).
- #división: a / b: en cuanto a la operación de la división, esta responde al símbolo predilecto en álgebra base que funciona con el comando a / b.
- #resta: a – b: por último, otra de las operaciones en el lenguaje R clave para el desarrollo de estadística en el Big Data es la resta que, al igual que las demás, corresponde a su signo preestablecido de menos (-), es decir, se escribe como a – b.
Tipo de datos double
Los datos double en el lenguaje R consisten en que, una vez escribas determinado número, se guardará de forma doble. Esto lo consigue para que sepas que hay doble en el número, incluso cuando posee decimales.
Tipo de datos integer
El tipo de datos integer busca que el dato numérico que se está trabajando se convierta en un entero para llevar a cabo el análisis estadístico de la información, al contrario de una función como double, que trabaja con los número decimales.
Media aritmética
En matemáticas y estadística, la media aritmética (también llamada promedio o media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos, que es el objeto de estudio que parte del principio de la esperanza matemática o valor esperado. Se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos:
En el lenguaje R, la función de la media se podría definir de esta forma:
myMean<-function(X){
# A rellenar
}
myMean(alturas)
Evidentemente, R tiene una función para la media cuya ejecución es mucho más rápida que la función y es esta:
mean(alturas)
Media truncada
La media truncada se utiliza cuando quieres quitar los elementos más extremos (elementos por arriba y por abajo) del array del cómputo de la media. La media truncada es un estimador más robusto que la media.
En el lenguaje R se utiliza la función mean con el parámetro trim, que indica qué porcentaje de elementos del array eliminamos antes de hacer la media:
alturas2 <- c(alturas,1000)
alturas2
mean(alturas2)
mean(alturas,trim = 0.2)
?mean
¿Cuál es el siguiente paso?
Por medio de este post, has comprendido siete de los conceptos clave del lenguaje de programación R. Sin embargo, aún queda mucho por aprender y, por eso, queremos ofrecerte nuestro Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning. En su transcurso, te presentaremos las principales herramientas, sistemas y lenguajes que se dedican al manejo de los macrodatos a partir de nuestra metodología hands on. De esta forma, en menos de nueve meses, podrás convertirte en todo un profesional del Big Data y destacar frente a tus competidores del sector IT. ¡Consulta nuestro temario y no esperes más para apuntarte!