Los dos tipos de variables en estadística Big Data forman parte de las herramientas que se comportan como una especie de facilitadores para el manejo de los macrodatos para reconocer el valor de los datos y su importancia a la hora de tomar decisiones y definir rutas de acción que se potencien.
De esta manera, la estadística en Big Data es uno de los campos más importantes para hacer una muestra significativa sobre el procesamiento de los datos. Por esta razón, en este post, te exponemos cuáles son los dos tipos de variables en estadística Big Data.
Tipos de variables en estadística Big Data
La estadística para Big Data consiste en una gran variedad de elementos, como los vectores, los factores, las matrices, etc. Dentro de ellos, se encuentran los factores que, principalmente, se remiten a las variables de la estadística Big Data.
Em definitiva, podemos decir que existen dos tipos de variables en estadística Big Data que son:
Numéricas
Estos datos tienen significado como medidas, por ejemplo, la altura, el peso, la presión sanguínea o un número de mascotas, entre muchas otras posibilidades.
Categóricas
Este tipo de datos representan una característica específica, como, por ejemplo, el género, el color, los sabores, las ciudades, etc.
Ejemplo de variables categóricas
Los factores son útiles cuando se trabaja con variables categóricas, como, por ejemplo, realizar un estudio estadístico sobre una población de origen, los colores, los sabores, etc.
A continuación, te compartimos un breve ejemplo en el que se ilustra cómo funciona este tipo de variable para un análisis estadístico de los macrodatos. Este se basa en un estudio de datos de sabores y sus respectivos análisis:
saboresDePlatos<c(“Dulce”,”Salado”,”Ácido”,”Amargo”,”Umami”,”Dulce”,”Salado”,”Ácido”,”Umami”,”Umami”,”Salado”)
summary(saboresDePlatos)
saboresDePlatosFactor <- factor(saboresDePlatos)
summary(saboresDePlatosFactor)
str(saboresDePlatos)
chr [1:11] “Dulce” “Salado” “Ácido” “Amargo” “Umami” “Dulce” “Salado” …
str(saboresDePlatosFactor)
Factor w/ 5 levels “Ácido”,”Amargo”,..: 3 4 1 2 5 3 4 1 5 5 …
saboresDePlatosFactor
print(“Los factores internamente se gestionan como enteros”)
as.numeric(saboresDePlatosFactor)
paste(“sabor:”,levels(saboresDePlatosFactor))
paste(“sabor”,levels(saboresDePlatosFactor),sep=”–“)
paste(levels(saboresDePlatosFactor),collapse=”,”)
cat(paste(“Podemos ver los niveles con el comando levels:”,
paste(levels(saboresDePlatosFactor),collapse=”,”)))
De esta forma, podrás ver los niveles con el comando levels: Ácido, Amargo, Dulce, Salado, Umami.
factor(c(1,0,0,1,0,1),labels=c(“NO”,”SI”))
factor(c(10,5,5,0,5,0),labels=c(“BAJO”, “MEDIO”, “ALTO”))
Sigue aprendiendo sobre los tipos de variables en estadística Big Data
En este post, te has familiarizado con dos tipos de variables en estadística Big Data, sin embargo, hay muchos otros factores que tendrás que considerar para llevar a cabo un análisis estadístico del procesamiento de los macrodatos. ¡Por lo que aún queda mucho por aprender sobre el Big Data!
Para continuar formándote sobre el Big Data y sus herramientas, desde KeepCoding te recomendamos nuestro Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning. A través de esta formación intensiva, aprenderás a dominar los conocimientos necesarios para implantar cualquier tipo de arquitectura y para los desarrollos necesarios, tanto técnicos como analíticos, dentro del mundo del Big Data de la mano de grandes profesionales y expertos en la materia. ¡No lo dudes más e inscríbete ya para convertirte en un experto del sector IT!