2 tipos de variables en estadística Big Data

Autor: | Última modificación: 18 de abril de 2024 | Tiempo de Lectura: 3 minutos
Temas en este post:

Algunos de nuestros reconocimientos:

Premios KeepCoding

Los dos tipos de variables en estadística Big Data forman parte de las herramientas que se comportan como una especie de facilitadores para el manejo de los macrodatos para reconocer el valor de los datos y su importancia a la hora de tomar decisiones y definir rutas de acción que se potencien.

De esta manera, la estadística en Big Data es uno de los campos más importantes para hacer una muestra significativa sobre el procesamiento de los datos. Por esta razón, en este post, te exponemos cuáles son los dos tipos de variables en estadística Big Data.

¿Qué es estadística para Big Data?

La estadística para el Big Data trata de entender las variables de la información y su relación entre ellas. Las estadísticas te ayudan a comprender cómo es tu población de los datos. Para ello, esta cuenta con ciertos elementos, como son los estimadores, los percentiles, la varianza, la moda, las operaciones, los tests estadísticos, las asignaciones, etc.

Asimismo, la estadística es una disciplina que se dedica a analizar los datos de manera minuciosa para, posteriormente, identificar las coincidencias de variables con las que cuenta la información. Esto produce, por ejemplo, que una empresa pueda conocer cuáles son las mejores rutas y decisiones para su optimización gracias a los datos procesados.

Tipos de variables en estadística Big Data

La estadística para Big Data consiste en una gran variedad de elementos, como los vectores, los factores, las matrices, etc. Dentro de ellos, se encuentran los factores que, principalmente, se remiten a las variables de la estadística Big Data.

Em definitiva, podemos decir que existen dos tipos de variables en estadística Big Data que son:

Numéricas

Estos datos tienen significado como medidas, por ejemplo, la altura, el peso, la presión sanguínea o un número de mascotas, entre muchas otras posibilidades.

Categóricas

Este tipo de datos representan una característica específica, como, por ejemplo, el género, el color, los sabores, las ciudades, etc.

Ejemplo de variables categóricas

Los factores son útiles cuando se trabaja con variables categóricas, como, por ejemplo, realizar un estudio estadístico sobre una población de origen, los colores, los sabores, etc.

A continuación, te compartimos un breve ejemplo en el que se ilustra cómo funciona este tipo de variable para un análisis estadístico de los macrodatos. Este se basa en un estudio de datos de sabores y sus respectivos análisis:

saboresDePlatos<c(«Dulce»,»Salado»,»Ácido»,»Amargo»,»Umami»,»Dulce»,»Salado»,»Ácido»,»Umami»,»Umami»,»Salado»)
summary(saboresDePlatos)

2 tipos de variables en estadística Big Data

saboresDePlatosFactor <- factor(saboresDePlatos)
summary(saboresDePlatosFactor)

2 tipos de variables en estadística Big Data

str(saboresDePlatos)
chr [1:11] «Dulce» «Salado» «Ácido» «Amargo» «Umami» «Dulce» «Salado» …
str(saboresDePlatosFactor)

Factor w/ 5 levels «Ácido»,»Amargo»,..: 3 4 1 2 5 3 4 1 5 5 …

saboresDePlatosFactor

2 tipos de variables en estadística Big Data

print(«Los factores internamente se gestionan como enteros»)
as.numeric(saboresDePlatosFactor)

2 tipos de variables en estadística Big Data

paste(«sabor:»,levels(saboresDePlatosFactor))

2 tipos de variables en estadística Big Data

paste(«sabor»,levels(saboresDePlatosFactor),sep=»–«)

2 tipos de variables en estadística Big Data

paste(levels(saboresDePlatosFactor),collapse=»,»)

2 tipos de variables en estadística Big Data

cat(paste(«Podemos ver los niveles con el comando levels:»,
paste(levels(saboresDePlatosFactor),collapse=»,»)))

De esta forma, podrás ver los niveles con el comando levels: Ácido, Amargo, Dulce, Salado, Umami.

factor(c(1,0,0,1,0,1),labels=c(«NO»,»SI»))

2 tipos de variables en estadística Big Data

factor(c(10,5,5,0,5,0),labels=c(«BAJO», «MEDIO», «ALTO»))

2 tipos de variables en estadística Big Data

Sigue aprendiendo sobre el Big Data

En este post, te has familiarizado con dos tipos de variables en estadística Big Data, sin embargo, hay muchos otros factores que tendrás que considerar para llevar a cabo un análisis estadístico del procesamiento de los macrodatos. ¡Por lo que aún queda mucho por aprender sobre el Big Data!

Para continuar formándote sobre el Big Data y sus herramientas, desde KeepCoding te recomendamos nuestro Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning. A través de esta formación intensiva, aprenderás a dominar los conocimientos necesarios para implantar cualquier tipo de arquitectura y para los desarrollos necesarios, tanto técnicos como analíticos, dentro del mundo del Big Data de la mano de grandes profesionales y expertos en la materia. ¡No lo dudes más e inscríbete ya para convertirte en un experto del sector IT!

Posts Relacionados

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado