Los vectores en estadística Big Data se comportan como uno de los factores de la estadística para el manejo de los macrodatos. De hecho, es por medio de estos que se producen los gráficos de dispersión para la esquematización de los resultados arrojados. Por otra parte, los vectores también posibilitan las variables double.
Al igual que las demás cuestiones de la estadística Big Data, estos estadísticos que analizan una muestra de la población de datos pretenden destacar el valor de la información con el fin de llevar a cabo una toma de decisiones y ruta de acción efectiva.
Es evidente que un data scientist debe contar con este tipo de conocimientos para la selección asertiva de determinada solución para el manejo de los datos. Por esta razón, en este post, te explicamos qué son los vectores en estadística Big Data de la mano de un ejemplo práctico.
¿Qué son los vectores en estadística Big Data?
Los vectores en estadística Big Data se crean con la función c(), en la que todos los elementos de un vector son del mismo tipo. Es decir, no se podrían mezclar caracteres ni variables double.
En python su inscripción se realiza de la siguiente forma:
a = [1,2,3,40].
En R los vectores en estadística Big Data se formulan así:
a = c(1,2,3,40).
Ejemplo práctico
Ahora, los vectores son un conocimiento de tipo más práctico que teórico, por esta razón, a continuación te compartimos un ejemplo en el que se ilustra cómo funcionan los vectores en estadística Big Data.

En este caso, los datos estudiados pertenecen a variables de una muestra de datos que pertenece a la altura de determinada población. Este se realiza por medio del lenguaje de programación R y su desarrollo se plantea así:
alturas<-c(1.80,1.60,1.50,1.90,1.75,1.63,1.65) print(paste("alturas es una variable de tipo:",typeof(alturas)))
[1] «alturas es una variable de tipo: double«
print("Podemos ver la estructura de un objeto con la función str():") str(alturas)
[1] «Podemos ver la estructura de un objeto con la función str():»
num [1:7] 1.8 1.6 1.5 1.9 1.75 1.63 1.65
otroVector <- c("uno",2.0,"tres","14.0") otroVector
- ‘uno’
- ‘2’
- ‘tres’
- ‘14.0’
str(otroVector)
chr [1:4] «uno» «2» «tres» «14.0»
typeof(otroVector)
‘character’
Acceso a elementos
Ahora bien, si quisieras acceder a elementos en específico y por separado, entonces esta función se articula de la siguiente forma:
print(paste("El valor del tercer elemento es:",alturas[3]))
[1] «El valor del tercer elemento es: 1.5»
También podrás nombrar a cada uno de los vectores según la organización de tus datos así:
myVector <- c(nombre="Philip",apellido="García",teléfono=600100100)
myVector

myVector["nombre"]
apellido: ‘García’
myVector[2]
apellido: ‘García’
myVector["teléfono"]
teléfono: ‘600100100’
#Los nombres de una variable se pueden ver con la función names() names(myVector)
- ‘nombre’
- ‘apellido’
- ‘teléfono’
names(myVector) <- c("nombre_actualizado","apellido_actualizado", "telefono_actualizado")

myVector
- ‘nombre_actualizado’
- ‘apellido_actualizado’
- ‘telefono_actualizado’
Operaciones con vectores
Al operar contra una variable, se aplica esa operación a todos los elementos del vector:
metro2pie <- 3.28084 alturasEnPies <- alturas*metro2pie alturasEnPies
- 5.905512
- 5.249344
- 4.92126
- 6.233596
- 5.74147
- 5.3477692
- 5.413386
Si se opera con dos vectores de la misma longitud, se aplica elemento a elemento:
alturas
- 1.8
- 1.6
- 1.5
- 1.9
- 1.75
- 1.63
- 1.65
alturaDeLosZapatos<-c(2,0,1,3,5,7,0)/100 alturaReal<-alturas-alturaDeLosZapatos alturaReal
- 1.78
- 1.6
- 1.49
- 1.87
- 1.7
- 1.56
- 1.65
Se puede operar con vectores de tamaños diferentes, en este caso el vector más pequeño se replica así:
alturas*c(1,0)
- 1.8
- 0
- 1.5
- 0
- 1.75
- 0
- 1.65
1.8 1.6 1.5 1.9 1.75 1.63 1.65 XXX
1 0 1 0 1 0 1 0
alturas[1:6] * c(1,0)
- 1.8
- 0
- 1.5
- 0
- 1.75
- 0
Concatenar vectores
otras_alturas <-c(alturas,2,1.8,17) otras_alturas
- 1.8
- 1.6
- 1.5
- 1.9
- 1.75
- 1.63
- 1.65
- 2
- 1.8
- 17
La longitud de un vector se obtiene con la función length():
length(alturas)
7
La estructura de la variable se puede ver con la función str():
str(alturas)
num [1:7] 1.8 1.6 1.5 1.9 1.75 1.63 1.65
alturas[18]<-1.9
alturas
- 1.8
- 1.6
- 1.5
- 1.9
- 1.75
- 1.63
- 1.65
- <NA>
- <NA>
- <NA>
- <NA>
- <NA>
- <NA>
- <NA>
- <NA>
- <NA>
- <NA>
- 1.9
length(alturas)
18
¿Cuál es el siguiente paso Big Data?
En el desarrollo de este post te hemos expuesto cómo funcionan los vectores en estadística Big Data, de manera que ahora podrás llevar a la práctica este ejemplo desde la consola de tu ordenador. Te aconsejamos realizar este y otro tipo de ejemplos que para profundizar en este conocimiento.
Por otra parte, desde KeepCoding también te presentamos el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning. Por medio del mismo, podrás aprender más sobre la suite de Talend Open Studio junto a las demás herramientas Big Data a través de diferentes módulos, como el de Big Data Architecture. Allí, verás una imagen completa del proceso de carga, clasificación, resguardo, gestión y presentación de los datos a través de diferentes herramientas, sistemas y lenguajes. Además, podrás instruirte tanto de manera teórica como práctica. ¡No esperes más y apúntate ya!