¿Qué son los vectores en estadística Big Data?

Autor: | Última modificación: 18 de abril de 2024 | Tiempo de Lectura: 3 minutos
Temas en este post:

Algunos de nuestros reconocimientos:

Premios KeepCoding

Los vectores en estadística Big Data se comportan como uno de los factores de la estadística para el manejo de los macrodatos. De hecho, es por medio de estos que se producen los gráficos de dispersión para la esquematización de los resultados arrojados. Por otra parte, los vectores también posibilitan las variables double.

Al igual que las demás cuestiones de la estadística Big Data, estos estadísticos que analizan una muestra de la población de datos pretenden destacar el valor de la información con el fin de llevar a cabo una toma de decisiones y ruta de acción efectiva.

Es evidente que un data scientist debe contar con este tipo de conocimientos para la selección asertiva de determinada solución para el manejo de los datos. Por esta razón, en este post, te explicamos qué son los vectores en estadística Big Data de la mano de un ejemplo práctico.

¿Qué son los vectores en estadística Big Data?

Los vectores en estadística Big Data se crean con la función c(), en la que todos los elementos de un vector son del mismo tipo. Es decir, no se podrían mezclar caracteres ni variables double.

En python su inscripción se realiza de la siguiente forma:

a = [1,2,3,40].

En R los vectores en estadística Big Data se formulan así:

a = c(1,2,3,40).

Ejemplo práctico

Ahora, los vectores son un conocimiento de tipo más práctico que teórico, por esta razón, a continuación te compartimos un ejemplo en el que se ilustra cómo funcionan los vectores en estadística Big Data.

¿Qué son los vectores en estadística Big Data?

En este caso, los datos estudiados pertenecen a variables de una muestra de datos que pertenece a la altura de determinada población. Este se realiza por medio del lenguaje de programación R y su desarrollo se plantea así:

alturas<-c(1.80,1.60,1.50,1.90,1.75,1.63,1.65)
print(paste("alturas es una variable de tipo:",typeof(alturas)))

[1] «alturas es una variable de tipo: double«

print("Podemos ver la estructura de un objeto con la función str():")
str(alturas)

[1] «Podemos ver la estructura de un objeto con la función str():»
num [1:7] 1.8 1.6 1.5 1.9 1.75 1.63 1.65

otroVector <- c("uno",2.0,"tres","14.0")
otroVector
  1. ‘uno’
  2. ‘2’
  3. ‘tres’
  4. ‘14.0’
str(otroVector)

chr [1:4] «uno» «2» «tres» «14.0»

typeof(otroVector)

‘character’

Acceso a elementos

Ahora bien, si quisieras acceder a elementos en específico y por separado, entonces esta función se articula de la siguiente forma:

print(paste("El valor del tercer elemento es:",alturas[3]))

[1] «El valor del tercer elemento es: 1.5»

También podrás nombrar a cada uno de los vectores según la organización de tus datos así:

myVector <- c(nombre="Philip",apellido="García",teléfono=600100100)
myVector
¿Qué son los vectores en estadística Big Data?
myVector["nombre"]

apellido: ‘García’

myVector[2]

apellido: ‘García’

myVector["teléfono"]

teléfono: ‘600100100’

#Los nombres de una variable se pueden ver con la función names()
names(myVector)
  • ‘nombre’
  • ‘apellido’
  • ‘teléfono’
names(myVector) <- c("nombre_actualizado","apellido_actualizado", "telefono_actualizado")
¿Qué son los vectores en estadística Big Data?
myVector
  1. ‘nombre_actualizado’
  2. ‘apellido_actualizado’
  3. ‘telefono_actualizado’

Operaciones con vectores

Al operar contra una variable, se aplica esa operación a todos los elementos del vector:

metro2pie <- 3.28084
alturasEnPies <- alturas*metro2pie
alturasEnPies
  1. 5.905512
  2. 5.249344
  3. 4.92126
  4. 6.233596
  5. 5.74147
  6. 5.3477692
  7. 5.413386

Si se opera con dos vectores de la misma longitud, se aplica elemento a elemento:

alturas
  1. 1.8
  2. 1.6
  3. 1.5
  4. 1.9
  5. 1.75
  6. 1.63
  7. 1.65
alturaDeLosZapatos<-c(2,0,1,3,5,7,0)/100
alturaReal<-alturas-alturaDeLosZapatos
alturaReal
  1. 1.78
  2. 1.6
  3. 1.49
  4. 1.87
  5. 1.7
  6. 1.56
  7. 1.65

Se puede operar con vectores de tamaños diferentes, en este caso el vector más pequeño se replica así:

alturas*c(1,0)
  1. 1.8
  2. 0
  3. 1.5
  4. 0
  5. 1.75
  6. 0
  7. 1.65

1.8 1.6 1.5 1.9 1.75 1.63 1.65 XXX

1 0 1 0 1 0 1 0

alturas[1:6] * c(1,0)
  1. 1.8
  2. 0
  3. 1.5
  4. 0
  5. 1.75
  6. 0

Concatenar vectores

otras_alturas <-c(alturas,2,1.8,17)
otras_alturas
  1. 1.8
  2. 1.6
  3. 1.5
  4. 1.9
  5. 1.75
  6. 1.63
  7. 1.65
  8. 2
  9. 1.8
  10. 17

La longitud de un vector se obtiene con la función length():

length(alturas)

7

La estructura de la variable se puede ver con la función str():

str(alturas)

num [1:7] 1.8 1.6 1.5 1.9 1.75 1.63 1.65

alturas[18]<-1.9
alturas
  1. 1.8
  2. 1.6
  3. 1.5
  4. 1.9
  5. 1.75
  6. 1.63
  7. 1.65
  8. <NA>
  9. <NA>
  10. <NA>
  11. <NA>
  12. <NA>
  13. <NA>
  14. <NA>
  15. <NA>
  16. <NA>
  17. <NA>
  18. 1.9
length(alturas)

18

¿Cuál es el siguiente paso Big Data?

En el desarrollo de este post te hemos expuesto cómo funcionan los vectores en estadística Big Data, de manera que ahora podrás llevar a la práctica este ejemplo desde la consola de tu ordenador. Te aconsejamos realizar este y otro tipo de ejemplos que para profundizar en este conocimiento.

Por otra parte, desde KeepCoding también te presentamos el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning. Por medio del mismo, podrás aprender más sobre la suite de Talend Open Studio junto a las demás herramientas Big Data a través de diferentes módulos, como el de Big Data Architecture. Allí, verás una imagen completa del proceso de carga, clasificación, resguardo, gestión y presentación de los datos a través de diferentes herramientas, sistemas y lenguajes. Además, podrás instruirte tanto de manera teórica como práctica. ¡No esperes más y apúntate ya!

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado