¿Qué son las matrices en estadística Big Data?

Autor: | Última modificación: 18 de abril de 2024 | Tiempo de Lectura: 3 minutos
Temas en este post:

Algunos de nuestros reconocimientos:

Premios KeepCoding

Hoy en día, se generan una gran cantidad de datos de manera simultánea y masiva, por ello es importante contar con herramientas como las matrices en estadística Big Data, gracias a las que se facilita la organización de los datos.

En efecto, dominar cada una de estas opciones forma parte de la tarea de un data scientistConocer este tipo de estrategias para la resolución de los problemas con los datos mejorará tu trabajo. Por ello, en este post, te presentamos qué son las matrices en estadística Big Data.

¿Qué son las matrices en estadística Big Data?

Las matrices en estadística Big Data se conocen como un tipo de organización de los datos, de manera que sea mucho más comprensible el procesamiento de la información y los resultados arrojados.

Ahora, podrás crear matrices con la función matrix. Así, una matriz es la que se comporta como parámetros de entrada que recibe un vector y el número de columnas (ncol) o filas (nrow). Por otra parte, existe un parámetro opcional (byrow), gracias al que se indica si la matriz se va a rellenar por filas o por columnas (valor por defecto).

1:12
  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10
  11. 11
  12. 12

In [133]:

m1<-matrix(c(1:12),ncol=3)
m1

A matrix: 4 × 3 of type int

¿Qué son las matrices en estadística Big Data?
?matrix

In [135]:

m2<-matrix(c(1:12),ncol=3,byrow=T)
m2

A matrix: 4 × 3 of type int:

¿Qué son las matrices en estadística Big Data?

La dimensión del array se puede ver con la función dim() o con str():

dim(m1)
  1. 4
  2. 3
length(m1)

12

str(m2)
 int [1:4, 1:3] 1 4 7 10 2 5 8 11 3 6 ...

Acceso a las matrices en estadística Big Data

En cuanto al acceso, este se realiza igual que como funciona con los vectores. Sin embargo, en esta oportunidad, podrás contar con dos dimensiones. A continuación, te mostramos un breve ejemplo:

m1[1,3]

9

m1[,2]
  1. 5
  2. 6
  3. 7
  4. 8

En suma, también podrás dar nombres a las filas y columnas para luego poder acceder utilizando el nombre.

?paste0
paste0("row",1:4)
  1. ‘row1’
  2. ‘row2’
  3. ‘row3’
  4. ‘row4’
colnames(m1)<-paste0("col",1:3)
rownames(m1)<-paste0("row",1:4)
m1

A matrix: 4 × 3 of type int:

¿Qué son las matrices en estadística Big Data?
paste("El valor de 'row1' y 'col3' es:",m1["row1","col3"])

‘El valor de \’row1\’ y \’col3\’ es: 9′.

m1["row1",]
¿Qué son las matrices en estadística Big Data?

Las funciones colnames y rownames.

// matriz estadistica
colnames(m1)
  1. ‘col1’
  2. ‘col2’
  3. ‘col3’

Operaciones con matrices

Las matrices en estadistica Big Data también pueden prestarse para realizar ciertas operaciones, como las que te presentamos a continuación por medio de un ejemplo:

Álgebra lineal básica

m1

A matrix: 4 × 3 of type int

¿Qué son las matrices en estadística Big Data?

Transpuesta

t(m1)

A matrix: 3 × 4 of type int

¿Qué son las matrices en estadística Big Data?

Suma de constante

m1+10

A matrix: 4 × 3 of type dbl:

¿Qué son las matrices en estadística Big Data?

Suma de matrices

m1+m2

A matrix: 4 × 3 of type int

¿Qué son las matrices en estadística Big Data?

Multiplicación de matrices

m1 %*% matrix(rep(1,12),nrow=3)

A matrix: 4 × 4 of type dbl

¿Qué son las matrices en estadística Big Data?
rep("a",5)
  1. ‘a’
  2. ‘a’
  3. ‘a’
  4. ‘a’
  5. ‘a’

Submatrices

m1[2:4,2:3]

A matrix: 3 × 2 of type int

¿Qué son las matrices en estadística Big Data?
m1[c(3,2,4),2:3]

A matrix: 3 × 2 of type int

¿Qué son las matrices en estadística Big Data?

Aprende más sobre el Big Data

En este post te hemos explicado qué son las matrices en estadística Big Data, algunas de sus funciones y cómo realizar operaciones con ellas. No obstante, este tipo de conocimiento exige de una práctica constante para desarrollarse adecuadamente. Por ello, te aconsejamos practicar por medio del método de ensayo y error hasta que te conviertas en un experto.

Para ello, desde KeepCoding te ofrecemos nuestro Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning. En él aprenderás todo lo necesario sobre el entorno de programación mientras trabajas con Apache Spark a partir de la base (procesos de información textual), conteo de palabras, listas top N, operaciones con conjuntos… En suma, aprenderás sobre fuentes de datos múltiples, visualización de relaciones entre valores numéricos (diagramas de dispersión, regresión y clustering), de tipos de datos específicos, como geográficos o mapas de calor, etc. ¡Apúntate ahora y no esperes más para empezar!

Posts Relacionados

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado