¿Qué son las matrices en estadística Big Data?

Autor: | Última modificación: 20 de julio de 2022 | Tiempo de Lectura: 3 minutos
Temas en este post:

Hoy en día, se generan una gran cantidad de datos de manera simultánea y masiva, por ello es importante contar con herramientas como las matrices en estadística Big Data, gracias a las que se facilita la organización de los datos.

En efecto, dominar cada una de estas opciones forma parte de la tarea de un data scientistConocer este tipo de estrategias para la resolución de los problemas con los datos mejorará tu trabajo. Por ello, en este post, te presentamos qué son las matrices en estadística Big Data.

¿Qué son las matrices en estadística Big Data?

Las matrices en estadística Big Data se conocen como un tipo de organización de los datos, de manera que sea mucho más comprensible el procesamiento de la información y los resultados arrojados.

Ahora, podrás crear matrices con la función matrix. Así, esta se comporta como parámetros de entrada que recibe un vector y el número de columnas (ncol) o filas (nrow). Por otra parte, existe un parámetro opcional (byrow), gracias al que se indica si la matriz se va a rellenar por filas o por columnas (valor por defecto).

1:12
  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10
  11. 11
  12. 12

In [133]:

m1<-matrix(c(1:12),ncol=3)
m1

A matrix: 4 × 3 of type int

¿Qué son las matrices en estadística Big Data? 1
?matrix

In [135]:

m2<-matrix(c(1:12),ncol=3,byrow=T)
m2

A matrix: 4 × 3 of type int:

¿Qué son las matrices en estadística Big Data? 2

La dimensión del array se puede ver con la función dim() o con str():

dim(m1)
  1. 4
  2. 3
length(m1)

12

str(m2)
 int [1:4, 1:3] 1 4 7 10 2 5 8 11 3 6 ...

Acceso a las matrices en estadística Big Data

En cuanto al acceso, este se realiza igual que como funciona con los vectores. Sin embargo, en esta oportunidad, podrás contar con dos dimensiones. A continuación, te mostramos un breve ejemplo:

m1[1,3]

9

m1[,2]
  1. 5
  2. 6
  3. 7
  4. 8

En suma, también podrás dar nombres a las filas y columnas para luego poder acceder utilizando el nombre.

?paste0
paste0("row",1:4)
  1. ‘row1’
  2. ‘row2’
  3. ‘row3’
  4. ‘row4’
colnames(m1)<-paste0("col",1:3)
rownames(m1)<-paste0("row",1:4)
m1

A matrix: 4 × 3 of type int:

¿Qué son las matrices en estadística Big Data? 3
paste("El valor de 'row1' y 'col3' es:",m1["row1","col3"])

‘El valor de \’row1\’ y \’col3\’ es: 9′.

m1["row1",]
¿Qué son las matrices en estadística Big Data? 4

Las funciones colnames y rownames.

colnames(m1)
  1. ‘col1’
  2. ‘col2’
  3. ‘col3’

Operaciones con matrices

Las matrices en estadística Big Data también pueden prestarse para realizar ciertas operaciones, como las que te presentamos a continuación por medio de un ejemplo:

Álgebra lineal básica

m1

A matrix: 4 × 3 of type int

¿Qué son las matrices en estadística Big Data? 5

Transpuesta

t(m1)

A matrix: 3 × 4 of type int

¿Qué son las matrices en estadística Big Data? 6

Suma de constante

m1+10

A matrix: 4 × 3 of type dbl:

¿Qué son las matrices en estadística Big Data? 7

Suma de matrices

m1+m2

A matrix: 4 × 3 of type int

¿Qué son las matrices en estadística Big Data? 8

Multiplicación de matrices

m1 %*% matrix(rep(1,12),nrow=3)

A matrix: 4 × 4 of type dbl

¿Qué son las matrices en estadística Big Data? 9
rep("a",5)
  1. ‘a’
  2. ‘a’
  3. ‘a’
  4. ‘a’
  5. ‘a’

Submatrices

m1[2:4,2:3]

A matrix: 3 × 2 of type int

¿Qué son las matrices en estadística Big Data? 10
m1[c(3,2,4),2:3]

A matrix: 3 × 2 of type int

¿Qué son las matrices en estadística Big Data? 11

Aprende más sobre el Big Data

En este post te hemos explicado qué son las matrices en estadística Big Data, algunas de sus funciones y cómo realizar operaciones con ellas. No obstante, este tipo de conocimiento exige de una práctica constante para desarrollarse adecuadamente. Por ello, te aconsejamos practicar por medio del método de ensayo y error hasta que te conviertas en un experto.

Para ello, desde KeepCoding te ofrecemos nuestro Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning. En él aprenderás todo lo necesario sobre el entorno de programación mientras trabajas con Apache Spark a partir de la base (procesos de información textual), conteo de palabras, listas top N, operaciones con conjuntos… En suma, aprenderás sobre fuentes de datos múltiples, visualización de relaciones entre valores numéricos (diagramas de dispersión, regresión y clustering), de tipos de datos específicos, como geográficos o mapas de calor, etc. ¡Apúntate ahora y no esperes más para empezar!

👉 Descubre más del Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp ¡Descarga el temario!

👉 Prueba el Bootcamp Gratis por una Semana ¡Empieza ahora mismo!

👉 Conoce nuestros otros Bootcamps en Programación y Tecnología

[email protected]

¿Sabías que hay más de 5.000 vacantes para desarrolladores de Big Data sin cubrir en España? 

En KeepCoding llevamos desde 2012 guiando personas como tú a áreas de alta empleabilidad y alto potencial de crecimiento en IT con formación de máxima calidad.

 

Porque creemos que un buen trabajo es fuente de libertad, independencia, crecimiento y eso ¡cambia historias de vida!


¡Da el primer paso!