En otro post hemos visto cómo crear un flow en Trifacta, pero estos flows deben llenarse con Datasets. Por esto, en este artículo, veremos cómo importar y agregar datasets en Trifacta.
Un dataset es un conjunto de datos perteneciente a la gestión de datos, que se presenta en patrón tabular. Cada columna corresponde a una variable y cada fila representa un conjunto de datos.
Datasets en Trifacta
Los datasets en Trifacta son conjuntos de datos que se muestran en cualquier sistema de almacenamiento de datos estructurados. Existen varios tipos de datasets, los cuales podrás consultar más ampliamente en nuestro artículo sobre qué son los datasets.
Una vez creado el flow al que nombramos “Empresas”, vamos a agregar e importar los datasets en Trifacta. Para ello, haremos clic en el botón que aparece en la mitad de la pantalla, que dice Import & Add Datasets:
Posteriormente, elegimos el fichero llamado Empresas:
Lo abrimos y esperamos a que se procese y analice:
Una vez que se procese y analice, le damos a Import & Add to Flow:
Cuando haya terminado de importarse, nos aparecerá una ventana como la que se muestra a continuación:
Tipos de datasets en Trifacta
Existen diferentes tipos de datasets o conjuntos de datos para diferentes tipos de información. Estos son:
- Datasets numéricos: también denominados datos cuantitativos. Corresponden a datos como la edad de una persona, recuento de afecciones que tiene alguna persona, número de páginas de un informe o libro…
- Datasets bivariados: poseen dos variables. Las variables son dos conjuntos de datos de cualquier tipo y funcionan igual que las variables en programación.
- Datasets multivariados: son igual que los anteriores, pero estos poseen más de dos variables.
- Datasets categóricos: son variables dicotómicas, por ejemplo, el género de una persona, estrato socioeconómico o el estado civil, entre otras.
- Datasets de correlación: son conjuntos de datos que tienen alguna correlación entre sí. La correlación es la asociación que existe entre dos variables y evalúa la tendencia creciente o decreciente de los datos.
¿Qué sigue?
Ahora ya sabes qué son los datasets, cuáles son los tipos que existen y cómo se importan y agregan datasets en Trifacta. Los datasets forman parte del conjunto de datos que deben ir unidos a un flujo de datos.
Si quieres seguir aprendiendo sobre Big Data, no dudes en inscribirte en nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, con el que te convertirás en un experto en unos pocos meses. ¡Inscríbete ya y dale un giro a tu vida!