Importar y agregar datasets en Trifacta

Contenido del Bootcamp Dirigido por: | Última modificación: 18 de abril de 2024 | Tiempo de Lectura: 2 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

En otro post hemos visto cómo crear un flow en Trifacta, pero estos flows deben llenarse con Datasets. Por esto, en este artículo, veremos cómo importar y agregar datasets en Trifacta.

Un dataset es un conjunto de datos perteneciente a la gestión de datos, que se presenta en patrón tabular. Cada columna corresponde a una variable y cada fila representa un conjunto de datos.

Datasets en Trifacta

Los datasets en Trifacta son conjuntos de datos que se muestran en cualquier sistema de almacenamiento de datos estructurados. Existen varios tipos de datasets, los cuales podrás consultar más ampliamente en nuestro artículo sobre qué son los datasets.

Una vez creado el flow al que nombramos «Empresas», vamos a agregar e importar los datasets en Trifacta. Para ello, haremos clic en el botón que aparece en la mitad de la pantalla, que dice Import & Add Datasets:

datasets en trifacta 1

Posteriormente, elegimos el fichero llamado Empresas:

datasets en trifacta 2

Lo abrimos y esperamos a que se procese y analice:

datasets en trifacta 3

Una vez que se procese y analice, le damos a Import & Add to Flow:

datasets en trifacta 4

Cuando haya terminado de importarse, nos aparecerá una ventana como la que se muestra a continuación:

datasets en trifacta 5

Tipos de datasets en Trifacta

Existen diferentes tipos de datasets o conjuntos de datos para diferentes tipos de información. Estos son:

  • Datasets numéricos: también denominados datos cuantitativos. Corresponden a datos como la edad de una persona, recuento de afecciones que tiene alguna persona, número de páginas de un informe o libro…
  • Datasets bivariados: poseen dos variables. Las variables son dos conjuntos de datos de cualquier tipo y funcionan igual que las variables en programación.
  • Datasets multivariados: son igual que los anteriores, pero estos poseen más de dos variables.
  • Datasets categóricos: son variables dicotómicas, por ejemplo, el género de una persona, estrato socioeconómico o el estado civil, entre otras.
  • Datasets de correlación: son conjuntos de datos que tienen alguna correlación entre sí. La correlación es la asociación que existe entre dos variables y evalúa la tendencia creciente o decreciente de los datos.

¿Qué sigue?

Ahora ya sabes qué son los datasets, cuáles son los tipos que existen y cómo se importan y agregan datasets en Trifacta. Los datasets forman parte del conjunto de datos que deben ir unidos a un flujo de datos.

Si quieres seguir aprendiendo sobre Big Data, no dudes en inscribirte en nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, con el que te convertirás en un experto en unos pocos meses. ¡Inscríbete ya y dale un giro a tu vida!

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado