Importar y agregar datasets en Trifacta

Autor: | Última modificación: 6 de octubre de 2022 | Tiempo de Lectura: 2 minutos
Temas en este post:

En otro post hemos visto cómo crear un flow en Trifacta, pero estos flows deben llenarse con Datasets. Por esto, en este artículo, veremos cómo importar y agregar datasets en Trifacta.

Un dataset es un conjunto de datos perteneciente a la gestión de datos, que se presenta en patrón tabular. Cada columna corresponde a una variable y cada fila representa un conjunto de datos.

Datasets en Trifacta

Los datasets en Trifacta son conjuntos de datos que se muestran en cualquier sistema de almacenamiento de datos estructurados. Existen varios tipos de datasets, los cuales podrás consultar más ampliamente en nuestro artículo sobre qué son los datasets.

Una vez creado el flow al que nombramos «Empresas», vamos a agregar e importar los datasets en Trifacta. Para ello, haremos clic en el botón que aparece en la mitad de la pantalla, que dice Import & Add Datasets:

datasets en trifacta 1

Posteriormente, elegimos el fichero llamado Empresas:

datasets en trifacta 2

Lo abrimos y esperamos a que se procese y analice:

datasets en trifacta 3

Una vez que se procese y analice, le damos a Import & Add to Flow:

datasets en trifacta 4

Cuando haya terminado de importarse, nos aparecerá una ventana como la que se muestra a continuación:

datasets en trifacta 5

Tipos de datasets en Trifacta

Existen diferentes tipos de datasets o conjuntos de datos para diferentes tipos de información. Estos son:

  • Datasets numéricos: también denominados datos cuantitativos. Corresponden a datos como la edad de una persona, recuento de afecciones que tiene alguna persona, número de páginas de un informe o libro…
  • Datasets bivariados: poseen dos variables. Las variables son dos conjuntos de datos de cualquier tipo y funcionan igual que las variables en programación.
  • Datasets multivariados: son igual que los anteriores, pero estos poseen más de dos variables.
  • Datasets categóricos: son variables dicotómicas, por ejemplo, el género de una persona, estrato socioeconómico o el estado civil, entre otras.
  • Datasets de correlación: son conjuntos de datos que tienen alguna correlación entre sí. La correlación es la asociación que existe entre dos variables y evalúa la tendencia creciente o decreciente de los datos.

¿Qué sigue?

Ahora ya sabes qué son los datasets, cuáles son los tipos que existen y cómo se importan y agregan datasets en Trifacta. Los datasets forman parte del conjunto de datos que deben ir unidos a un flujo de datos.

Si quieres seguir aprendiendo sobre Big Data, no dudes en inscribirte en nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, con el que te convertirás en un experto en unos pocos meses. ¡Inscríbete ya y dale un giro a tu vida!

👉 Descubre más del Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp ¡Descarga el temario!

👉 Prueba el Bootcamp Gratis por una Semana ¡Empieza ahora mismo!

👉 Conoce nuestros otros Bootcamps en Programación y Tecnología

[email protected]

¿Trabajo? Aprende a programar y consíguelo.

¡No te pierdas la próxima edición del Aprende a Programar desde Cero Full Stack Jr. Bootcamp!

 

Prepárate en 4 meses, aprende las últimas tecnologías y consigue trabajo desde ya. 

 

Solo en España hay más de 120.400 puestos tech sin cubrir, y con un sueldo 11.000€ por encima de la media nacional. ¡Es tu momento!

 

🗓️ Próxima edición: 13 de febrero

 

Reserva tu plaza descubre las becas disponibles.