Hoy en día, resulta ineludible la cantidad de datos que se generan de forma automática y, por tanto, surge la necesidad de implementar dinámicas para la preparación y gestión de datos. Una de estas herramientas para el manejo del Big Data son las variables en Talend Open Studio.
De hecho, la plataforma de Talend Open Studio (TOS) se ha convertido en una de las más implementadas en cuanto al uso del proceso ETL (extract, transform, load) para la manipulación de los macrodatos. Por este motivo, en este post, te exponemos cuáles son las variables en Talend Open Studio y cómo funciona cada una de ellas.
¿Cuáles son las variables en Talend Open Studio?
Cuando se habla de las variables en Talend Open Studio se hace referencia a los parámetros que deben tener en cuenta una vez se va trabajar con los jobs y lo subjos en la plataforma, puesto que estas se establecen para definir ciertas conexiones entre la base de datos. Por otra parte, también pueden ayudar a reutilizar componentes, por lo que se ahorra tiempo y trabajo en el procesamiento de los macrodatos.
Dentro de las variables en Talend Open Studio podrás contar con dos gran grupos: las variables de contexto y las variables globales. Cada una de ellas te facilitará la gestión de los archivos de una manera diferente, por ello, a continuación te exponemos sus principales características y funciones.
Variables de contexto
El primer grupo de variables en Talend Open Studio es el de las variables de contexto. Este grupo consta de los parámetros preestablecidos en el escenario de los subjobs.
¿Qué es un contexto en Talend?
Puedes entender un contexto como un conjunto de parámetros que definen un escenario de ejecución del subjob. Por ejemplo, se utiliza mucho para definir una conexión de base de datos, determinar cómo pasar valores de ejecución (ejercicio, por ejemplo) o establecer un determinado filtro, etc.
¿Cómo generamos un contexto?
La fórmula no difiere en absoluto a la de creación de otros elementos en el repositorio de Talend Open Studio. De hecho, un contexto en el repositorio te permitirá disponer de un conjunto de parámetros que pueden reutilizarse.
Por otra parte, también podrás generar contextos desde el propio componente del job.
Variables globales
Por otra parte, dentro de las variables en Talend Open Studio también se encuentran las variables globales. A diferencia de las variables de contexto, que funcionan como parámetros preestablecidos, las variables globales se generan y utilizan de forma dinámica dentro del proceso de un job.
Para generar estas variables podrás utilizar dos componentes totalmente diferentes, pero con resultados similares:
- Por medio del componente tFlowToIterate.
- A través del componente tSetGlobalVariables.
Componente tFlowToIterate
Este componente cambia el tipo de flujo de tipo «main» a tipo «iterate». Es decir, cambia el tipo de flujo de tal forma que, en vez de enviar el caudal de datos de golpe, lo frena y lo entrega registro a registro.
A continuación, te mostramos un breve ejemplo:
Componente tSetGlobalVariables
Este componente funciona de forma similar al anterior, sin embargo, incluye manualmente las claves de cada campo.
Para ello, en el campo variables, tendrás que hacer clic en el +. A partir de allí, vas a ir añadiendo los nombres de las variables, que en este ejemplo son Key_name y key_mail. Por último, como valor, pondrás el nombre del flujo, que en este caso es row1, un punto y el nombre del campo; es decir: row1.name y row1.mail.
Como has notado, el proceso es un poco más manual. El resultado son las cargas de los datos con las variables que en el ejemplo se han llamado: Key_name y Key_mail.
En el transcurso de este post, te hemos expuesto cuáles son y cómo funcionan las variables en Talend Open Studio, de manera que has podido identificar cómo se pueden implementar en tus proyectos de estudio de macrodatos. Debes tener en cuenta cada una de estas variables una vez vayas a trabajar con los jobs y los subjobs en Talend Open Studio (TOS), puesto que son un aspecto de suma importancia.
De igual forma, si lo que planeas es aumentar tu conocimiento y poner a prueba todas tus destrezas en el mundo del Big Data, desde KeepCoding te recomendamos el Bootcamp Full Stack Big Data, Inteligencia Artificial y Machine Learning. Aquí, hallarás un total de 11 módulos, entre los que se encuentran algunos como Big Data 101, Data Mining o Machine Learning 101. Cada uno de ellos te preparará para una gran cantidad de lenguajes, sistemas y herramientas. ¡Anímate a continuar con el aprendizaje Big Data y matricúlate!