Crear destino de carga en Talend Open Studio sin modelo físico

| Última modificación: 17 de julio de 2024 | Tiempo de Lectura: 3 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

Seguramente ya sabrás cómo definir arquitectura de origen y destino de carga en Talend Open Studio. En ese post, trabajamos con una base de datos de destino denominada Stage, la cual poseía las tablas físicas sin los datos, pero el modelo físico ya estaba construido.

Pero ¿qué pasaría si nuestro destino no tuviera ni siquiera las tablas creadas? ¿Y si no existiera un modelo físico para el destino? Esto es posible utilizando el componente de Talend Open Studio, que permite desde la interfaz de usuario extraer algunos datos y crear un destino de carga en Talend Open Studio.

¿Qué es un modelo físico?

Un modelo físico de datos es una representación del modelo que se usará para crear la base de datos. En el modelo se incluyen todo tipo de datos, como nombre de columnas, tipo de datos de cada una de ellas y sus restricciones, llaves primarias y foráneas, relaciones entre tablas, etc.

Destino de carga en Talend Open Studio

Lo primero que tendremos que hacer para crear una conexión de destino de carga en Talend Open Studio es generar una conexión para el destino.

Antes estábamos trabajando con el destino Stage; ahora, tendremos que alojar esa conexión de destino de carga en Talend Open Studio en otro lugar, es decir, en la base de datos LAB, que ya teníamos también creada previamente.

Por tanto, la conexión la crearemos desde el árbol de opciones de repositorio. Allí seleccionaremos la opción Db Conections y hacemos clic en crear conexión:

destino de carga en talend open studio: paso 1

En el recuadro rellenaremos los datos correspondientes a:

  • Db Version: Oracle 12
  • Login: lab
  • Contraseña:
  • Server: localhost
  • Puerto: 1521
  • Sid: orcl

El sid es una instancia de la base de datos con la que puedes conectarte y acceder a esta.

Le das a finish y ya está la conexión donde se va a alojar el destino de carga en Talend Open Studio.

destino de carga en talend open studio: paso 2

Posteriormente, crearemos un job que nombraremos Carga_Tabla_medico_Lab.

Para llenar el job en la primera parte, es decir, en la del origen, el procedimiento es el mismo: la integración de datos se hace por medio de flujos de datos que ponen en común conjuntos de datos.

Así pues, arrastramos la tabla de la base de datos de origen hacia el panel de trabajo del job y lo personalizamos con las mismas características que un job normal. El resultado será el siguiente:

destino de carga en talend open studio: paso 3

Como en el destino de carga en Talend Open Studio no tenemos la tabla, lo que tenemos que hacer es arrastrar directamente la conexión. A esta conexión le vamos a permitir definir las características habituales de una conexión normal, de tal modo que quedará con parámetros de salida:

destino de carga en talend open studio: paso 4

Unimos ambos componentes haciendo clic derecho en el botón “Fila/Main” y, posteriormente, nos dirigimos a la pestaña de “Components”, ubicada en la parte media de la pantalla.

Allí podemos observar que en el origen tenemos toda la información de la tabla:

destino de carga en talend open studio: paso 5

Sin embargo, en el destino de carga en Talend Open Studio no tenemos nombre de tabla:

destino de carga en talend open studio: paso 6

En el siguiente paso, le diremos al programa que el nuevo nombre de tabla es “medico” y le vamos a añadir una acción a esa tabla, que es crear la tabla, en caso de que no existiera ya. Es decir, la acción es un insert, pero solo si la tabla no existe todavía:

destino de carga en talend open studio: paso 7

Acto seguido, vamos a ejecutar el job:

destino de carga en talend open studio: paso 8

Pueden presentarse algunos problemas con la asimilación de los tipos de datos del destino de carga en Talend Open Studio. Oracle no es capaz de asimilar los tipos de datos de la tabla “medico”, incluida en la base de datos de destino, que en nuestro caso es “Hospital”:

destino de carga en talend open studio: paso 9

Si nos vamos directamente a la base de datos de Oracle en SQL Developer, podemos verificar que dentro de la base de datos se ha creado la tabla, pero los tipos de datos no corresponden:

destino de carga en talend open studio: paso 10

Para solucionar este problema, vamos a ponerle una longitud mayor a los VARCHAR. De este modo, el problema de destino de carga en Talend Open Studio quedará solucionado:

destino de carga en talend open studio: paso 11

¿Qué sigue después?

Ya sabes cómo crear un destino de carga en Talend Open Studio sin tener ningún modelo físico de destino creado previamente. Para ello, creamos una conexión donde se guardaría el modelo de destino y, posteriormente, el job para alojar ambos orígenes y poder entrelazarlos. También hemos llenado los jobs y hemos hecho las modificaciones pertinentes en los tipos de datos para que estos concordaran entre una base de datos y otra.

La temática abordada forma parte de nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, al que te recordamos que puedes acceder para seguir aprendiendo y convertirte en un experto del Big Data. ¿Quieres cambiar tu vida? ¡Apúntate!

Sandra Navarro

Business Intelligence & Big Data Advisor & Coordinadora del Bootcamp en Data Science, Big Data & Machine Learning.

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado