Definir la arquitectura de origen y destino en Talend Data Integration es un proceso que, si bien no es complicado, requiere algunos cuidados que van a permitir su correcta creación y ejecución.
A continuación, te mostraremos lo que debes hacer para definir la arquitectura de origen y destino en Talend Data Integration
¿Qué encontrarás en este post?
Toggle¿Qué es Data Integration?
Data Integration o integración de datos es un proceso en el que se combinan datos de diferentes fuentes en un solo lugar donde pueden ser observados y analizados.
Este procedimiento posee varios pasos, entre ellos la limpieza, el mapeo de ETL y la transformación, que concluye en una inteligencia de negocios procesable producida por la Arquitectura de origen y destino en Talend Data Integration.
La integración de datos generalmente no tiene un encauzamiento específico, pero algunas soluciones de integración de datos poseen elementos como fuentes de datos, servidores maestros y clientes que acceden a los datos desde el servidor maestro.
Arquitectura de Talend Data Integration
La arquitectura de origen y destino en Talend Data Integration posee varios bloques:
Clientes
Este bloque permite generar y hacer supervisión de trabajos de Talend. Los estudios pueden ser diversos y el navegador web puede estar en una misma máquina o en diferentes.
En este bloque también se puede realizar el proceso de integración de datos sin importar cuán grande sea su volumen, ya que la complejidad soportada por el programa es bastante alta.
Servidor
En este bloque se aloja el servidor de aplicaciones web y se ejecutan los procesos de administración, gestión y supervisión. Los metadatos de administración producidos se almacenan en la base de datos de administración.
Bases de datos
La arquitectura de origen y destino en Talend Data Integration posee entre sus componentes una base de datos. Esta BD se utiliza para almacenar los metadatos y la información de configuración; algunos de esos metadatos corresponden a cuentas de usuario, derechos de acceso y autorización de proyectos.
Las bases de datos de auditoría se usan para comprobar la evolución y desarrollo de los distintos trabajos, así pues, se implementa un estudio y se desarrolla en el estudio Talend.
Repositorios
En los repositorios se alojan los metadatos y binarios del proyecto. También se incluyen el servidor SVN o Git y el repositorio Nexus.
El SVN se utiliza para centralizar elementos del proyecto que se comparte entre los usuarios finales.
Nexus se usa para verificar la posibilidad de descargar o no las actualizaciones de software.
Servidor de ejecución
Se utiliza para apoyar la parte final de los proyectos, es decir, la implementación y lanzamiento de los trabajos.
La arquitectura de origen y destino en Talend Data Integration puede hacer uso de uno o más servidores de ejecución.
Arquitectura de origen y destino en Talend Data Integration
Lo primero que tendremos que hacer es decirle a Talend cuál es el origen y cuál es el destino de carga de los datos que se van a implementar. Para ello, abriremos la pestaña de Metadata, ubicada en la parte izquierda de la pantalla, seleccionaremos la utilidad «Db Connections», hacemos clic en el botón derecho contextual y seleccionamos la opción «Crear Conexión»:
Nos aparecerá un cuadro de diálogo para personalizar la conexión. Crearemos el origen primero, al cual llamaremos «Hospital» (en otros artículos ya hemos trabajado con la base de datos de recetas médicas), y luego le daremos «Next»:
En DB Type pondremos PostgresSQL, en DB Version ponemos v9 and later y, acto seguido, pondremos nuestros datos de login. Vamos a probar nuestra conexión:
Lo bueno de Talend es que no necesita un driver para la integración de datos de la base de datos. En caso de necesitarlo, va directamente y lo descarga desde el navegador web que tengamos instalado en nuestros sistemas operativos.
Por último le daremos en «Finish».
Este es el paso a paso para la conexión origen; ahora se hará lo mismo con la conexión destino: Metadata/DB Connections/Crear conexión. En DB Type pondremos Oracle, que será nuestra conexión destino, y en DB Version podremos Oracle 12.
Posteriormente, digitaremos los datos de inicio de sesión. Probamos la conexión y le damos a «Finish».
¿Qué sigue?
Ahora ya sabes cómo funciona la arquitectura de origen y destino en Talend Data Integration. Recuerda que esta es una de las temáticas que aborda nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, al cual puedes inscribirte para seguir aprendiendo de mano de profesionales que te guiarán en tu proceso. ¿A qué esperas para convertirte en el mejor y cambiar tu vida? ¡Anímate a solicitar información ahora!