La ofuscación en Talend es una operación muy útil cuando hay datos personales en una base de datos que no queremos que sean visibles. Lo que se logra por medio de la ofuscación en Talend es que no se vea la información real y para ello se aplica un data masking. A continuación te explicamos en qué consiste la ofuscación en Talend, qué métodos hay y cómo aplicarlo.
¿En qué consiste la ofuscación en Talend?
La ofuscación consiste en reemplazar información considerada como importante, de alta prioridad o confidencial, con datos que parecen información real, haciendo que esta sea completamente inútil para personas o entidades con malas intenciones.
Se utiliza principalmente en el área de testing y desarrollo: los desarrolladores y testers requieren de datos realistas para crear y probar software, pero no necesitan ver información que sea cien por ciento verídica.
Métodos de ofuscación en Talend
Existen tres métodos o técnicas que se pueden aplicar para la ofuscación en Talend, estos son:
Data masking o enmascaramiento de datos
Esta técnica consiste en crear distintas versiones de los datos con una estructura similar. Lo que cambia no es el tipo de datos, sino el valor de los mismos. Al proceso de enmascaramiento también se le conoce como data scrambling, data blinding o data shuffling. La eliminación de datos como el ID de los datos confidenciales se conoce como anonimización de datos o desinfección de datos.
Tipos de enmascaramiento de datos
- Enmascaramiento de datos estáticos: en este tipo de data masking se enmascaran los datos en la base de datos original y luego se copian en un entorno o desarrollo de prueba. Esto permite compartir la base de datos con diferentes entidades no autorizadas, en caso de ser necesario.
- Enmascaramiento de datos dinámicos o DDM (Dynamic Data Masking): es una técnica más avanzada que la anterior, en la que se mantienen dos conjuntos de datos en la misma base de datos. Estos son los datos originales, que son confidenciales, y una copia que está enmascarada. Los usuarios habituales ven la copia enmascarada de los datos y solo ciertos roles que estén autorizados tienen acceso a la copia real de los datos.
Data encryption o cifrado de datos
El cifrado de datos utiliza métodos criptográficos. Generalmente son sistemas de claves para codificar los datos, haciendo que estos sean completamente inutilizables hasta que son descifrados. Este cifrado es bastante seguro, pero tiene un inconveniente: cuando los datos se cifran, no pueden manipularse ni utilizarse para análisis.
Este tipo de ofuscación se utiliza muchísimo cuando se requiere guardar o transferir datos confidenciales de forma que estos lleguen seguros a su lugar de destino.
Data tokenization o tokenización de datos
Esta técnica consiste en reemplazar ciertos datos con valores incoherentes. El arma de doble filo de este método es que los usuarios autorizados pueden conectar el token a los datos originales, lo que hace que en este modo existan posibilidades de que los datos sean revelados, pero también hace posible el manejo de los mismos y su análisis, de ser necesario.
No obstante, no es tan sencillo como decir «vamos a utilizar un programa para recuperar los datos», porque los datos reales nunca salen de la organización ni pueden ser vistos ni descifrados por un procesador de terceros
La tokenización se utiliza principalmente en transacciones de tipo financiera, en donde no hay necesidad de transmitir números de tarjeta de crédito a un procesador externo.
Cómo aplicar la ofuscación en Talend
Vamos a aplicar el proceso de ofuscación en Talend sobre las columnas de nombre y apellido de la base de datos «Potenciales_Clientes». Para ello, vamos a seleccionar ambas columnas y vamos a poner en el cuadro de búsqueda del recuadro de sugerencias, ubicado en el lado derecho de la pantalla, la sentencia «Mask data (ofuscation)». Nos aparece cómo nos van a quedar los campos; antes eran así:
Y ahora quedarán así:
¿Quieres seguir aprendiendo?
Ya has descubierto qué es la ofuscación en Talend y cuál es su relación con el data masking, la técnica que aplicamos para el ofuscamiento de los datos alojados en la base de datos con la que hemos trabajado en este y otros artículos. La ofuscación en Talend es un proceso de primordial relevancia a la hora de proteger los datos importantes, ya que evita que personas malintencionadas hagan uso de los datos de manera errónea.
Si te ha gustado aprender sobre este tema, recuerda que puedes seguir alimentando tu curiosidad con los conocimientos que te brindamos en nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, donde podrás, en poco tiempo, aprender lo necesario para incursionar en el mercado laboral tecnológico. ¡Te esperamos!