Dentro del desarrollo del Big Data y sus respectivas herramientas para manipularlo, podrás encontrar Hadoop y sus componentes, como YARN. Este sistema se relaciona, principalmente, con el Data Lake y es un gran acercamiento a los softwares para el almacenamiento de datos. Los elementos principales de Hadoop se han convertido en factores imprescindibles para llevar a cabo un repositorio de código abierto.
En este post, te explicamos, de forma breve y concisa, qué es YARN.
¿Qué es YARN?
Como primer acercamiento, el acrónimo YARN significa a Yet Another Resource Negotiator, lo que en español traduce «Otro negociador de recursos más«. Tal como se expone en su nombre, YARN no es más que una capa de control sobre las aplicaciones o comandos que corren sobre la estructura de código abierto Hadoop.
De hecho, esta es una capa muy cercana al HDFS (Hadoop Distributed File System) y de bastante bajo nivel que, además, trabaja de la mano de MapReduce para cumplir con las funciones de Hadoop.
Por otra parte, YARN está hecha en el lenguaje de programación JAVA y se encarga de la gestión alrededor de la capa de cómputo del clúster de Hadoop, como se muestra en la imagen anterior.
¿Qué sucede cuando YARN supervisa una ejecución?
En cuanto a su aplicación, YARN se abastece de dos grandes componentes antes de ceder llegar al contenedor. Dichos componentes son:
- Administrador de recursos: como lo dice su nombre, se basa en la gestión de los recursos del clúster.
- Administradores de nodos: por otra parte, este factor se encarga de la gestión y ejecución de los nodos del clúster.
A continuación, te compartimos una ilustración de cómo deriva su procedimiento durante una aplicación de YARN:
Aprende más sobre Big Data
Por medio de este post, has podido acercarte a qué es YARN como uno de los elementos principales de Hadoop y cómo funciona su esquema supervisando una ejecución. Aún así, ¡todavía falta mucho por aprender al respecto!
Por ello, te aconsejamos nuestro Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning, que te ayudará a desarrollar todos los conocimientos necesarios para cumplir con la tarea principal de un data scientist de identificar las múltiples herramientas, sistemas y lenguajes del manejo de los datos y seleccionar la que más se acople y potencie el estudio de la información. Además, contarás con profesores expertos en el tema y con una amplia trayectoria dentro de este campo. ¡Apúntate ya!