Dentro de los diferentes tipos de directorios que ofrece Hadoop como estructura de software, se encuentra el directorio etc. Cada uno de ellos posee distintas características y desempeña múltiples funciones específicas, además de ser muy importantes en el desarrollo de esta plataforma.
El directorio etc destaca por la cantidad de funciones que abarca y desempeña para la facilitación en el procesamiento de los datos. Ahora, en este post, te presentamos qué es el directorio etc y cuáles son sus principales características y ventajas dentro del mundo Big Data.
¿Qué es un directorio en Hadoop?
Se conoce como un directorio en Hadoop a una especie de contenedor en el que se agrupan los ficheros de configuración de la biblioteca de software Hadoop.
Gracias a que dicha estructura de código abierto es un sistema distribuido de almacenamiento de ficheros, la plataforma requiere de una organización de sus ficheros, principalmente, de los configurables; esta es la razón por la que existen los directorios como una estructura jerárquica.
Ahora, un directorio en Hadoop cuenta con determinados ejecutables y, según su función, se establece una clasificación. Dentro de estos directorios, podrás encontrar al directorio etc.
¿Qué es el directorio etc?
El directorio etc es uno de los directorios más importantes en Hadoop, ya que consta de la gran parte de los ficheros de configuración, principalmente, los que están ubicados dentro de Hadoop.
Sin embargo, este directorio también administra los archivos de configuración para los programas y aplicaciones que se van instaurando en la biblioteca de software.
- core-site.xml: con este fichero de configuración podrás editar el directorio de HDFS dentro del localhost de Hadoop.
- yarn-site.xml: este fichero configura la distribución de recursos de búsqueda que maneja Hadoop, es decir, el YARN (Yet Another Resource Negotiator).
Principales características del directorio etc
Por otra parte, el directorio etc posee ciertas características que lo convierten en uno de los directorios más importantes. A continuación te compartimos sus principales características:
- Relación con el sistema operativo: la razón principal por la que es uno de los directorios más importantes radica en que sus ejecutables se realizan directamente al sistema operativo de Hadoop, específicamente, en el localhost.
- Configuración de programas instalados: este directorio también te ofrece la alternativa de aportar ejecutables en los programas y aplicaciones que vayan instalándose en la biblioteca de software.
- No trabaja con archivos binarios: el directorio etc no debe contener datos binarios, puesto que es un contenedor complejo y, por tanto, trabaja con ficheros más avanzados, como los de configuración.
- Contiene los ficheros más importantes: en este directorio podrás encontrar los ficheros de configuración más relevantes, como core-site.xml y yarn-site.xml. Estos se centran en la modificación del localhost y de YARN (Yet Another Resource Negotiator) de Hadoop.
¿Cuál es el siguiente paso para seguir aprendiendo sobre Big Data?
En este post has podido familiarizarte con qué es el directorio etc y cuáles son sus principales características y ventajas en el mundo Big Data. Aun así, este directorio es tan solo uno de la gran variedad con la que podrás contar en la plataforma. Por ello, desde KeepCoding te aconsejamos instruirte en los demás, lo que también te ayudará a comprender la relevancia del directorio etc.
Para ello, tu mejor opción es el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning, donde, en muy pocos meses, podrás aprender sobre estos componentes y muchos más. Contarás con la realización de los desarrollos tanto técnicos como analíticos necesarios dentro del mundo del Big Data. Dentro de ellos, encontrarás módulos como el Data Mining, Machine Learning, Big Data Architecture o Spark & Scala, entre varios otros. ¡No esperes más para apuntarte!