Glosario de 4 términos relacionados con el machine learning

| Última modificación: 31 de julio de 2024 | Tiempo de Lectura: 3 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

Existen muchos términos relacionados con el machine learning. En este artículo, te mostraremos 4 términos que son de los más usados y que deberías conocer si quieres incursionar en este mundillo: la clasificación, la regresión, el aprendizaje no supervisado y la generalización. Este último es uno de los términos relacionados con el machine learning con más importancia, ya que resume todo lo que debemos saber y entender acerca de esta disciplina.

Términos relacionados con el machine learning

Clasificación y regresión

La clasificación y la regresión son términos relacionados con el machine learning y tienen que ver con los algoritmos de aprendizaje supervisado y con los modelos de aprendizaje automático y aprendizaje profundo.

En la clasificación, por un lado, existe una variable objetivo, que es una variable discreta. Un ejemplo de clasificación sería: es apto/no es apto, alto/medio/bajo, etc. La regresión logística es un tipo de algoritmo que opera para la clasificación.

La regresión, por su parte, posee una variable objetivo y es continua. Un ejemplo de regresión sería la nota de un examen. La regresión lineal es un tipo de algoritmo que opera con clasificación.

Variables continuas y discretas

Las variables continuas y discretas son dos tipos de variables cuantitativas. Las variables discretas hacen referencia a aquellas variables en las que no se puede tomar ningún valor entre dos consecutivos; además, se encuentran dentro de un conjunto de valores finitos definidos de manera previa.

Las variables continuas son las variables en las que se puede tomar cualquier valor dentro de un intervalo infinito de valores. Por este motivo, en este tipo de variables se incluyen números decimales y fracciones.

términos relacionados con el machine learning

Aprendizaje no supervisado

El aprendizaje no supervisado entra en el glosario de términos relacionados con el machine learning y consiste en aprender sobre p, teniendo en cuenta que p puede ser un valor cualquiera dentro de un conjunto de datos.

El proceso de clustering, por ejemplo, es aprendizaje no supervisado. En este vamos a ver un patrón, que puede estar basado en distancias, en la forma que tienen los puntos… El objetivo del aprendizaje no supervisado es detectar patrones sobre los datos o conjuntos de datos que tengamos.

{x(i)} α p (x)

Generalización

La generalización entra en el glosario de términos relacionados con el machine learning y, a grandes rasgos, es en lo que consiste esta disciplina.

La generalización hace referencia a la capacidad de un modelo de adaptarse de manera óptima y eficiente a datos que nunca ha visto, datos nuevos que se vayan ingresando.

En la generalización no solo buscamos que el entrenamiento tenga buen resultado, es decir, no solo es importante que en las instancias que conocemos, con los datos que tenemos de x, consigamos y:

fω (x(i)) ≈ y(i)

También es importante que lo tenga el subconjunto de test, o sea, que cuando tengamos nuevas instancias que el algoritmo no ha visto previamente, esto funcione bien:

fω (x(new)) ≈ y(new)

Realmente lo que nos interesa es esta última fórmula. La fórmula anterior no es tan importante porque nosotros ya tenemos esos valores, lo relevante de verdad es que el algoritmo sea capaz de determinar el lugar que debe ocupar cada nueva instancia que llegue.

La generalización, uno de los términos relacionados con el machine learning con más importancia, pretende demostrar lo bien que ha sido entrenado un modelo para clasificar o pronosticar datos o valores no brindados con anterioridad.

Sesgo y varianza

Otros de los términos relacionados con el machine learning que influyen en un modelo generalizado son el sesgo y la varianza, así como el overfitting y el underfitting.

  • La varianza es la variedad de valores de predicción hechos por un modelo (función objetivo).
  • El sesgo es la distancia de las predicciones de los valores objetivo reales o verdaderos. Que un modelo está muy sesgado implica que sus valores de predicción están lejos de los valores reales.

Estos son solo algunos de los términos relacionados con el machine learning. Existen muchos otros y tienes la oportunidad, no solo de aprenderlos, sino de entenderlos todos por medio de nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, una formación intensiva en la que podrás adquirir todas las herramientas y conocimientos necesarios para empezar tu recorrido por el mundo tech. En KeepCoding tenemos a los mejores profesionales para que te guíen en tus objetivos y puedas lograr tus metas. ¡Solicita ya información!

Sandra Navarro

Business Intelligence & Big Data Advisor & Coordinadora del Bootcamp en Data Science, Big Data & Machine Learning.

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado