¿Qué es MLOps? [Guía completa]

Autor: | Última modificación: 21 de enero de 2022 | Tiempo de Lectura: 2 minutos
Temas en este post:

MLOps es una de las nuevas tendencias en Big Data y para entender mejor de qué va esto, hemos tenido en un webinar a Fran Algaba, Data Scientist en BBVA Next Tecnologies, hablándonos sobre los detalles y aplicaciones de MLOps.

Antes de entrar en materia, queremos dejar claro de qué hablamos cuando decimos MLOps y es de las Operaciones de Machine Learning o aprendizaje automatizado.

¿Qué es MLOps?

MLOps es una extensión de la metodología DevOps que busca incluir activos de aprendizaje automático y ciencia de datos como ciudadanos de primera clase dentro de la ecología DevOps. Dentro de MLOps existen tres niveles de implementación de Machine Learning:

  • Data: datos, fase, ingestión, curado, etc.
  • Model: ​testing​, evaluación de los modelos, empaquetado y cómo se van a despegar.
  • Code: el código, donde se ejecuta todo el modelo en sí.

¿Por qué empezar a aplicar MLOps?

En la actualidad, nos encontramos en un mundo orientado a datos, que está vinculado a la cantidad exponencialmente creciente de los mismos, recogidos digitalmente. Además, nos encontramos con la ascendente importancia de la Inteligencia Artificial y la Ciencia de Datos, que se deriva de esta tremenda cantidad de información generada.

Dependiendo de todos ellos, se pueden explotar de formas distintas, distinguiendo en capacidades (percepción, cognitivo y aprendizaje) y casos de uso (visión, audio, voz y lenguaje natural).

¿Qué debo tener en cuenta para usar MLOps?

  • Calidad de los datos: tener en cuenta de dónde vienen, calidad, si son fiables, etc.
  • Degradación de los modelos: al cabo del tiempo van perdiendo calidad.
  • Localidad: en el momento de la preparación se están entrenando los modelos con unos datos específicos basados en una geografía.

¿Cómo es el proceso de MLOps?

  1. Diseño: ajuste de requerimientos, establecer las necesidades que tienen los usuarios y qué queremos cubrir, exploración de los datos, experimentación.
  2. Desarrollo del modelo: desarrollo de un modelo funcional capacitado para pasar a producción.
  3. Operaciones: despliegue, automatización de entrenamientos, extracción de datos, etc.

¿Cuáles son los Principios de MLOps?

  • Automatización: cuyas fases con proceso manual, ML pipeline y CI/CD pipeline.
  • Versionado: basado en tres pilares, datos, modelo y código.
  • Testing: base sobre la que va a funcionar todo el sistema.
  • Monitorización: los puntos clave a tener en cuenta son que hay que estar atentos a que no haya cambios en dependencias, hay que asegurar los datos invariantes, el sesgo en predicciones, un modelo “rancio” que no es capaz de responder a la suficiente velocidad, modelo numéricamente estable y degradación del modelo.
  • Reproductividad: de la ingeniería de características, del entrenamiento del modelo y del despliegue del modelo. Hay que tener cuidado con la recogida de datos, para poder reproducir los resultados.
  • Herramientas: mlflow, DVC, Kubeflow, ONNX, TensorFlow Extended, Apache Airflow, Cookiecutter, Metaflow, jupyter, PyTorch o Psycaffold.

Si quieres hacer un repaso a todos estos conceptos y ver ejemplos prácticos, aquí te dejamos la repetición del webinar:

 

Aprende todas las tecnologías relacionadas con DevOps y Big Data con nuestros Bootcamps en programación, los cuales son programas diseñados en Silicon Valley con las últimas tendencias como MLOps.

👉 Descubre más del Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp ¡Descarga el temario!

👉 Prueba el Bootcamp Gratis por una Semana ¡Empieza ahora mismo!

👉 Conoce nuestros otros Bootcamps en Programación y Tecnología

[email protected]

¡Espera!
Tenemos algo para ti 😀

Da tus primeros pasos en Big Data con clases gratis por una semana ¿Te interesa?