descubre qué es mlops en este post

MLOps es una de las nuevas tendencias en Big Data y para entender mejor de qué va esto, hemos tenido en un webinar a Fran Algaba, Data Scientist en BBVA Next Tecnologies, hablándonos sobre los detalles y aplicaciones de MLOps.

Antes de entrar en materia, queremos dejar claro de qué hablamos cuando decimos MLOps y es de las Operaciones de Machine Learning o aprendizaje automatizado.

¿Qué es MLOps?

MLOps es una extensión de la metodología DevOps que busca incluir activos de aprendizaje automático y ciencia de datos como ciudadanos de primera clase dentro de la ecología DevOps. Dentro de MLOps existen tres niveles de implementación de Machine Learning:

  • Data: datos, fase, ingestión, curado, etc.
  • Model: ​testing​, evaluación de los modelos, empaquetado y cómo se van a despegar.
  • Code: el código, donde se ejecuta todo el modelo en sí.

¿Por qué empezar a aplicar MLOps?

En la actualidad, nos encontramos en un mundo orientado a datos, que está vinculado a la cantidad exponencialmente creciente de los mismos, recogidos digitalmente. Además, nos encontramos con la ascendente importancia de la Inteligencia Artificial y la Ciencia de Datos, que se deriva de esta tremenda cantidad de información generada.

Dependiendo de todos ellos, se pueden explotar de formas distintas, distinguiendo en capacidades (percepción, cognitivo y aprendizaje) y casos de uso (visión, audio, voz y lenguaje natural).

¿Qué debo tener en cuenta para usar MLOps?

  • Calidad de los datos: tener en cuenta de dónde vienen, calidad, si son fiables, etc.
  • Degradación de los modelos: al cabo del tiempo van perdiendo calidad.
  • Localidad: en el momento de la preparación se están entrenando los modelos con unos datos específicos basados en una geografía.

¿Cómo es el proceso de MLOps?

  1. Diseño: ajuste de requerimientos, establecer las necesidades que tienen los usuarios y qué queremos cubrir, exploración de los datos, experimentación.
  2. Desarrollo del modelo: desarrollo de un modelo funcional capacitado para pasar a producción.
  3. Operaciones: despliegue, automatización de entrenamientos, extracción de datos, etc.

¿Cuáles son los Principios de MLOps?

  • Automatización: cuyas fases con proceso manual, ML pipeline y CI/CD pipeline.
  • Versionado: basado en tres pilares, datos, modelo y código.
  • Testing: base sobre la que va a funcionar todo el sistema.
  • Monitorización: los puntos clave a tener en cuenta son que hay que estar atentos a que no haya cambios en dependencias, hay que asegurar los datos invariantes, el sesgo en predicciones, un modelo “rancio” que no es capaz de responder a la suficiente velocidad, modelo numéricamente estable y degradación del modelo.
  • Reproductividad: de la ingeniería de características, del entrenamiento del modelo y del despliegue del modelo. Hay que tener cuidado con la recogida de datos, para poder reproducir los resultados.
  • Herramientas: mlflow, DVC, Kubeflow, ONNX, TensorFlow Extended, Apache Airflow, Cookiecutter, Metaflow, jupyter, PyTorch o Psycaffold.

Si quieres hacer un repaso a todos estos conceptos y ver ejemplos prácticos, aquí te dejamos la repetición del webinar:

Aprende todas las tecnologías relacionadas con DevOps y Big Data con nuestros Bootcamps en programación, los cuales son programas diseñados en Silicon Valley con las últimas tendencias como MLOps. Conoce cada detalle descargando el temario:

Bootcamp Aprende a programar desde cero
Full Stack Web Bootcamp
Full Stack Mobile Bootcamp
Full Stack Big Data & Machine Learning Bootcamp
Full Stack DevOps Bootcamp
Full Stack Cybersecurity Bootcamp
Máster en Tecnologías Exponenciales de la Computación

¡Pide más información! Nosotros te llamamos

Otras entradas que te pueden interesar:

¡Conoce nuestros Bootcamps!

Descarga el temario y descubre cómo en 6 meses podrás ser un Full Stack DevOps Bootcamp.

¿Quieres más información?