MLOps es una de las nuevas tendencias en Big Data y para entender mejor de qué va esto, hemos tenido en un webinar a Fran Algaba, Data Scientist en BBVA Next Tecnologies, hablándonos sobre los detalles y aplicaciones de MLOps.
Antes de entrar en materia, queremos dejar claro de qué hablamos cuando decimos MLOps y es de las Operaciones de Machine Learning o aprendizaje automatizado.
¿Qué es MLOps?
MLOps es una extensión de la metodología DevOps que busca incluir activos de aprendizaje automático y ciencia de datos como ciudadanos de primera clase dentro de la ecología DevOps. Dentro de MLOps existen tres niveles de implementación de Machine Learning:
- Data: datos, fase, ingestión, curado, etc.
- Model: testing, evaluación de los modelos, empaquetado y cómo se van a despegar.
- Code: el código, donde se ejecuta todo el modelo en sí.
¿Por qué empezar a aplicar MLOps?
En la actualidad, nos encontramos en un mundo orientado a datos, que está vinculado a la cantidad exponencialmente creciente de los mismos, recogidos digitalmente. Además, nos encontramos con la ascendente importancia de la Inteligencia Artificial y la Ciencia de Datos, que se deriva de esta tremenda cantidad de información generada.
Dependiendo de todos ellos, se pueden explotar de formas distintas, distinguiendo en capacidades (percepción, cognitivo y aprendizaje) y casos de uso (visión, audio, voz y lenguaje natural).
¿Qué debo tener en cuenta para usar MLOps?
- Calidad de los datos: tener en cuenta de dónde vienen, calidad, si son fiables, etc.
- Degradación de los modelos: al cabo del tiempo van perdiendo calidad.
- Localidad: en el momento de la preparación se están entrenando los modelos con unos datos específicos basados en una geografía.
¿Cómo es el proceso de MLOps?
- Diseño: ajuste de requerimientos, establecer las necesidades que tienen los usuarios y qué queremos cubrir, exploración de los datos, experimentación.
- Desarrollo del modelo: desarrollo de un modelo funcional capacitado para pasar a producción.
- Operaciones: despliegue, automatización de entrenamientos, extracción de datos, etc.
¿Cuáles son los Principios de MLOps?
- Automatización: cuyas fases con proceso manual, ML pipeline y CI/CD pipeline.
- Versionado: basado en tres pilares, datos, modelo y código.
- Testing: base sobre la que va a funcionar todo el sistema.
- Monitorización: los puntos clave a tener en cuenta son que hay que estar atentos a que no haya cambios en dependencias, hay que asegurar los datos invariantes, el sesgo en predicciones, un modelo “rancio” que no es capaz de responder a la suficiente velocidad, modelo numéricamente estable y degradación del modelo.
- Reproductividad: de la ingeniería de características, del entrenamiento del modelo y del despliegue del modelo. Hay que tener cuidado con la recogida de datos, para poder reproducir los resultados.
- Herramientas: mlflow, DVC, Kubeflow, ONNX, TensorFlow Extended, Apache Airflow, Cookiecutter, Metaflow, jupyter, PyTorch o Psycaffold.
Si quieres hacer un repaso a todos estos conceptos y ver ejemplos prácticos, aquí te dejamos la repetición del webinar:
Aprende todas las tecnologías relacionadas con DevOps y Big Data con nuestros Bootcamps en programación, los cuales son programas diseñados en Silicon Valley con las últimas tendencias como MLOps. Conoce cada detalle descargando el temario:
Bootcamp Aprende a programar desde cero
Full Stack Web Bootcamp
Full Stack Mobile Bootcamp
Full Stack Big Data & Machine Learning Bootcamp
Full Stack DevOps Bootcamp
Full Stack Cybersecurity Bootcamp
Máster en Tecnologías Exponenciales de la Computación
Otras entradas que te pueden interesar:
¡Conoce nuestros Bootcamps!
Descarga el temario y descubre cómo en 6 meses podrás ser un Full Stack DevOps Bootcamp.