#AutoML – Automated Machine Learning, modelos de #MachineLearning que aprenden a optimizarse! (en las movies se llama #skynet)

Buenas!

Una de las noticias mas importantes que se presentaron la semana pasada en Ignite fue la Preview de Azure AutoML: Automated Machine Learning.

Lo mejor para entrar en detalles sobre AutoML es leer el post oficial del equipo de Azure Machine Learning (ver referencias). Yo lo intentare resumir en un nuevo framework que permite identificar de forma automática el mejor pipeline para trabajar con datos.

Un pipeline comprende los pasos básicos de un proceso de ML

  • Trabajar con datos, esto significa ordenarlos, eliminar los nulls, etiquetarlos, etc.
  • Seleccionar un algoritmo de aprendizaje, SVM, Fast Tree, etc.
  • Definir Features y Labels, ajustar parámetros, etc

El modelo de prueba / error / aprendizaje en cada uno de estos pasos define la precisión que tendrá nuestro modelo final.

AutoML propone un servicio automático, donde se identifica la mejor combinación para crear una Pipeline con la mejor precisión posible. Como siempre una imagen ayuda a la explicación

01 AutoML process.png

Y la descripción oficial

Automated ML is available to try in the preview of Azure Machine Learning. We currently support classification and regression ML model recommendation on numeric and text data, with support for automatic feature generation (including missing values imputations, encoding, normalizations and heuristics-based features), feature transformations and selection. Data scientists can use automated ML through the Azure Machine Learning Python SDK and Jupyter notebook experience. Training can be performed on a local machine or by leveraging the scale and performance of Azure by running it on Azure Machine Learning managed compute. Customers have the flexibility to pick a pipeline from automated ML and customize it before deployment. Model explainability, ensemble models, full support for Azure Databricks and improvements to automated feature engineering will be coming soon.

Pues bien, a partir de aquí recomiendo leer la documentación oficial que es donde se explica en detalle AutoML.

Si estas familiarizado con Jupyter notebooks, en pocos segundos puedes tener acceso a un tutorial mas que completo solo clonado una library desde https://github.com/Azure/MachineLearningNotebooks

02 AutoML Jupyter Notebooks

El tutorial es bastante sencillo, y con pocos recursos de Azure puedes ver como se optimiza un un modelo de clasificación con AutoML

03 AzureML Local tutorial

Si bien por ahora solo se soportan modelos de clasificación y regresión, AutoML es una herramienta a tener en cuenta cuando comienzas a trabajar en ML.

Nos vemos en el evento, happy coding!

Saludos @ Toronto

El Bruno

References

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s