November 10th, 2020

Mitos e verdades sobre o AutoML

RSS icon RSS Category: AutoML, Beginners, Business, Community, Machine Learning

Todas as revoluções que tivemos até hoje, tanto as tecnológicas quanto industriais, possuem uma semelhança: elas estão ligadas à forma como os seres humanos lidam com as máquinas. Antes, os processos eram feitos de forma muito manual e, com o tempo, acabaram sofrendo uma evolução natural voltada para a automação. Com o aprendizado de máquinas não é diferente. No início, muitas tarefas relacionadas ao aprendizado de máquina eram manuais, justamente por estarem em uma fase de experimentação. 

Porém, quando falarmos em aprendizado de máquina automatizado, popularmente conhecido como AutoML, estamos falando de um processo de evolução do aprendizado de máquina. O programador, quando bastante sagaz, vai dar um jeito de automatizar as tarefas repetitivas e manuais para otimizar o seu tempo. Normalmente, isso é feito através da criação de scripts, templates ou até mesmo bibliotecas que reúnem um compilado de todas as principais funções que ele necessita para poder desenvolver uma determinada tarefa e, consequentemente, facilitar a sua vida. É assim que funciona com o AutoML. Como qualquer framework ou linguagem de programação, é uma ferramenta que será utilizada em benefício do usuário que está desenvolvendo o modelo.

Com o intuito de desmistificar algumas questões relacionadas ao AutoML, destacamos abaixo alguns pontos importantes e que costumam gerar muitas dúvidas. Inclusive, vale lembrar que a desmistificação do AutoML também foi pauta da live que gravamos juntos no Linkedin e no Twitter da H2O.ai mês passado (vocês podem conferir o vídeo na íntegra ao fim deste post).

AutoML: ameaça ou aliado? 

Criou-se um mito, uma crença equivocada não só do AutoML, como também do aprendizado de máquina em geral e da Inteligência Artificial de que eles iriam, em algum momento, substituir o usuário. Na realidade não é isso que acontece. O AutoML é apenas mais uma ferramenta que veio para auxiliar e facilitar o trabalho do desenvolvedor de modelos de aprendizado de máquina, com o objetivo de otimizar o seu tempo, e não para substituí-lo.

Ao utilizar uma ferramenta de AutoML, muitas das tarefas com as quais o cientista de dados teria que se preocupar (como feature engineering, selecionar o melhor transformador para extração de características a partir de um determinado conjunto de dados, selecionar o melhor modelo, etc.), acabam sendo definidas pela ferramenta e, com isso, ele acaba tendo mais tempo para focar no que realmente interessa para o negócio, utilizando os seus conhecimentos matemáticos e estatísticos de análise para gerar melhores insights para a empresa.

Alguns desafios 

Um dos principais desafios da utilização do AutoML é cultural. Com a falsa impressão de que o AutoML representa uma ameaça, os usuários acabaram se tornando resistentes à ideia da automação.

Outro ponto é que, muitas vezes, a ferramenta de AutoML mais engessa o cientista de dados do que lhe dá liberdade. Por isso, é fundamental que o usuário considere uma boa ferramenta de AutoML e a possibilidade que ele tem de poder estender e expandir essa plataforma para adequá-la às necessidades com o seu caso de uso real. Por exemplo, muitas ferramentas de AutoML dão um determinado conjunto de modelos “x” e um conjunto de feature engineering “y”. O cientista de dados então tem que adaptar o seu caso de uso para ser aplicado na ferramenta e não é assim que deveria funcionar. A ferramenta precisa ser flexível e extensível a ponto de se adaptar às necessidades do usuário e não o contrário.

Além disso, existem algumas outras limitantes, como o fato de que os modelos precisam ser supervisionados, ou seja, a criação de modelos a partir de um conjunto de dados que possui uma variável-alvo. Mas isso é algo que tem evoluído e é possível que em breve tenhamos a oportunidade de trabalhar com modelos não supervisionados dentro de uma plataforma de AutoML também. Inclusive, esse é um campo de estudo contínuo e já existem aplicações de técnicas com a finalidade de alcançar esse objetivo .

Exemplos de sucesso

Um caso bem interessante que a H2O.ai está trabalhando e que podemos citar é o de um modelo de classificação de imagens para detecção de corrosão. Os cientistas de dados da empresa que nos procurou estava trabalhando nesse conjunto de imagens há uns 2 meses, 2 meses e meio nessa atividade, e com o Driverless AI trazendo o dataset correto, o nosso time na H2O.ai conseguiu resolver o problema em praticamente um dia. E é gratificante ver a reação das pessoas quando recebem os resultados muitas vezes mais precisos e gerados em um tempo significativamente mais curto.

Para concluir, é fundamental enxergarmos o AutoML como peça-chave no processo de democratização da Inteligência Artificial porque ele empodera todo o tipo de usuário – desde o analista de negócios, que necessita utilizar os conhecimentos do aprendizado de máquina e inteligência artificial para gerar novos insights para seus negócios, até o cientista de dados mais conhecimento mais avançado.

 Se interessou e quer assistir à gravação da live na íntegra? Clique aqui.

About the Authors

Alan Silva

Alan Silva is a Researcher/Engineer/Architect experienced in a wide range of distributed and security systems and network technologies; his technical background includes cryptography, mathematics, network protocols, distributed systems, operational systems, application security, secure software development, and R&D of some products. Before joining H2O.ai, Alan worked at Cloudera as the Hadoop guy for LATAM (Latin American Countries) where he implemented and configured most part of the existing clusters in this area and worked with many use cases that involved ML and code optimization on top of Cloudera Distribution of Hadoop. During his career, Alan has been invited to speak at Big Data Conferences in Latin American (Chile, Brazil, Argentina), lectures at Universities in Brazil and Chile, and the Strata Data Conference at New York. He holds a degree in Mathematics and a Masters in Computer Science with a focus on Distributed Systems from Federal University of São Carlos, Brazil.

Bruna Smith

Bruna is a Field Marketing Manager for Latin America at H2O.ai. She is a passionate professional with 10 years of experience, ranging from Internal/Corporate Communication to Marketing and Social Media. Prior to joining H2O.ai, Bruna worked as a Senior Communication Analyst for several years at the largest telco in Brazil and one of the top 3 in Latin America.

Bruna holds a Master’s Degree in Strategic Communication at the University of San Francisco (USF) and a Bachelor’s Degree in Social Communication at PUC-Rio.

Leave a Reply

Amazon Redshift Integration for H2O.ai Model Scoring

We consistently work with our partners on innovative ways to use models in production here

November 22, 2021 - by Eric Gudgion
Building Resilient Supply Chains with AI

A global pandemic, a fundamental shift in the demand for goods and services worldwide, and

November 11, 2021 - by Adam Murphy
Introducing the H2O.ai Wildfire Challenge

We are excited to announce our first AI competition for good - H2O.ai Wildfire Challenge. We’ve

November 5, 2021 - by
MLB Player Digital Engagement Forecasting

Are you a baseball fan? If so, you may notice that things are heating up

October 29, 2021 - by Jo-Fai Chow
Announcing the H2O AI Feature Store

We’re really excited to announce the H2O AI Feature Store - The only intelligent feature

October 28, 2021 - by Vinod Iyengar
An Introduction to Time Series Modeling:
Time Series Preprocessing and Feature Engineering

Time is the only nonrenewable resource - Sri Ambati, Founder and CEO, H2O.ai. Prediction is very

October 26, 2021 - by Adam Murphy

Start your 14-day free trial today