November 10th, 2020

Mitos e verdades sobre o AutoML

RSS icon RSS Category: AutoML, Beginners, Business, Community, Machine Learning

Todas as revoluções que tivemos até hoje, tanto as tecnológicas quanto industriais, possuem uma semelhança: elas estão ligadas à forma como os seres humanos lidam com as máquinas. Antes, os processos eram feitos de forma muito manual e, com o tempo, acabaram sofrendo uma evolução natural voltada para a automação. Com o aprendizado de máquinas não é diferente. No início, muitas tarefas relacionadas ao aprendizado de máquina eram manuais, justamente por estarem em uma fase de experimentação. 

Porém, quando falarmos em aprendizado de máquina automatizado, popularmente conhecido como AutoML, estamos falando de um processo de evolução do aprendizado de máquina. O programador, quando bastante sagaz, vai dar um jeito de automatizar as tarefas repetitivas e manuais para otimizar o seu tempo. Normalmente, isso é feito através da criação de scripts, templates ou até mesmo bibliotecas que reúnem um compilado de todas as principais funções que ele necessita para poder desenvolver uma determinada tarefa e, consequentemente, facilitar a sua vida. É assim que funciona com o AutoML. Como qualquer framework ou linguagem de programação, é uma ferramenta que será utilizada em benefício do usuário que está desenvolvendo o modelo.

Com o intuito de desmistificar algumas questões relacionadas ao AutoML, destacamos abaixo alguns pontos importantes e que costumam gerar muitas dúvidas. Inclusive, vale lembrar que a desmistificação do AutoML também foi pauta da live que gravamos juntos no Linkedin e no Twitter da H2O.ai mês passado (vocês podem conferir o vídeo na íntegra ao fim deste post).

AutoML: ameaça ou aliado? 

Criou-se um mito, uma crença equivocada não só do AutoML, como também do aprendizado de máquina em geral e da Inteligência Artificial de que eles iriam, em algum momento, substituir o usuário. Na realidade não é isso que acontece. O AutoML é apenas mais uma ferramenta que veio para auxiliar e facilitar o trabalho do desenvolvedor de modelos de aprendizado de máquina, com o objetivo de otimizar o seu tempo, e não para substituí-lo.

Ao utilizar uma ferramenta de AutoML, muitas das tarefas com as quais o cientista de dados teria que se preocupar (como feature engineering, selecionar o melhor transformador para extração de características a partir de um determinado conjunto de dados, selecionar o melhor modelo, etc.), acabam sendo definidas pela ferramenta e, com isso, ele acaba tendo mais tempo para focar no que realmente interessa para o negócio, utilizando os seus conhecimentos matemáticos e estatísticos de análise para gerar melhores insights para a empresa.

Alguns desafios 

Um dos principais desafios da utilização do AutoML é cultural. Com a falsa impressão de que o AutoML representa uma ameaça, os usuários acabaram se tornando resistentes à ideia da automação.

Outro ponto é que, muitas vezes, a ferramenta de AutoML mais engessa o cientista de dados do que lhe dá liberdade. Por isso, é fundamental que o usuário considere uma boa ferramenta de AutoML e a possibilidade que ele tem de poder estender e expandir essa plataforma para adequá-la às necessidades com o seu caso de uso real. Por exemplo, muitas ferramentas de AutoML dão um determinado conjunto de modelos “x” e um conjunto de feature engineering “y”. O cientista de dados então tem que adaptar o seu caso de uso para ser aplicado na ferramenta e não é assim que deveria funcionar. A ferramenta precisa ser flexível e extensível a ponto de se adaptar às necessidades do usuário e não o contrário.

Além disso, existem algumas outras limitantes, como o fato de que os modelos precisam ser supervisionados, ou seja, a criação de modelos a partir de um conjunto de dados que possui uma variável-alvo. Mas isso é algo que tem evoluído e é possível que em breve tenhamos a oportunidade de trabalhar com modelos não supervisionados dentro de uma plataforma de AutoML também. Inclusive, esse é um campo de estudo contínuo e já existem aplicações de técnicas com a finalidade de alcançar esse objetivo .

Exemplos de sucesso

Um caso bem interessante que a H2O.ai está trabalhando e que podemos citar é o de um modelo de classificação de imagens para detecção de corrosão. Os cientistas de dados da empresa que nos procurou estava trabalhando nesse conjunto de imagens há uns 2 meses, 2 meses e meio nessa atividade, e com o Driverless AI trazendo o dataset correto, o nosso time na H2O.ai conseguiu resolver o problema em praticamente um dia. E é gratificante ver a reação das pessoas quando recebem os resultados muitas vezes mais precisos e gerados em um tempo significativamente mais curto.

Para concluir, é fundamental enxergarmos o AutoML como peça-chave no processo de democratização da Inteligência Artificial porque ele empodera todo o tipo de usuário – desde o analista de negócios, que necessita utilizar os conhecimentos do aprendizado de máquina e inteligência artificial para gerar novos insights para seus negócios, até o cientista de dados mais conhecimento mais avançado.

 Se interessou e quer assistir à gravação da live na íntegra? Clique aqui.

About the Authors

Alan Silva

Alan Silva is a Researcher/Engineer/Architect experienced in a wide range of distributed and security systems and network technologies; his technical background includes cryptography, mathematics, network protocols, distributed systems, operational systems, application security, secure software development, and R&D of some products. Before joining H2O.ai, Alan worked at Cloudera as the Hadoop guy for LATAM (Latin American Countries) where he implemented and configured most part of the existing clusters in this area and worked with many use cases that involved ML and code optimization on top of Cloudera Distribution of Hadoop. During his career, Alan has been invited to speak at Big Data Conferences in Latin American (Chile, Brazil, Argentina), lectures at Universities in Brazil and Chile, and the Strata Data Conference at New York. He holds a degree in Mathematics and a Masters in Computer Science with a focus on Distributed Systems from Federal University of São Carlos, Brazil.

Bruna Smith

Bruna is a Field Marketing Manager for Latin America at H2O.ai. She is a passionate professional with 10 years of experience, ranging from Internal/Corporate Communication to Marketing and Social Media. Prior to joining H2O.ai, Bruna worked as a Senior Communication Analyst for several years at the largest telco in Brazil and one of the top 3 in Latin America.

Bruna holds a Master’s Degree in Strategic Communication at the University of San Francisco (USF) and a Bachelor’s Degree in Social Communication at PUC-Rio.

Leave a Reply

Introducing H2O AI Hybrid Cloud

Organizations have made large investments in modernizing their data infrastructure and operations, but most still

January 26, 2021 - by Benjamin Cox and Jo-Fai Chow
Using AI to unearth the unconscious bias in job descriptions

“Diversity is the collective strength of any successful organization Unconscious Bias in Job Descriptions Unconscious bias affects

January 19, 2021 - by Parul Pandey and Shivam Bansal
H2O Driverless AI 1.9.1: Continuing to Push the Boundaries for Responsible AI

At H2O.ai, we have been busy. Not only do we have our most significant new

January 18, 2021 - by Benjamin Cox
Meet the Data Scientist who just cannot stop winning on Kaggle.

In conversation with Philipp Singer: A Data Scientist, Kaggle Double Grandmaster, and a Ph.D. in

January 15, 2021 - by Parul Pandey
Liqui.do Speeds Credit Scoring for Fair Lending with H2O.ai

Liqui.do is a technological and innovative company developing a platform for leasing equipment for small

January 12, 2021 - by Eve-Anne Tréhin
New Improvements in H2O 3.32.0.2

There is a new minor release of H2O that introduces two useful improvements to our

December 17, 2020 - by Veronika Maurerova

Join the AI Revolution

Subscribe, read the documentation, download or contact us.

Subscribe to the Newsletter

Start Your 21-Day Free Trial Today

Get It Now
Desktop img