Google treinou seus veículos autônomos com algoritmos evolutivos

A Waymo anunciou uma parceria com a DeepMind na área de treinamento de algoritmos de redes neurais para veículos não tripulados. Agora, para parte dos algoritmos, o Waymo usa a técnica desenvolvida no DeepMind, na qual os parâmetros de aprendizagem são selecionados em paralelo em uma variedade de modelos que usam um método similar ao desenvolvimento evolucionário dos organismos vivos.

No coração do sistema de controle de um veículo não tripulado estão os algoritmos de rede neural, cuja eficácia depende da quantidade e da qualidade dos dados de treinamento. É por isso que os principais desenvolvedores, como o Waymo, estão testando-os, gerando milhões de quilômetros em estradas reais e bilhões de quilômetros em simulações.

No entanto, os dados em si são apenas parte das condições necessárias para criar um carro que seja mais seguro nas estradas do que as pessoas. Igualmente importante é o design de certos modelos de redes neurais, bem como a forma como são treinados.

Tipos de Parâmetros

Existem dois tipos de parâmetros em algoritmos de redes neurais. Um tipo são os parâmetros diretos da rede neural, que mudam durante o treinamento, por exemplo, o peso dos neurônios. Outro tipo é hyperparameters. Eles são responsáveis ​​em como a aprendizagem acontece. Por exemplo, um dos principais hiperparâmetros é a velocidade de aprendizado, ou seja, a rapidez com que a rede neural ajusta seus parâmetros durante o treinamento.

Ao mesmo tempo, a velocidade de aprendizado deve ser mantida em um nível equilibrado, uma vez que uma velocidade de aprendizado muito baixa demandará muito tempo e recursos de computação, e parâmetros muito altos podem mudar drasticamente e, eventualmente, não atingir um valor ideal.

Em geral, o processo de seleção de hiperparâmetros é semi-automático. Durante isso, muitos modelos de redes neurais são treinadas em paralelo e os hiperparâmetros para cada um deles são escolhidos aleatoriamente, após o qual os modelos mais bem treinados “ganham”.

Em 2017, os especialistas da DeepMind (que, como o Waymo fazem parte do Google), ofereceram um método de treinamento significativamente aprimorado, que agora é usado para treinar algoritmos de veículos autônomos.

Imitando a verdadeira evolução

O método pode ser representado como uma evolução. Inicialmente, os modelos iniciam o aprendizado paralelo com um conjunto aleatório de hiperparâmetros. Após um curto período de tempo, os piores modelos de “população” são substituídos por uma nova geração: cópias dos melhores modelos com hiperparâmetros de treinamento levemente modificados. Nesse caso, as cópias herdam completamente o status do modelo principal, portanto, não precisam reciclar “do zero” e gastar recursos nele.

Como alguns hiperparâmetros podem não fornecer um bom resultado final rapidamente, os pesquisadores implementaram uma partição de toda a “população” em “subpopulações” isoladas, competindo apenas umas com as outras, assim como a evolução real ocorre nas ilhas. Além disso, durante cada segmento de treinamento, os modelos não são treinados em completo isolamento, mas podem “observar” os hiper-parâmetros de modelos mais bem-sucedidos.

No início do ano, o Departamento de Veículos Motorizados do Estado da Califórnia publicou estatísticas anuais sobre a frequência de intervenções de engenheiros de teste em veículos não tripulados quando testados nas ruas. O líder neste indicador, como no ano passado, foi a Waymo. Seus carros passam em média quase 18 mil quilômetros sem intervenção.

*Por Ademilson Ramos
……………………………………………………………………………….
*Fonte: engenhariae

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.