Os mais recentes agentes de IA do Google estão aprendendo como navegar no espaço familiar dos jogos.
A gigante da tecnologia anunciou uma nova pesquisa sobre Agentes Multimundo Instrutíveis Escaláveis (SIMA) na quarta-feira. Este agente pode seguir instruções para realizar tarefas de videogame e jogar jogos nunca vistos antes.
Mas, assim como o Genie, que o braço de pesquisa de IA do Google, DeepMind, discutiu em um artigo de pesquisa publicado em 23 de fevereiro, o SIMA é um projeto de pesquisa.
“No futuro, você poderá ter agentes como o SIMA brincando com você”, disse Tim Hurley, engenheiro de pesquisa da DeepMind que co-liderou o projeto. “Um agente colaborativo que pode conversar e dar instruções sobre várias coisas no jogo no local.”
A DeepMind diz que uma das razões pelas quais está interessada em videogames é porque eles são um excelente campo de treinamento para sistemas de IA. As empresas de IA esperam que tal investigação as ajude a “compreender como os sistemas de IA podem tornar-se mais úteis”.
Desde que a OpenAI lançou o ChatGPT em novembro de 2022, o mercado foi inundado com ferramentas generativas de IA da Microsoft, Google, Adobe, Meta e Anthropic. Hoje em dia, a IA generativa vai além do texto, abrangendo imagens, vídeos, músicas e, claro, jogos, à medida que as empresas tecnológicas procuram diferenciar os seus produtos num campo em rápido crescimento.
Objetivo de pesquisa
De acordo com Hurley, o SIMA é treinado para fazer o que lhe mandam, mas isso não significa necessariamente que vencerá.
As principais questões dos investigadores inicialmente eram se os agentes de IA poderiam transferir habilidades entre jogos e como se comportariam em jogos que nunca tinham jogado antes.
“Esses objetivos são fornecidos por usuários humanos em linguagem natural de forma livre e irrestrita e, em seguida, [SIMA] “Esses ambientes de videogame usam apenas uma interface natural para os jogos”, disse Hurley, “e a única maneira de os agentes observarem esses jogos é a partir de uma tela em tempo real”.
treinamento
Os pesquisadores gravaram imagens e entradas de teclado e mouse de jogadores humanos e usaram técnicas de aprendizagem por imitação para ensinar o SIMA a jogar jogos como No Man's Sky, Eco, Teardown e Goat Simulator exatamente como os humanos.
Eles avaliaram os agentes em 600 habilidades, incluindo navegação (por exemplo, “virar à esquerda”), interação com objetos (por exemplo, “subir uma escada”) e uso de menu (por exemplo, “abrir mapa”), e descobriram que o desempenho do SIMA eu achei ser melhor que o especialista.
“Ele pode aproveitar conceitos compartilhados entre jogos para aprender melhores habilidades e como executar melhor essas instruções”, disse Frederic Besse, engenheiro de pesquisa da DeepMind.Masu. “Confirmar a transferência positiva entre as partidas é um marco importante para o estudo.”
No entanto, o SIMA não é perfeito.
“Todos os erros que estamos vendo estão relacionados a uma compreensão mais detalhada”, disse Hurley. “Então, se você pedir a um agente para cortar uma árvore no jogo Valheim, o agente irá cortar a árvore, mas você não pode especificar exatamente qual árvore cortar.”
Ele reluta em chamar as imperfeições do SIMA de “ilusão”.
“O que vemos quando um agente falha não é uma ilusão. O comportamento do agente muitas vezes parece intencional, mas é incapaz de executar o comportamento desejado”, acrescentou.
“É uma ótima área de prática.”
No futuro, a DeepMind planeja melhorar o desempenho do SIMA, inclusive permitindo que os agentes sigam instruções mais detalhadas, permitindo-lhes, em última análise, “operar em tantos ambientes quanto possível, atingir uma variedade de objetivos e interagir com os usuários”. desenvolver um sistema de IA que possa —Besse disse.
Mas não se trata apenas da comunicação homem-agente nos jogos.
“Acreditamos que jogos e simulações em geral são excelentes campos de treinamento para sistemas de IA”, disse Besse.
Uma razão para isso é que os jogos se aproximam do mundo real. Eles oferecem variedade visual, juntamente com uma variedade de configurações, mecânicas e estilos gráficos. Mas eles também compartilham temas comuns, como navegar em espaços complexos e interagir com objetos, personagens e jogadores.