Pesquisadores do MIT Inteligência artificial (IA) O sistema executa tarefas complexas de raciocínio em três áreas, incluindo codificação, planejamento estratégico e robótica.
Modelos de Linguagem em Grande Escala (LLM). Isso inclui: Bate-papo GPT e claude 3 opus, processa e gera texto com base em informações humanas conhecidas como “prompts”. Embora estas tecnologias tenham melhorado significativamente nos últimos 18 meses, são limitadas pela sua incapacidade de compreender o contexto ou de realizar tarefas de inferência tão bem como os humanos, disseram os investigadores.
Mas os cientistas do MIT afirmam agora ter resolvido este problema criando um “tesouro” de “abstrações” de linguagem natural que poderia levar a modelos de IA mais poderosos. A abstração transforma assuntos complexos em caracterizações de alto nível e omite informações sem importância. Isso poderia ajudar os chatbots a raciocinar, aprender, reconhecer e expressar conhecimento como os humanos.
Os cientistas argumentam agora que os LLMs têm dificuldade em abstrair informações de uma forma semelhante à humana. No entanto, eles organizaram abstrações de linguagem natural em três bibliotecas. A esperança é que isto melhore a consciência do contexto e dê respostas mais humanas.
Os cientistas detalharam suas descobertas em três artigos publicados no servidor de pré-impressão arXiv em 30 de outubro de 2023, 13 de dezembro de 2023 e 28 de fevereiro de 2023. A primeira biblioteca foi chamada “.Orientação da biblioteca através da observação da linguagem” (LILO) sintetiza, compacta e documenta código de computador. O segundo é “Obtenha domínio de açãoA estrutura final chamada “(Ada) cobre a tomada de decisões sequenciais em IA”.Abstração guiada por linguagem” (LGA) ajuda os robôs a compreender melhor seu ambiente e planejar seus movimentos.
Relacionado: ‘É nosso direito nos prejudicar para nos proteger’: como os humanos estão agora maltratando a IA sem saber
Estes artigos exploram como a linguagem fornece um contexto importante aos sistemas de IA para que possam lidar com tarefas mais complexas. Estes foram apresentados no dia 11 de maio na Conferência Internacional sobre Representações de Aprendizagem em Viena, Áustria.
“A aprendizagem em biblioteca é uma das fronteiras mais emocionantes da inteligência artificial, proporcionando um caminho para descobrir e raciocinar sobre abstrações composicionais”, disse ele. Robert Hawkinsprofessor assistente de psicologia na Universidade de Wisconsin-Madison; declaração. Hawkins, que não esteve envolvido no estudo, acrescentou que tentativas semelhantes no passado eram demasiado dispendiosas em termos computacionais para serem utilizadas em escala.
De acordo com os cientistas, as três estruturas de biblioteca são baseadas em técnicas neurossimbólicas, nomeadamente redes neurais, uma coleção de algoritmos de aprendizagem de máquina dispostos para imitar a estrutura do cérebro humano, e programas clássicos. .
Codificação mais inteligente baseada em IA
O LLM surgiu como uma ferramenta poderosa para engenheiros de software, incluindo o GitHub Copilot, mas os cientistas dizem que não pode ser usado para criar bibliotecas de software completas. Para fazer isso, você precisa categorizar seu código e consolidá-lo em programas menores que sejam mais fáceis de ler e reutilizar. É aí que entra o LILO.
Os cientistas combinaram o LLM com algoritmos previamente desenvolvidos que podem detectar abstrações conhecidas como “pontos” para formar a estrutura neurosemiótica LILO. Neste regime, quando o LLM escreve código, ele é emparelhado com o Stich para encontrar abstrações em bibliotecas.
Como o LILO entende a linguagem natural, ele pode detectar e omitir vogais de sequências de código e desenhar flocos de neve, assim como os engenheiros de software humanos fazem usando o bom senso.. Ao obter uma compreensão mais profunda das palavras usadas nos prompts, um dia os LLMs serão capazes de desenhar gráficos 2D, responder a perguntas visuais e trabalhar com documentos Excel.
Use IA para planejar e criar estratégias
Segundo os pesquisadores, atualmente os LLMs não conseguem usar habilidades de raciocínio para criar planos flexíveis, como as etapas necessárias para preparar o café da manhã. Mas a estrutura Ada, batizada em homenagem à matemática britânica Ada Lovelace, é uma forma de os alunos se adaptarem e planejarem quando esse tipo de tarefa é dada, por exemplo, em um ambiente virtual.
Esta estrutura fornece uma biblioteca para planejamento de culinária e jogos usando LLM para encontrar abstrações de conjuntos de dados de linguagem natural relacionados a essas tarefas. Os melhores são pontuados, filtrados e adicionados à biblioteca por operadores humanos. Ao combinar a estrutura com o GPT-4 da OpenAI, os cientistas conseguiram superar a linha de base de tomada de decisões de IA “código como política” na execução de simulações de cozinha e tarefas de jogos.
Ao encontrar informações ocultas em linguagem natural, o modelo compreendeu tarefas como colocar uma garrafa de vinho gelada em um armário ou montar uma cama. Em comparação com a execução da mesma tarefa sem a influência de Ada, a precisão aumentou 59% e 89%, respectivamente. Os pesquisadores esperam descobrir outros usos domésticos para Ada num futuro próximo.
Dê uma vantagem aos robôs com assistência de IA
A estrutura LGA também permite que os robôs entendam melhor seu ambiente, semelhante aos humanos, removendo detalhes desnecessários do ambiente e encontrando melhores abstrações para executar tarefas com mais eficiência.
LGA usa a rota de execução de ações com base em imagens de treinamento para encontrar abstrações de tarefas a partir de instruções de linguagem natural, como “traga-me um chapéu”.
Os pesquisadores demonstraram a eficácia do LGA usando o robô de quatro patas, semelhante a um cachorro, da Boston Dynamics, para extrair frutas e reciclar bebidas. Experimentos mostraram que o robô pode escanear o mundo e planejar com eficácia, mesmo em ambientes caóticos.
Os pesquisadores acreditam que estruturas neurossimbólicas como LILO, Ada e LGA podem ajudar a tornar os modelos de IA “mais parecidos com os humanos”, dando-lhes habilidades de resolução de problemas e permitindo-lhes navegar melhor em seus ambientes. tornar-se um modelo.

