Se o objetivo de uma demonstração tecnológica é provocar um momento “uau”, estaríamos mentindo se disséssemos que o Covert Protocol da Nvidia, uma vitrine jogável para ferramentas AI NPC e Avatar Cloud Engine (ACE), ainda não foi introduzido. Será. Não funcionou para mim. Por outro lado, desenvolver essa ideia em “Quero isso no meu jogo agora” exigirá mais do que uma conversa um pouco afetada com um aspirante a bartender.
Para aqueles que ainda não viram nossa exposição anterior no circuito de feiras de tecnologia/jogos, a ACE é uma “fundição” completa de ferramentas de criação de personagens baseadas em IA, incluindo modelos de linguagem, vozes, conversão de texto em fala, e automação é. Balançando a boca e muito mais – a Nvidia está promovendo isso como o futuro da interação com NPCs. Conectado ao Inworld Engine de terceiros, que parece estar alimentando a maior parte da geração atual de IA, o ACE traduz diálogos de personagens pré-escritos e gravados exatamente nas perguntas e declarações murmuradas em um microfone. Nosso objetivo é substituí-los por outros mais dinâmicos. linhas que podem ser respondidas. .
Assista no YouTube
Covert Protocol combina tudo isso em um pequeno jogo de investigação social que incumbe você, um investigador particular, de entrar e mentir em suítes particulares de hotéis de luxo. Taehyung, um carregador alegre, foi o primeiro a participar do interrogatório assistido por IA, e eu fui o primeiro jornalista reunido para pegar o microfone.
A conversa começou estranhamente, como aconteceu com a maioria de mim. Quando entrei no modo de herói RPG Obsidian completo e perguntei sobre o que estava acontecendo a fofoca no hotel, Tae desviou com uma piada sobre extraterrestres fazendo check-in.Mas ele fiz isso O bar do hotel foi recomendado, então nos revezamos perguntando sobre os melhores coquetéis do bar. Isto foi um erro. Coincidentemente, o Sr. Tae tinha planos de assumir o comando do bar e estava tão orgulhoso de seu zoológico de Baltimore (com um toque coreano) que conseguiu acomodar várias reações consecutivas.
Isso foi estranho. Mas isso também… funcionou? Como uma interação semelhante a um jogo, as perguntas e respostas ocorreram de forma perfeitamente lógica. As respostas geradas pela IA eram específicas para a pergunta, não havia soluções alternativas e não havia perguntas do tipo “Você pode repetir isso?” ou soluços do tipo “Não sei do que você está falando”. Se alguém chegasse sem nenhum conhecimento do lado do aprendizado de máquina, poderia simplesmente pensar que o ACE estava respondendo a consultas pré-planejadas e fornecendo uma linha padrão. Sim, foi lindo. Muitas respostas pareciam até levar em conta as respostas anteriores e usá-las como contexto para evitar duplicação.
Na maioria das vezes, de qualquer maneira.Esse homem é consumido Com orgulho no Zoológico de Baltimore, ele colocou endossos em respostas sobre suas opiniões políticas e o relacionamento com sua mãe, como se estivesse fazendo um programa do SNL. Para ser justo, a transição foi cafona, mas não foi inteiramente uma transição, considerando que eles tocaram no assunto das bebidas em primeiro lugar. Também é possível que este tenha sido um tique de caráter intencional causado pela IA, e não uma falha na Matrix.

ainda. Eu ri na época, mas agora que penso nisso, acho estranho que esse homem tenha voltado tão rapidamente ao assunto de sua especialidade, o álcool. Se fosse para ser uma piada peculiar, certamente não se encaixava na apresentação inteligente da história de detetive e, se não combinava, definitivamente traía o quão literalmente artificiais eram essas “performances”. É como se Ace estivesse se agarrando a esse detalhe do personagem como um cobertor de segurança, com medo de se desviar quando descobrir que está cumprindo o propósito do coquetel, e que isso fará com que tudo pareça mais robótico.
Não que as máscaras fossem particularmente bem mantidas em outros lugares. A voz de IA da ACE era mais natural do que a voz da demonstração da loja de ramen do ano passado, mas ainda era rígida e monótona, salpicada de pausas e pronúncias estranhas. Basicamente, a conversão clássica de texto em fala conta tudo. Thae falou sobre as “razões” pelas quais sua família deixou a Coreia do Sul, aludindo a uma invasão norte-coreana, com o mesmo peso que usava para fazer piadas sem graça sobre alienígenas. Outro NPC conversador no Covert Protocol é um palestrante renomado de quem eu precisava obter o número do quarto, mas ele está igualmente à vontade com um olá amigável e ao ser informado de que seu discurso foi cancelado, não fiquei surpreso.
Além disso, algumas respostas só retornaram após longas pausas, e o gerenciador da Nvidia rapidamente determinou que o lento Wi-Fi do local era o culpado. Portanto, mesmo que todo esse sistema fosse incorporado a um jogo de varejo finalizado, provavelmente seria uma operação sempre online. Todas essas consultas remotas ao Inworld exigem a propriedade de uma conexão de alta qualidade.
Depois há a escrita. Nada me fez torcer os dedos dos pés tanto quanto o diálogo fétido na demo NEO NPC da Ubisoft (embora, preocupantemente, também seja baseado em uma combinação de tecnologia Inworld e Nvidia), mas também foi um simples Lá. Não há brilho, nem diversão, nem peso real nas palavras. Eu ri da constante campanha publicitária de Tae sobre a bebida, mas apenas de seu ridículo, não do humor mais intencional de Machine. E uma tentativa de alguma narração privada e grisalha, semelhante a um pênis, resulta no tragicamente brando “É um bar. Você poderia ir a um Old Fashioned agora, mas concentre-se, Marcus, concentre-se”. Ninguém quer morrer, isso não é verdade.
Ainda estou realmente impressionado com a capacidade de resposta das perguntas e respostas, mas no geral sinto que faltam pelo menos alguns anos para que a ACE seja capaz de melhorar o jogo o suficiente para resistir à criação humana. O problema é que os desenvolvedores de jogos claramente não gostam de esperar. Além da Ubisoft, ouvimos dizer que várias empresas já abordaram a Nvidia sobre o uso do ACE para construir seus elencos de NPCs. Não estou dizendo que todos ficaremos loucos com robôs antes do Natal, mas estou preocupado que todos estaremos correndo para entender os benefícios da IA, de preferência da variedade “jogo social adequadamente não linear”. A variedade de você tem que pagar aos escritores também termina com uma seleção indiferente de jogos.
Eu também não digo isso como um odiador geral da IA. Além da IA generativa, a própria Nvidia criou uma série de ferramentas úteis e eticamente corretas que empregam aprendizado de máquina para ajudar jogadores e desenvolvedores. Exemplos simples incluem o aprimoramento de seu amado DLSS ou atualizações visuais instantâneas com Ray Reconstruction. Apesar de produzir mods de qualidade variável, o RTX Remix também dá lucro líquido até agora. Na verdade, ele usa um pouco de IA de geração para ajudar a gerar modelos e texturas de alta resolução, mas nunca tive problemas com essas partes do Portal com RTX, por exemplo. Uma sala longe da demonstração do Covert Protocol oferece um vislumbre do Half-Life 2 RTX em ação, com modelos feitos à mão e atualizações de iluminação, bem como algumas substituições de textura geradas por IA (mas de bom gosto).

Mas há claramente uma grande lacuna entre fazer com que a IA faça anti-aliasing e conserte paredes de tijolos e apostar tudo na IA generativa para recriar todo o comportamento humano em tempo real. A ACE percorreu um longo caminho desde aquela visita à loja de ramen, mas ainda não estou convencido de que ela esteja pronta para pular esse abismo.
E mesmo se fosse, um número suficiente de jogadores realmente gostaria de ouvir a voz da IA. Apesar da novidade do diálogo dinâmico, é emocionante, comovente, engraçado, assustador e triste, o desejo por histórias incríveis não vai a lugar nenhum. E se os protocolos secretos servirem de indicação, as melhores histórias ainda virão de mãos humanas.
Nem mesmo as próprias engrenagens da ACE sugerem o contrário. O humor e os discursos de Taehyung podem ser gerados pela IA, mas precisam ser gerados. de algo. Neste caso, este é o perfil do personagem que o Inworld Engine mantém para ele, e todos os outros NPCs possuem o mesmo. Em outras palavras, uma história pessoal resumida de vida, amor, sonhos e medos. Esta é a fonte de tudo o que torna Tay interessante, ou pelo menos capaz de dar respostas mais interessantes do que o chatbot de apoio da British Gas, seja a fuga de sua família das tensões políticas ou a formação de sua obsessão como bartender. Por favor, não cale a boca. E tudo isso foi criado do zero por escritores humanos, não por IA. Apenas diga.

