OpenAI, fabricante do ChatGPT, compartilhou na sexta-feira uma prévia de uma nova ferramenta de inteligência artificial (IA) que pode gerar “fala de aparência natural” e imitar a voz humana.
A ferramenta, chamada “Voice Engine”, requer apenas “uma única amostra de áudio de 15 segundos para produzir uma voz com som natural que se assemelha muito ao locutor original”, disse a OpenAI em um post no blog.
De acordo com exemplos compartilhados pela startup de IA, o Voice Engine pode fornecer assistência de leitura, traduzir conteúdo e fornecer áudio para pessoas que não possuem habilidades linguísticas ou sofrem de distúrbios de linguagem. No entanto, a OpenAI reconheceu que a ferramenta pode representar “sérios riscos de particular preocupação durante um ano eleitoral”.
A empresa desenvolveu seu mecanismo de voz pela primeira vez no final de 2022 e começou a testá-lo em particular com um “pequeno grupo de parceiros de confiança” no final do ano passado.
A OpenAI enfatizou que esses parceiros concordam com políticas de uso que exigem o consentimento explícito e informado do orador original e proíbem a representação de indivíduos sem o seu consentimento.
Os parceiros também devem divulgar que as vozes são geradas por IA e que as vozes geradas pelo Voice Engine possuem recursos de marca d'água para ajudar a rastrear suas origens, disse a empresa.
A startup de IA disse que a implantação generalizada de tais ferramentas incluiria autenticação de voz para “verificar se o locutor original adicionou áudio intencionalmente ao serviço” e para evitar fraudes. Ele disse acreditar que é necessário fazer uma “lista de áudio banido” funcionar. . Criando uma voz semelhante à de uma pessoa famosa.
A OpenAI também recomendou que as instituições eliminassem gradualmente o uso de autenticação baseada em voz para acessar contas bancárias e outras informações confidenciais.
A empresa ainda parece um tanto incerta se eventualmente lançará esta ferramenta de forma mais ampla.
“Queremos iniciar uma conversa sobre a adoção responsável do discurso sintético e como a sociedade pode se adaptar a essas novas capacidades”, disse a OpenAI em um blog. “Com base nos resultados destas conversas e testes em pequena escala, tomaremos decisões mais informadas sobre se e como implementar esta tecnologia em escala.”
A nova tecnologia de áudio surge em meio a preocupações crescentes sobre o potencial dos deepfakes gerados por IA para espalhar desinformação relacionada às eleições.
No início deste ano, uma mensagem imitando o presidente Biden foi enviada aos eleitores de New Hampshire antes das primárias de janeiro, instando-os a não irem às urnas.
Steve Cramer, um veterano agente democrata, admitiu mais tarde ter criado chamadas automáticas falsas e disse que o fez para chamar a atenção para os perigos da IA na política.
Um boletim informativo local do Arizona publicou de forma semelhante um vídeo deepfake gerado por IA do candidato republicano ao Senado, Kali Lake, no mês passado, para alertar os leitores sobre “quão boa é essa tecnologia”.
Copyright 2024 Nexstar Media Inc. Todos os direitos reservados. Este material não pode ser publicado, transmitido, reescrito ou redistribuído.