No conto de fadas da Disney A Pequena Sereia, a personagem-título Ariel tem sua voz enganada pela bruxa do mar Ursula. Somente quando sua voz é separada de seu corpo é que Ariel percebe o quão importante isso é para sua personalidade.
Esta semana, enquanto a estrela de cinema Scarlett Johansson abordava publicamente a questão de quem é o dono da sua voz e o que ela faria se alguém a imitasse para fins comerciais, a obra-prima de Hans Christian Andersen parecia uma fábula moderna.

Quando Johansson recusou um pedido para emprestar sua voz à mais recente ferramenta generativa de IA da OpenAI, ChatGPT-4o, o CEO da empresa, Sam Altman, escalou-a para outro ator que parecia mais convincente do que eu. Altman negou ter tentado fazer o GPT-4o soar como Johansson. Mas considerando que no mesmo dia em que a OpenAI anunciou o GPT-4o, Johansson postou um tweet de uma palavra que dizia “ela”, o título do filme de ficção científica de 2013 em que ela interpretou a voz da assistente feminina de IA Samantha, sua. a negação parecia vazia.
De qualquer forma, a situação de Johansson é um aviso para todos nós. Não importa o quanto estejamos ligados ao som das nossas próprias vozes, a IA criou um mundo onde este sentido de propriedade está ameaçado. Quer falemos livremente ou tenhamos a nossa voz roubada, a IA pode fazer parecer que estamos a dizer coisas que nunca dissemos.
caixa de áudio e eu
Eu só tive um gostinho disso. Esta semana, na Vivatech em Paris, experimentei a ferramenta de áudio generativa de IA da Meta, Audiobox, que a empresa anunciou pela primeira vez no verão passado. A ferramenta funciona ouvindo e sintetizando a gravação de voz do usuário, que pode ser usada para ler o texto em voz alta, como se você mesmo estivesse falando as palavras. Você pode tentar aqui.
Usei meu iPad para gravar alguns segundos da minha voz e digitei a frase que queria que a ferramenta lesse. Em um minuto, minha voz leu o texto em voz alta. Foi uma experiência estranha ouvir minha própria voz saindo do iPad e ler frases que nunca havia dito em voz alta.

A ferramenta de IA da Meta é apenas uma entre muitas.
A política de privacidade da Meta significa que as vozes AI Audiobox podem ser usadas pelos próprios usuários, mas estão surgindo várias empresas que podem criar versões de vozes AI, incluindo Elemental Labs e Speechify. Embora eu tenha fornecido minha voz gratuitamente para este experimento, ela poderia ser facilmente gravada em rádio, televisão, vídeos do YouTube ou podcasts e clonada por IA sem meu conhecimento ou permissão. Pessoas cujas vozes são expostas em domínio público, como celebridades, são os alvos mais prováveis, mas desde memorandos de voz até gravadores telefônicos, ninguém está imune.
Lembra-se da chamada automática eleitoral que imitou a voz do presidente Joe Biden?
Na era da IA, não temos escolha a não ser aceitar que nossas vozes nunca estão verdadeiramente protegidas contra falsificação. Assim como estamos cada vez mais cautelosos com as imagens geradas pela IA, devemos aceitar a realidade de que nem tudo o que ouvimos pode ser acreditado.
Quando nada pode ser levado ao pé da letra, a confiança é mais importante do que nunca. As pessoas que desenvolvem a nossa tecnologia precisam de nos mostrar que podem confiar nelas para fazerem a coisa certa por parte das pessoas para quem estão a conceber – nós. Empresas como a Meta e a Google estão agora bem conscientes de que as pessoas estão a examinar publicamente as suas políticas de fiabilidade e segurança e a sua capacidade de aplicar essas políticas. Embora ainda existam preocupações, a maioria de nós compreende estes esforços e compreende onde estamos.
OpenAI precisa construir confiança, não destruí-la
Startups como a OpenAI sem tradição de confiança e segurança ainda precisam ser avaliadas. Esta semana, a empresa de Altman enfrentou um dos primeiros obstáculos.
A OpenAI pode não ter treinado o ChatGPT-4o na voz de Johansson, mas tendo encontrado uma maneira de imitar a voz independentemente da vontade do ator, a empresa acredita que as semelhanças nas vozes das pessoas são justas. E dado que, embora ela se tenha recusado a dar a sua opinião à OpenAI, a empresa fez com que as suas ferramentas parecessem as dela, não tinha interesse em honrar a sua recusa de consentimento.
Altman negou esta versão dos acontecimentos, dizendo em comunicado que a OpenAI escalou uma atriz para interpretar a voz do chatbot Sky antes de entrar em contato com Johansson. “Em homenagem a M. Johansson, suspendemos o uso da voz da Sky em nossos produtos”, acrescentou. “Pedimos desculpas à Sra. Johansson por não ter se comunicado melhor.” A OpenAI não respondeu imediatamente a um pedido de comentários adicionais.
O consentimento também está no centro de um processo de direitos autorais movido contra a OpenAI e a Microsoft sobre texto usado como material de treinamento para modelos de linguagem em larga escala.

Dario Amodei, CEO da empresa de IA Anthropic, disse à VivaTech que a IA “turbou” um pouco a questão dos direitos autorais e da propriedade intelectual. Amodei trabalhou na OpenAI antes de fundar a Anthropic, criadora do chatbot Claude, e criticou seu antigo empregador. Amodei disse que a Antropic até agora se ateve ao texto em vez de introduzir “outras modalidades” precisamente por causa da complexidade destas questões.
À medida que a IA se torna mais inteligente e mais capaz, disse Amodei, nós, como sociedade, precisamos de lidar com a percepção de que por vezes ela infringe desconfortavelmente as capacidades humanas.
Eu diria que já estamos lá.
Como outras tecnologias anteriores, a IA entrou em nossas vidas antes que as barreiras de proteção estivessem em vigor. Os governos estão agora a esforçar-se para corrigir esta situação e dar às empresas de tecnologia um conjunto de regras a seguir. Por exemplo, no início deste ano, a Comissão Federal de Comunicações proibiu o uso de vozes clonadas de IA em chamadas automáticas.
À medida que esta discussão avança, talvez não consigamos bloquear completamente as nossas próprias vozes, mas lembrando que ouvimos vozes vindas das nossas TVs, rádios, telefones, PCs, etc., podemos usar a nova e excitante tecnologia da IA. o mundo. O dispositivo pode ter sido desconectado do proprietário original.
Nota do editor: A CNET usou um mecanismo de IA para criar dezenas de histórias e rotulá-las de acordo. As notas que você está lendo estão anexadas a artigos que cobrem substancialmente o tópico de IA, todos escritos por editores e escritores profissionais. Aprender mais sobre. Política de IA.

