Quando eu era criança, minha família não tinha TV a cabo e não assistíamos muita TV, então experimentei o beisebol pelo rádio de cabeceira. Todas as noites durante a temporada regular, acompanhei os Yankees através dos comentários do locutor John Sterling. Sterling tornou-se um pioneiro do locutor esportivo, fornecendo comentários ao lado de Michael Kay e mais tarde de Sujin Waldman.
Ainda posso recitar partes da ligação de Sterling. Davi Wells! David Wells fez um jogo perfeito. Até às 27:00. 27 abaixo. A imortalidade do beisebol de David Wells! E os Yankees vencem… entendo, os Yankees vencem! Como fã, cheguei cedo ao estádio não para comprar um bobblehead de jogador descartável, mas para ter certeza de que ganharia uma camiseta com as falas de Jung e Soojin legendadas. Isso é beisebol, Soojin..
Esses momentos me tocaram esta semana, depois que Sterling, 85, anunciou sua aposentadoria após uma carreira de 36 anos e 5.631 lutas, que incluiu sete campeonatos mundiais. Ele foi homenageado ontem no Yankee Stadium. Stirling recebeu todos os elogios habituais: “incomparável”, “inequável” e “insubstituível”. Há alguma verdade nesses clichês. Ele é amado e celebrado por sua combinação de dignidade e acampamento. chamada de home run personalizada Para todos os jogadores do Yankee, Sterling é definitivamente diferente de qualquer outro locutor do jogo. Mas, como repórter que cobre a tecnologia e o seu impacto na nossa cultura, perguntei-me se as afirmações de Sterling sobre a singularidade e a irrepetibilidade da voz estariam ultrapassadas.
Em janeiro, os golpistas criaram uma chamada automática perfeitamente convincente na qual o presidente Joe Biden parecia instar o Partido Democrata de New Hampshire a ficar de fora das primárias do estado. Graças aos avanços na tecnologia de IA, agora é muito fácil clonar digitalmente a sua própria voz ou a de outra pessoa. Esses desenvolvimentos levantam a questão: “O que torna uma voz única e é algo que ninguém mais consegue imitar?” Não poderia um Sterling simulado, treinado por anos de jogadas, assumir o controle de seus comentários muito depois de sua partida? Sua imagem poderia ser facilmente licenciada e revivida por uma empresa de entretenimento empreendedora?
A resposta é não. A razão é que não importa quão avançada seja a inteligência artificial, há algumas coisas que ela nunca poderá substituir. A grande vantagem dos locutores esportivos não é apenas o ritmo de seus comentários, mas sua capacidade de transmitir o que estão vivenciando e cativar seus ouvintes. Os melhores comentaristas de cada jogada nos arrastaram para uma conspiração preocupante. Juntos, perseveramos em cada arremesso, swing e erro. O que há de especial nos locutores é que eles podem viver esse momento conosco, compartilhando nossa emoção, ansiedade, surpresa e desgosto, mais do que apenas uma mudança de palavras.
Por definição, os computadores não podem fornecer isso. Não importa o quanto Starling Robo Starling pareça, ele nunca será capaz de nos convencer de que se preocupa com o jogo tanto quanto Starling. A IA pode conseguir copiar essa estranheza, mas não consegue recriar a sensação de uma experiência compartilhada. Basicamente, imitar emoções automaticamente não é estimulante. É alienante e uma imitação sem alma da interação humana, desprovida de sua essência.
Esta verdade aplica-se não apenas aos anúncios desportivos, mas também a outros géneros de vozes artificiais. A narração por IA pode desempenhar a função prática de ler este artigo e transmitir a informação aos seus ouvidos, mas não pode produzir uma balada comovente de perda e saudade.
Bem, tecnicamente é possível. O gerador de música Sumo recentemente ganhou as manchetes por sua capacidade de produzir músicas de forma impressionante em uma infinidade de gêneros e estilos. No mês passado, o jornalista Ross Anderson usou a ferramenta para criar um álbum conceitual interessante que incluía: cocomelonBobagens de estilo celebrando as alegrias do trabalho infantil e uma luxuosa cabana no mar sobre a revanche sem fim entre Biden e Trump.
Eu próprio pratico sumô para criar uma elegia folclórica plausível para a comunidade judaica perdida de Vilna, o lar histórico da erudição, da cultura e do fermento político judaico destruído pelo Holocausto. “Nas ruas de paralelepípedos, as melodias enchiam o ar, e nos teatros iídiche, as almas eram desnudas”, canta o vocalista virtual. “Mas a escuridão se aproximou e uma tempestade começou a soprar/O destino da vibrante cidade de Vilna não poderia ser desfeito.”
Mas essa música basicamente falha pelo mesmo motivo que Pseudo-Sterling. Em outras palavras, o ouvinte não acredita realmente que o falante se preocupa com o assunto. Assim como a IA não investe realmente no jogo de beisebol ou nos Yankees, ela não lamenta a perda de vidas judaicas em Vilna nem se pergunta como teria sido visitar a cidade antes de ser destruída. Eu nem penso nisso. Quanto mais música quisermos, menos a IA pode fornecer. Como tal, esses geradores são mais adequados para criar músicas pop chiclete ou hinos dançantes cativantes, em vez de qualquer coisa existencialmente complexa. Temos dificuldade em ter empatia com coisas que percebemos terem sido criadas sem empatia.
John Sterling é uma pessoa especial para os fãs dos Yankees. Mas ele me ensinou mais do que apenas beisebol. Isto é, certos aspectos da experiência humana nunca podem ser duplicados ou substituídos. O que nos torna quem somos não são apenas as histórias que contamos, mas as histórias que compartilhamos e com as quais convivemos.

