Como muitas empresas de IA, a Udio e a Suno confiaram em roubos em grande escala para criar modelos generativos de IA. Isso é o que eles admitem, mesmo antes de o novo processo da indústria musical contra eles chegar a um juiz. Se o caso for a um júri, poderá servir tanto como uma exposição prejudicial quanto como um precedente muito útil para empresas de IA igualmente antiéticas que enfrentam certos riscos legais.
A ação foi movida com grande alarde pela Recording Industry Association of America na segunda-feira, colocando todos nós na desconfortável posição de torcer pela RIAA, que tem sido a vilã da mídia digital há décadas. Eu mesmo recebi Nastygrams deles. O incidente em si é claro.
A essência desses dois processos muito semelhantes é que Suno e Udio (tecnicamente, Uncharted Labs, fazendo negócios como Udio) saquearam indiscriminadamente mais ou menos toda a história da música gravada para formar um conjunto de dados e usá-lo. Treine uma IA para gerar música.
Uma observação rápida aqui: essas IAs não “geram” tanto quanto tentam combinar seus prompts com padrões nos dados de treinamento e completar esses padrões. De certa forma, tudo o que esses modelos fazem é apresentar um cover ou mashup das músicas que capturam.
Para todos os efeitos (incluindo fins legais), não há dúvida de que Suno e Udio ingeriram os dados acima mencionados. Os executivos corporativos e os investidores têm sabiamente mantido silêncio sobre as questões de direitos autorais nesta área.
Eles reconhecem que a única maneira de criar um bom modelo de geração musical é ingerir uma grande quantidade de música de alta qualidade, muitas das quais estarão protegidas por direitos autorais. Esta é uma etapa simplesmente necessária para criar esse tipo de modelo de aprendizado de máquina.
Mais tarde, ele admitiu ter feito isso sem a permissão do proprietário dos direitos autorais. O investidor Brian Hiatt disse à Rolling Stone há apenas alguns meses:
Para ser honesto, se esta empresa tivesse assinado contrato com uma gravadora quando começou, eu provavelmente não teria investido. Acho que precisávamos criar este produto sem quaisquer restrições.
Não diga que roubei música do século I, apenas diga que roubei música do século I, ok. Para ser claro, por “restrições” quero dizer a lei de direitos autorais.
Finalmente, as empresas disseram aos advogados da RIAA que acreditam que todas essas fraudes na mídia se enquadram na doutrina do uso justo. O princípio do uso justo aplica-se basicamente apenas em casos de utilização não autorizada de uma obra. Agora, está claro que o uso justo é um conceito complexo e ambíguo em termos de ideia e prática. Mas uma empresa com US$ 100 milhões no bolso está roubando todas as músicas já feitas, duplicando-as em massa e vendendo o resultado. Não sou advogado, mas isso parece um pouco fora da zona de conforto pretendida, por exemplo: Um aluno do 7º ano usa uma música do Pearl Jam como pano de fundo para um vídeo sobre o aquecimento global.
Francamente, o ganso destas empresas parece cozido demais. Eles claramente seguem uma página do manual da OpenAI, usam secretamente obras protegidas por direitos autorais e, em seguida, usam linguagem evasiva e desorientação para tirar o financiamento de escritores, jornalistas e outros com menos poder econômico. Eu esperava poder influenciar os críticos sem brilho. Uma vez expostas as práticas covardes das empresas de IA, já não importa se elas se tornaram a única opção de distribuição.
Em outras palavras, negar, desviar e atrasar. Idealmente, você pode girar até que a situação mude e você faça um acordo com seus críticos. Para um LLM, seria uma organização de notícias, etc., e neste caso seria uma gravadora. Os geradores de música esperavam claramente conseguir o que queriam das gravadoras no final. posição de poder. “Claro, roubamos suas coisas, mas agora é um grande negócio. Você não preferiria jogar conosco do que contra nós?” Isso é comum no Vale do Silício. É uma estratégia de sucesso, principalmente porque só custa dinheiro.
Mas com uma arma fumegante na mão, é ainda mais difícil retirá-la. E, infelizmente para Woody e Snow, a RIAA incluiu milhares de músicas em seu processo. É uma música de propriedade da RIAA e claramente uma música regurgitada pelo modelo musical. Como o Jackson 5 ou o Maroon 5, uma música “gerada” é apenas uma versão levemente distorcida da original. Isto não é possível se o original não estiver incluído nos dados de treinamento.
Devido à natureza dos LLMs, especificamente quanto mais você escreve, mais você tende a ter alucinações e perder o controle do enredo, você não vai regurgitar um livro inteiro, por exemplo. A OpenAI poderia argumentar de forma plausível que os trechos citados por seu modelo foram retirados de análises, primeiras páginas disponíveis online, etc., e isso se tornou um problema no processo dos autores contra a OpenAI. (O movimento recente das traves é fez No início eles usavam obras protegidas por direitos autorais, mas depois pararam de usá-las. É engraçado porque é como dizer que você espreme o suco de uma laranja uma vez e depois não usa mais. )
quem é você? Não pode Seu gerador de música afirma plausivelmente que ouviu apenas alguns compassos de “Great Balls of Fire” e de alguma forma conseguiu cuspir o resto palavra por palavra, acorde por acorde. Qualquer juiz ou júri riria na cara deles e, se tivesse sorte, um artista do tribunal teria a chance de explicar isso.
Isto não é apenas intuitivamente óbvio, mas também uma questão jurídica significativa. Porque fica claro que a modelo está recriando a peça inteira. Isto permitirá à RIAA argumentar que Udio e Suno estão a causar danos reais e significativos aos negócios dos detentores de direitos de autor e artistas que estão a ser regurgitados, e permitirá ao juiz, no início do julgamento, ordenar todos os negócios da empresa de IA. Você poderá pedir para parar. Com uma liminar.
O parágrafo inicial do seu livro foi extraído do LLM? Essa é uma questão intelectual que vale a pena discutir detalhadamente. Loja de dólares “Call Me Mayy” gerada sob demanda? Não estou dizendo que isso seja verdade, mas é altamente provável.
A resposta previsível das empresas era que o sistema não era assim. foi planejado Reprodução de obras protegidas por direitos autorais: uma tentativa desesperada e nua de responsabilizar os usuários sob o porto seguro da Seção 230. Em outras palavras, o Instagram não é responsável se você usar uma música protegida por direitos autorais no fundo dos seus Reels. Este argumento parece pouco convincente aqui, dada a admissão da própria empresa acima de que ignorou os direitos autorais em primeiro lugar.
Qual será o resultado destes processos judiciais? Tal como acontece com todas as coisas relacionadas com a IA, é simplesmente impossível dizer com antecedência, pois há poucos precedentes ou teoria estabelecida que possam ser aplicados.
A minha previsão, mais uma vez, falta-me conhecimento real, é que as empresas serão forçadas a tornar públicos os seus dados e métodos de formação. Estas são obviamente importantes como provas. Quando você vir isso, e o claro uso indevido de material protegido por direitos autorais e comunicações (presumivelmente) indicando que eles estão cientes de que estão infringindo a lei, talvez seja incentivado um acordo contra Udio e Suno ou tentativas de evitar julgamento e/ou sentença rápida. . Também seria forçado a encerrar quaisquer operações que dependam de um modelo baseado em roubo. Pelo menos uma das duas empresas provavelmente tentará permanecer no mercado usando fontes musicais legais (ou pelo menos legalmente adjacentes), mas o modelo resultante será de qualidade significativamente inferior e os usuários fugirão.
Investidor? Idealmente, eles perderiam a camisa apostando em algo claramente ilegal e antiético. Ela vem não apenas dos olhos da nebulosa Writers Association, mas também da mente jurídica da notoriamente implacável litigante RIAA. Se os danos equivalem a dinheiro em caixa ou a fundos prometidos, ninguém sabe.
O impacto pode ser de longo alcance. Se um investidor numa nova startup de mídia generativa de alto perfil vê de repente US$ 100 milhões evaporados devido à natureza fundamental da mídia generativa, de repente um nível diferente de diligência me parece apropriado. O que as empresas poderiam ter dito, ou mais importante, o que diriam, para evitar responsabilidades e evitar especulações dos detentores de direitos autorais, seja em processos judiciais (se houver) ou em documentos de acordo, etc. feito.
Embora este caso específico pareça quase uma conclusão precipitada, nem todas as empresas de IA são tão generosas em deixar as suas impressões digitais nas cenas do crime. Esta seria uma lição objectiva de arrogância, em vez de uma estratégia para perseguir outras empresas geradoras de IA ou acordos leiteiros. É bom conseguir algo assim de vez em quando, mesmo que esse professor seja um RIAA.

