Parece que quase todos os dias há um novo motivo para ficar frustrado com a IA. A razão brota da sopa primordial da supuração inconsciente e emerge à luz da raiva. impacto económico, roubo de emprego; Roubo de conteúdo protegido por direitos autoraise o simples fato de que é apenas Incorreta As redes neurais sem vida deveriam fazer sentido para qualquer pessoa consciente. E agora você tem outro motivo para estar zangado com os bugs de IA de outro mundo. Isso significa que eles estão obstruindo a largura de banda do seu servidor sem a sua permissão.
Sim, eu sabia que algumas empresas extraem conteúdo de sites para treinar seus modelos de IA. Também reconhecemos que podemos fazer isso sem a permissão do site. No entanto, eles não consideraram o impacto que isso teria nos servidores que executam esses sites. Kyle Wiens, CEO da iFixitestá aqui para que todos nós saibamos que isso está realmente acontecendo, enquanto perguntamos à empresa de IA Anthropic: “Você precisa acessar seu servidor um milhão de vezes em 24 horas?”
Supondo que Wiens não esteja exagerando, não é surpresa que isso esteja “desperdiçando recursos Devops”. Um milhão de “acessos” por dia seria suficiente para justificar algum transtorno.
O problema é que contextualizar essa farra de largura de banda só a torna ainda mais ridícula, e é isso que Wiens está buscando. As empresas de IA não apenas parecem estar sobrecarregando os recursos do servidor, mas também estão explicitamente proibidas de usar o conteúdo em seus servidores.
Não deveria haver razão para as empresas de IA sofrerem um grande golpe. Site iFixit Porque seus termos de uso declaram que “Copie ou distribua qualquer conteúdo, materiais ou elementos de design no Site para qualquer outra finalidade, incluindo treinamento de aprendizado de máquina ou modelos de IA, sem a permissão prévia e expressa por escrito do iFixit.'' É estritamente proibido fazê-lo. faça isso.” A menos que seja isso que você quer que acreditemos não tem Você pretende usar todos os dados coletados para esses fins, mas está fazendo isso apenas por… diversão?
@AnthropicAI: Entendo que você está ávido por dados. Claude é muito inteligente! Mas você realmente precisa acessar seu servidor um milhão de vezes em 24 horas? Além de recuperar conteúdo sem pagar por isso, você estará usando seus recursos de DevOps. Não é legal.24 de julho de 2024
Bem, em qualquer caso, o iFixit Decidi aproveitar Viena Ele o pegou e perguntou à IA da Anthropic, Claude, sobre isso, dizendo à Anthropic: “Não me pergunte, pergunte a Claude!” Claude parece concordar com o iFixit. Porque quando questionado sobre o que faria se estivesse treinando um modelo de aprendizado de máquina e encontrasse a afirmação acima em seus termos de serviço, ele respondeu em termos inequívocos: “Não use o conteúdo”. ”
Como aponta Wiens, isso pode ser encontrado simplesmente visitando os Termos de Serviço. Isso me faz pensar se pelo menos algumas empresas de IA, buscando perdão em vez de permissão, não se preocupam em verificar os ToS em primeiro lugar.
Como observação lateral, o site iFixit possui um arquivo robots.txt que proíbe explicitamente o rastreamento do site (infelizmente, isso pode ser ignorado por “bots ruins”). Esta entrada pode já existir, mas imagino que o iFixit apenas a adicionou para criar uma declaração contra bots travessos, uma declaração imposta aos bots por uma confissão de culpa de fato.

