- Meta usa fotos públicas e textos do Instagram e do Facebook para treinar um gerador de texto para imagem de IA.
- O executivo da Meta, Chris Cox, disse ao Bloomberg Tech Summit que a empresa “não treina pessoas em assuntos privados”.
- Os comentários do diretor de produtos ocorrem no momento em que as grandes empresas de tecnologia correm para adquirir dados para treinar modelos de IA.
As grandes empresas de tecnologia estão competindo por dados de treinamento de IA, e a Meta parece ter uma grande vantagem sobre seus rivais. Isso significa usar fotos do Instagram e do Facebook.
Chris Cox, diretor de produtos da Meta, disse quinta-feira no Bloomberg Tech Summit que a plataforma usa fotos e textos disponíveis publicamente para treinar um modelo gerador de texto para imagem chamado Emu.
“Não treinamos em coisas privadas. Não treinamos em coisas que as pessoas compartilham com seus amigos. Treinamos em coisas que são públicas”, disse ele.
Como o Instagram tem muitas fotos “de arte, moda, cultura, e não apenas imagens de pessoas e de nós”, o modelo de texto para imagem da Meta pode produzir “imagens de qualidade realmente incríveis”, disse Cox.
Os usuários podem criar imagens no Meta AI inserindo um prompt que começa com a palavra “imagine”, e quatro imagens serão geradas, segundo o site.
Para que um modelo de IA seja eficaz, ele deve ser treinado por meio da inserção de dados. é uma questão discutível, Não há como evitar Evite que conteúdo protegido por direitos autorais seja coletado da Internet e usado para criar seu LLM.
No entanto, o Gabinete de Direitos de Autor dos EUA tem tentado resolver esta questão desde o início do ano passado e está a considerar alterar a lei para resolver a questão.
Uma das maneiras pelas quais as empresas estão tentando capturar dados é por meio de parcerias com outras empresas. Por exemplo, a OpenAI faz parceria com vários meios de comunicação para licenciar conteúdo e desenvolver modelos para ele.
O New York Times informou no mês passado que a Meta chegou a considerar adquirir a editora Simon & Schuster para obter mais dados para treinar seus modelos.
Além dos conjuntos de dados brutos, as empresas utilizam “ciclos de feedback” – dados recolhidos de interações passadas e resultados que são analisados para melhorar o desempenho futuro – para treinar modelos. Ele contém algoritmos que informam ao modelo de IA quando ocorre um erro, para que ele possa aprender com ele.
O CEO da Meta, Mark Zuckerberg, disse ao The Verge no mês passado que os ciclos de feedback são “mais valiosos” do que qualquer “corpus inicial”.
A Meta não respondeu imediatamente ao pedido de comentários do Business Insider fora do horário comercial normal.

