A luta entre software de código aberto e software proprietário é bem compreendida. Mas as tensões que permearam o mundo do software durante décadas entraram no campo florescente da inteligência artificial, provocando um debate acalorado.
O New York Times publicou recentemente uma crítica elogiosa do CEO da Meta, Mark Zuckerberg, observando como seu trabalho em “IA de código aberto” mais uma vez o tornou popular no Vale do Silício. O problema, entretanto, é que o modelo de linguagem em larga escala da marca Llama da Meta não é realmente de código aberto.
Ou é?
Pela maioria das estimativas, esse não é o caso. No entanto, isto destaca que o conceito de “IA de código aberto” apenas suscitará mais debate nos próximos anos. Este é o problema no qual a Open Source Initiative (OSI), liderada pelo Diretor Executivo Stefano Maffri (foto acima), vem trabalhando há mais de dois anos por meio de um esforço global em conferências, workshops, painéis e webinars nos quais tenho trabalhado. nisto. , relatórios etc.
IA não é código de software

Por mais de um quarto de século, a OSI tem sido a guardiã da Definição de Código Aberto (OSD), que define como o termo “código aberto” pode e deve ser aplicado ao software. As licenças que atendem a esta definição podem ser legalmente consideradas “código aberto”, mas uma ampla variedade de licenças é permitida, desde as muito permissivas até as menos permissivas.
Mas substituir as convenções tradicionais de licenciamento e nomenclatura de software por IA é problemático. Joseph Jacks, um evangelista do código aberto e fundador da empresa de capital de risco OSS Capital, chega ao ponto de dizer que “não existe IA de código aberto” e que “código aberto refere-se explicitamente ao código-fonte do software”. Foi inventado para isso.
Em contraste, “pesos de rede neural” (NNWs) (um termo usado no mundo da inteligência artificial para descrever os parâmetros ou coeficientes que uma rede aprende durante o processo de treinamento) são significativamente comparáveis ao software.
“Os pesos líquidos neurais não são código-fonte de software; eles não podem ser lidos ou depurados por humanos”, ressalta Jacks. “Além disso, os direitos fundamentais de código aberto não se refletem de forma alguma no NNW.”
Isso inspirou Jax e sua colega da OSS Capital, Heather Meeker, a criar sua própria definição, centrada no conceito de “peso aberto”.
Portanto, antes de chegarmos a uma definição significativa de “IA de código aberto”, já podemos ver algumas das tensões inerentes à tentativa de chegar lá. Se não podemos concordar que a “coisa” que estamos tentando definir existe, como poderemos concordar com uma definição?
Naturalmente, Maffuri concorda.
“Esse é um ponto válido”, disse ele ao TechCrunch. “Uma das primeiras discussões que tivemos foi se deveríamos chamá-la de IA de código aberto, mas todo mundo já estava usando esse termo.”
Isto reflete alguns dos desafios no espaço mais amplo da IA. Há muito debate sobre se o que hoje chamamos de “IA” é realmente IA ou apenas sistemas poderosos ensinados a encontrar padrões em grandes quantidades de dados. No entanto, a maioria dos opositores aceita o facto de que a nomenclatura “IA” existe e não faz sentido combatê-la.

Fundada em 1998, a OSI é uma corporação de benefício público sem fins lucrativos dedicada a uma infinidade de atividades relacionadas ao código aberto, tendo a defesa, a educação e a definição de código aberto como sua principal razão de ser. Atualmente, a organização depende de patrocínio para financiamento e inclui membros conceituados como Amazon, Google, Microsoft, Cisco, Intel, Salesforce e Meta.
O envolvimento da Meta com o OSI é particularmente notável agora no que se refere ao conceito de “IA de código aberto”. Apesar da Meta vincular suas responsabilidades de IA ao código aberto, a empresa tem limitações notáveis sobre como seu modelo Llama pode ser usado. Obviamente, seu uso é gratuito para pesquisas e casos de uso comercial, mas mais recursos estão disponíveis para desenvolvedores de aplicativos. Mais de 700 milhões de usuários mensais devem solicitar uma licença especial da Meta, que a Meta concederá a seu exclusivo critério.
Simplificando, os irmãos Big Tech do meta podem apitar se quiserem entrar.
A linguagem da Meta em relação ao LLM é um tanto maleável. A empresa se referiu ao seu modelo Llama 2 como código aberto, mas com a chegada do Llama 3 em abril, ela se afastou um pouco dessa terminologia e, em vez disso, usou frases como “aberto disponível” e “abertomente acessível que usei”. No entanto, alguns lugares ainda se referem a este modelo como “código aberto”.
“Todos nesta conversa concordam plenamente que o próprio Llama não pode ser considerado de código aberto”, disse Maffuri. “As pessoas com quem conversei e que trabalham na Meta sabem que isso é um pouco exagerado.”
Além disso, alguns poderão argumentar que existe aqui um conflito de interesses. Significa isto que as empresas que demonstraram o desejo de capitalizar a marca do código aberto também estão a financiar os guardiões da “definição”?
Esta é uma das razões pelas quais a OSI está a trabalhar para diversificar o seu financiamento, garantindo recentemente uma subvenção da Fundação Sloan para apoiar o esforço global de múltiplas partes interessadas para alcançar a definição de IA de código aberto. O TechCrunch pode revelar que a doação é de aproximadamente US$ 250.000, o que Maffulli espera que ajude a mudar a mentalidade sobre a dependência de financiamento corporativo.
“Essa é uma das coisas que a doação do Sloan deixou ainda mais clara: você sempre pode dizer adeus ao dinheiro da metanfetamina”, disse Mahri. “Conseguimos fazer isso antes mesmo desse Sloan Grant, porque sabemos que recebemos doações de outras pessoas e os metas estão bem cientes disso. [process]O mesmo acontece com Microsoft, GitHub, Amazon e Google. Eles sabem absolutamente que não podem interferir porque a estrutura da organização não o permite. ”
Uma definição prática de IA de código aberto

O atual rascunho de definição de IA de código aberto é a versão 0.0.8 e consiste em três partes principais. A própria definição de IA de código aberto. Uma lista de verificação completa dos componentes necessários para um sistema de IA compatível com código aberto.
De acordo com o projecto actual, os sistemas de IA de código aberto devem dar às pessoas a liberdade de utilizar o sistema para qualquer fim sem obter permissão. Para permitir que outros estudem como o sistema funciona e inspecionem seus componentes. Modifique e compartilhe o sistema para qualquer finalidade.
Mas um dos maiores desafios gira em torno dos dados. Em outras palavras, um sistema de IA pode ser classificado como “código aberto” se a empresa não disponibilizar seus conjuntos de dados de treinamento para outras pessoas. É mais importante saber se os dados foram rotulados, desduplicados ou filtrados? Você também pode acessar o código usado para montar conjuntos de dados de diversas fontes.
“Saber que essa informação é muito melhor do que um simples conjunto de dados que não inclui o resto”, diz Maffuri.
Embora fosse útil ter acesso a um conjunto de dados completo (o OSI torna este um componente “opcional”), Maffulli diz que isso muitas vezes não é possível ou prático. Isso pode ocorrer porque o conjunto de dados contém informações confidenciais ou protegidas por direitos autorais que o desenvolvedor não tem permissão para redistribuir. Além disso, existem técnicas para treinar modelos de aprendizado de máquina onde os dados em si não são realmente compartilhados com o sistema, usando técnicas como aprendizado federado, privacidade diferencial e criptografia homomórfica.
E isso destaca perfeitamente a diferença fundamental entre “software de código aberto” e “IA de código aberto”. Embora as intenções possam ser semelhantes, não são as mesmas, e é esta diferença que a OSI procura captar no seu documento. significado.
No software, o código-fonte e o código binário são duas visões do mesmo artefato, refletindo o mesmo programa em formas diferentes. No entanto, o conjunto de dados de treinamento e o modelo de treinamento subsequente são separados. Embora você possa usar o mesmo conjunto de dados, isso não garante que você possa recriar consistentemente o mesmo modelo.
“Há muita lógica estatística e aleatória acontecendo durante o treinamento, o que significa que não pode ser replicado da mesma forma que o software”, acrescentou Maffuri.
Portanto, os sistemas de IA de código aberto devem ter instruções claras e ser facilmente replicáveis. E é aqui que entra em jogo o aspecto da lista de verificação de definição de IA de código aberto. Esta definição é baseada em um artigo acadêmico publicado recentemente intitulado “Model Openness Framework: Promoting Integrity and Openness for Reproducibility, Transparency, and Usabilidade em Inteligência Artificial”.
Neste artigo, propomos o Model Openness Framework (MOF), um sistema de classificação que avalia modelos de aprendizado de máquina “com base em sua integridade e abertura”. O MOF exige que certos componentes do desenvolvimento do modelo de IA, incluindo detalhes sobre metodologias de treinamento e parâmetros do modelo, sejam “incorporados e lançados sob licenças abertas apropriadas”.
condição estável

OSI refere-se ao lançamento oficial desta definição como uma “versão estável”. Isso é semelhante ao modo como as empresas trabalham com aplicativos que foram exaustivamente testados e depurados antes do horário nobre. A OSI intencionalmente não chamou isso de “versão final”, pois é provável que algumas delas evoluam.
“Você realmente não pode esperar que esta definição dure 26 anos como a definição de código aberto”, disse Mahri. “Não esperamos que a parte superior da definição, como 'O que é um sistema de IA?', mude muito. Mas a lista de peças, os componentes aos quais nos referimos na lista de verificação, dependerá do. tecnologia. Quem sabe como será a tecnologia amanhã?”
Espera-se que uma definição estável de IA de código aberto seja aprovada pelo conselho na conferência All Things Open no final de outubro, e a OSI embarcou em um roadshow global pelos cinco continentes nos meses seguintes para criar uma “busca de informações mais diversificada”. Como a “IA de código aberto” será definida no futuro. No entanto, as alterações finais provavelmente serão apenas “pequenos ajustes” aqui e ali.
“Esta é a fase final”, disse Makhuli. “Chegamos a uma versão totalmente funcional da definição. Temos todos os elementos de que precisamos. Agora que temos uma lista de verificação, estamos garantindo que não haja surpresas nela. O que devemos incluir? , ou não sistema para excluir.”

