Close Menu
  • Home
  • 24Hours News
  • Ai
  • Backlinks
  • Gadgets
  • Porto
  • Matosinhos
  • Tech

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

What's Hot

Matosinhos acende as luzes de Natal esta sexta-feira

November 25, 2025

Governo propõe aumentar vagas no Ensino Superior

November 25, 2025

Caminhões deixam de pagar pedágio no CREP em 2026

November 25, 2025
Facebook X (Twitter) Instagram
  • Home
  • About Matosinhos24h.com
  • Advertise with Us
  • Contact us
  • DMCA Policy
  • Policy
  • Terms of Use
Facebook X (Twitter) Instagram
MatoSinhos24hMatoSinhos24h
  • Home
  • 24Hours News
  • Ai
  • Backlinks
  • Gadgets
  • Porto
  • Matosinhos
  • Tech
MatoSinhos24hMatoSinhos24h
Home » Em primeiro lugar, o que significa “IA de código aberto”?
Ai

Em primeiro lugar, o que significa “IA de código aberto”?

FranciscoBy FranciscoJune 22, 2024No Comments9 Mins Read
Facebook Twitter Pinterest LinkedIn Tumblr Email
Share
Facebook Twitter LinkedIn Pinterest Email


A luta entre software de código aberto e software proprietário é bem compreendida. Mas as tensões que permearam o mundo do software durante décadas entraram no campo florescente da inteligência artificial, provocando um debate acalorado.

O New York Times publicou recentemente uma crítica elogiosa do CEO da Meta, Mark Zuckerberg, observando como seu trabalho em “IA de código aberto” mais uma vez o tornou popular no Vale do Silício. O problema, entretanto, é que o modelo de linguagem em larga escala da marca Llama da Meta não é realmente de código aberto.

Ou é?

Pela maioria das estimativas, esse não é o caso. No entanto, isto destaca que o conceito de “IA de código aberto” apenas suscitará mais debate nos próximos anos. Este é o problema no qual a Open Source Initiative (OSI), liderada pelo Diretor Executivo Stefano Maffri (foto acima), vem trabalhando há mais de dois anos por meio de um esforço global em conferências, workshops, painéis e webinars nos quais tenho trabalhado. nisto. , relatórios etc.

IA não é código de software

Créditos da imagem: Westend61 (via Getty)

Por mais de um quarto de século, a OSI tem sido a guardiã da Definição de Código Aberto (OSD), que define como o termo “código aberto” pode e deve ser aplicado ao software. As licenças que atendem a esta definição podem ser legalmente consideradas “código aberto”, mas uma ampla variedade de licenças é permitida, desde as muito permissivas até as menos permissivas.

Mas substituir as convenções tradicionais de licenciamento e nomenclatura de software por IA é problemático. Joseph Jacks, um evangelista do código aberto e fundador da empresa de capital de risco OSS Capital, chega ao ponto de dizer que “não existe IA de código aberto” e que “código aberto refere-se explicitamente ao código-fonte do software”. Foi inventado para isso.

Em contraste, “pesos de rede neural” (NNWs) (um termo usado no mundo da inteligência artificial para descrever os parâmetros ou coeficientes que uma rede aprende durante o processo de treinamento) são significativamente comparáveis ​​ao software.

“Os pesos líquidos neurais não são código-fonte de software; eles não podem ser lidos ou depurados por humanos”, ressalta Jacks. “Além disso, os direitos fundamentais de código aberto não se refletem de forma alguma no NNW.”

Isso inspirou Jax e sua colega da OSS Capital, Heather Meeker, a criar sua própria definição, centrada no conceito de “peso aberto”.

Portanto, antes de chegarmos a uma definição significativa de “IA de código aberto”, já podemos ver algumas das tensões inerentes à tentativa de chegar lá. Se não podemos concordar que a “coisa” que estamos tentando definir existe, como poderemos concordar com uma definição?

Naturalmente, Maffuri concorda.

“Esse é um ponto válido”, disse ele ao TechCrunch. “Uma das primeiras discussões que tivemos foi se deveríamos chamá-la de IA de código aberto, mas todo mundo já estava usando esse termo.”

Isto reflete alguns dos desafios no espaço mais amplo da IA. Há muito debate sobre se o que hoje chamamos de “IA” é realmente IA ou apenas sistemas poderosos ensinados a encontrar padrões em grandes quantidades de dados. No entanto, a maioria dos opositores aceita o facto de que a nomenclatura “IA” existe e não faz sentido combatê-la.

Ilustra??o de lhama
Créditos da imagem: Larisa Amosova, via Getty

Fundada em 1998, a OSI é uma corporação de benefício público sem fins lucrativos dedicada a uma infinidade de atividades relacionadas ao código aberto, tendo a defesa, a educação e a definição de código aberto como sua principal razão de ser. Atualmente, a organização depende de patrocínio para financiamento e inclui membros conceituados como Amazon, Google, Microsoft, Cisco, Intel, Salesforce e Meta.

O envolvimento da Meta com o OSI é particularmente notável agora no que se refere ao conceito de “IA de código aberto”. Apesar da Meta vincular suas responsabilidades de IA ao código aberto, a empresa tem limitações notáveis ​​sobre como seu modelo Llama pode ser usado. Obviamente, seu uso é gratuito para pesquisas e casos de uso comercial, mas mais recursos estão disponíveis para desenvolvedores de aplicativos. Mais de 700 milhões de usuários mensais devem solicitar uma licença especial da Meta, que a Meta concederá a seu exclusivo critério.

Simplificando, os irmãos Big Tech do meta podem apitar se quiserem entrar.

A linguagem da Meta em relação ao LLM é um tanto maleável. A empresa se referiu ao seu modelo Llama 2 como código aberto, mas com a chegada do Llama 3 em abril, ela se afastou um pouco dessa terminologia e, em vez disso, usou frases como “aberto disponível” e “abertomente acessível que usei”. No entanto, alguns lugares ainda se referem a este modelo como “código aberto”.

“Todos nesta conversa concordam plenamente que o próprio Llama não pode ser considerado de código aberto”, disse Maffuri. “As pessoas com quem conversei e que trabalham na Meta sabem que isso é um pouco exagerado.”

Além disso, alguns poderão argumentar que existe aqui um conflito de interesses. Significa isto que as empresas que demonstraram o desejo de capitalizar a marca do código aberto também estão a financiar os guardiões da “definição”?

Esta é uma das razões pelas quais a OSI está a trabalhar para diversificar o seu financiamento, garantindo recentemente uma subvenção da Fundação Sloan para apoiar o esforço global de múltiplas partes interessadas para alcançar a definição de IA de código aberto. O TechCrunch pode revelar que a doação é de aproximadamente US$ 250.000, o que Maffulli espera que ajude a mudar a mentalidade sobre a dependência de financiamento corporativo.

“Essa é uma das coisas que a doação do Sloan deixou ainda mais clara: você sempre pode dizer adeus ao dinheiro da metanfetamina”, disse Mahri. “Conseguimos fazer isso antes mesmo desse Sloan Grant, porque sabemos que recebemos doações de outras pessoas e os metas estão bem cientes disso. [process]O mesmo acontece com Microsoft, GitHub, Amazon e Google. Eles sabem absolutamente que não podem interferir porque a estrutura da organização não o permite. ”

Uma definição prática de IA de código aberto

Diagrama conceitual que descreve como encontrar uma definição
Créditos da imagem: Alexei Morozov/Getty Images

O atual rascunho de definição de IA de código aberto é a versão 0.0.8 e consiste em três partes principais. A própria definição de IA de código aberto. Uma lista de verificação completa dos componentes necessários para um sistema de IA compatível com código aberto.

De acordo com o projecto actual, os sistemas de IA de código aberto devem dar às pessoas a liberdade de utilizar o sistema para qualquer fim sem obter permissão. Para permitir que outros estudem como o sistema funciona e inspecionem seus componentes. Modifique e compartilhe o sistema para qualquer finalidade.

Mas um dos maiores desafios gira em torno dos dados. Em outras palavras, um sistema de IA pode ser classificado como “código aberto” se a empresa não disponibilizar seus conjuntos de dados de treinamento para outras pessoas. É mais importante saber se os dados foram rotulados, desduplicados ou filtrados? Você também pode acessar o código usado para montar conjuntos de dados de diversas fontes.

“Saber que essa informação é muito melhor do que um simples conjunto de dados que não inclui o resto”, diz Maffuri.

Embora fosse útil ter acesso a um conjunto de dados completo (o OSI torna este um componente “opcional”), Maffulli diz que isso muitas vezes não é possível ou prático. Isso pode ocorrer porque o conjunto de dados contém informações confidenciais ou protegidas por direitos autorais que o desenvolvedor não tem permissão para redistribuir. Além disso, existem técnicas para treinar modelos de aprendizado de máquina onde os dados em si não são realmente compartilhados com o sistema, usando técnicas como aprendizado federado, privacidade diferencial e criptografia homomórfica.

E isso destaca perfeitamente a diferença fundamental entre “software de código aberto” e “IA de código aberto”. Embora as intenções possam ser semelhantes, não são as mesmas, e é esta diferença que a OSI procura captar no seu documento. significado.

No software, o código-fonte e o código binário são duas visões do mesmo artefato, refletindo o mesmo programa em formas diferentes. No entanto, o conjunto de dados de treinamento e o modelo de treinamento subsequente são separados. Embora você possa usar o mesmo conjunto de dados, isso não garante que você possa recriar consistentemente o mesmo modelo.

“Há muita lógica estatística e aleatória acontecendo durante o treinamento, o que significa que não pode ser replicado da mesma forma que o software”, acrescentou Maffuri.

Portanto, os sistemas de IA de código aberto devem ter instruções claras e ser facilmente replicáveis. E é aqui que entra em jogo o aspecto da lista de verificação de definição de IA de código aberto. Esta definição é baseada em um artigo acadêmico publicado recentemente intitulado “Model Openness Framework: Promoting Integrity and Openness for Reproducibility, Transparency, and Usabilidade em Inteligência Artificial”.

Neste artigo, propomos o Model Openness Framework (MOF), um sistema de classificação que avalia modelos de aprendizado de máquina “com base em sua integridade e abertura”. O MOF exige que certos componentes do desenvolvimento do modelo de IA, incluindo detalhes sobre metodologias de treinamento e parâmetros do modelo, sejam “incorporados e lançados sob licenças abertas apropriadas”.

condição estável

Stefano Maffri falando na Cúpula de Membros da Digital Public Goods Alliance (DPGA) em Adis Abeba
Stefano Maffri fala na Cúpula de Membros da Digital Public Goods Alliance (DPGA) em Adis Abeba.
Créditos da imagem: O.S.I.

OSI refere-se ao lançamento oficial desta definição como uma “versão estável”. Isso é semelhante ao modo como as empresas trabalham com aplicativos que foram exaustivamente testados e depurados antes do horário nobre. A OSI intencionalmente não chamou isso de “versão final”, pois é provável que algumas delas evoluam.

“Você realmente não pode esperar que esta definição dure 26 anos como a definição de código aberto”, disse Mahri. “Não esperamos que a parte superior da definição, como 'O que é um sistema de IA?', mude muito. Mas a lista de peças, os componentes aos quais nos referimos na lista de verificação, dependerá do. tecnologia. Quem sabe como será a tecnologia amanhã?”

Espera-se que uma definição estável de IA de código aberto seja aprovada pelo conselho na conferência All Things Open no final de outubro, e a OSI embarcou em um roadshow global pelos cinco continentes nos meses seguintes para criar uma “busca de informações mais diversificada”. Como a “IA de código aberto” será definida no futuro. No entanto, as alterações finais provavelmente serão apenas “pequenos ajustes” aqui e ali.

“Esta é a fase final”, disse Makhuli. “Chegamos a uma versão totalmente funcional da definição. Temos todos os elementos de que precisamos. Agora que temos uma lista de verificação, estamos garantindo que não haja surpresas nela. O que devemos incluir? , ou não sistema para excluir.”



Source link

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
Francisco
  • Website

Related Posts

As ações da Microsoft caem mais de 6% após queda nos lucros devido à última decepção com IA

July 30, 2024

Airtable adquire startup de integração de talentos de IA Dopt

July 30, 2024

Os avatares de IA poderão em breve participar de reuniões em nosso nome, mas certamente parece uma ladeira escorregadia em direção a um futuro de IA que nenhum de nós deseja.

July 30, 2024
Add A Comment
Leave A Reply Cancel Reply

Editors Picks

As ações da Microsoft caem mais de 6% após queda nos lucros devido à última decepção com IA

July 30, 2024

Airtable adquire startup de integração de talentos de IA Dopt

July 30, 2024

Os avatares de IA poderão em breve participar de reuniões em nosso nome, mas certamente parece uma ladeira escorregadia em direção a um futuro de IA que nenhum de nós deseja.

July 30, 2024

Microsoft pede novas leis contra golpes deepfake e imagens de abuso sexual de IA

July 30, 2024
Top Reviews
MatoSinhos24h
Facebook X (Twitter) Instagram Pinterest Vimeo YouTube
  • Home
  • About Matosinhos24h.com
  • Advertise with Us
  • Contact us
  • DMCA Policy
  • Policy
  • Terms of Use
© 2025 matosinhos24h. Designed by matosinhos24h.

Type above and press Enter to search. Press Esc to cancel.