
Créditos da imagem: Imagens Hispânicas/Getty
Um novo relatório destaca a procura por startups que criem ferramentas e tecnologias de código aberto para a revolução da IA, e a indústria adjacente de infraestruturas de dados também está a aquecer.
A Runa Capital, uma empresa de capital de risco (VC) que começou no Vale do Silício e mudou sua sede para Luxemburgo em 2022, publicou o índice Runa Open Source Startup (ROSS) dos últimos quatro anos, destacando empresas de rápido crescimento. está adivinhando. Inicialização de software comercial de código aberto (COSS). A empresa publica atualizações trimestrais, mas no ano passado produziu o seu primeiro relatório anual com uma visão de cima para baixo de todo o ano de 2022, que pretende repetir em 2023.
tendência
Os dados andam de mãos dadas com a IA porque a IA depende dos dados para aprender e fazer previsões, o que requer uma infraestrutura para gerir a recolha, o armazenamento e o processamento de dados. E estas tendências tangenciais colidiram neste relatório.
No topo do índice ROSS do ano passado estava LangChain, uma startup de dois anos com sede em São Francisco que desenvolveu uma estrutura de código aberto para a construção de aplicativos baseados em modelos de linguagem de grande escala (LLMs). O principal projeto da empresa atingirá 72.500 estrelas em 2023, e a Sequoia foi definida para liderar uma rodada da Série A de US$ 25 milhões em Langchain no mês passado.

As 10 principais startups COSS no índice ROSS em 2023 créditos da imagem: Runa Capital
Também entre os 10 primeiros está o Reflex, uma estrutura de código aberto para a construção de aplicativos web em Python puro, cuja empresa garantiu recentemente um investimento inicial de US$ 5 milhões. AITable, um construtor de chatbot de IA baseado em planilhas semelhante ao seu concorrente de código aberto Airtable. Sismo é uma plataforma focada na privacidade que permite aos usuários divulgar seletivamente dados pessoais para aplicativos. A HPC-AI está construindo uma plataforma descentralizada de desenvolvimento e implantação de IA com o objetivo de se tornar a OpenAI do Sudeste Asiático. E o banco de dados vetorial de código aberto Qdrant garantiu recentemente US$ 28 milhões para aproveitar as vantagens da crescente revolução da IA.
Uma análise mais ampla das 50 principais startups de código aberto do ano passado revela que mais da metade (26) estão relacionadas à IA e à infraestrutura de dados.

As 50 principais startups COSS no índice ROSS em 2023 créditos da imagem: Runa Capital
É difícil comparar adequadamente o índice de 2023 com os anos anteriores numa perspetiva vertical, uma vez que as empresas muitas vezes giram e alteram o posicionamento dos seus produtos para corresponder às tendências atuais. Com o entusiasmo do ChatGPT a todo vapor no ano passado, as startups em estágio inicial podem ter mudado seu foco ou dado mais peso aos elementos de “IA” existentes em seus produtos.
Mas num ano marcante para a IA generativa, com empresas de todas as dimensões a tentar acompanhar o ritmo de gigantes da IA proprietária como a OpenAI, a Microsoft e a Google, é fácil perceber porque é que a procura por componentes de código aberto irá disparar.
geografia
O software de código aberto também sempre foi altamente distribuído, com contribuições de desenvolvedores de todo o mundo. Esse espírito é frequentemente refletido em startups comerciais de código aberto, que não têm um centro de gravidade tradicional fixado em uma sede física.
No entanto, o índice ROSS passou a ter em conta a geografia e, embora 26 empresas da lista estejam sediadas nos Estados Unidos, 10 delas nasceram noutros países e têm fundadores e funcionários ainda localizados noutros locais.
No total, as 50 maiores empresas são de 17 países, das quais 23 estão constituídas na Europa, um aumento de 20% em relação ao índice do ano anterior. A França tem o maior número de startups COSS, com sete empresas, incluindo Sismo e Massa no top 10, enquanto o Reino Unido ocupa o segundo lugar do ponto de vista europeu, saltando de apenas uma em 2022 para seis em 2023.
Outras informações notáveis reveladas neste relatório incluem linguagens de programação. No índice ROSS, 12 idiomas estavam entre os 50 primeiros no ano passado, em comparação com 10 em 2022. No entanto, Typescript, um superconjunto de JavaScript desenvolvido pela Microsoft, continuou sendo o mais popular. Usado por 38% das 50 principais startups. Python e Rust aumentaram em popularidade, enquanto Go e JavaScript diminuíram.

Índice ROSS: Linguagens de programação em alta. créditos da imagem: Runa Capital
Os 50 principais participantes do Índice ROSS ganharam um total de 12.000 contribuidores em 2023, e a contagem geral de estrelas do GitHub aumentou em quase 500.000. O índice também revela que o financiamento para as 50 principais startups do COSS atingiu US$ 513 milhões no ano passado, aumentando 32% em 2022 e 145% em 2021.

Índice ROSS: Contribuintes, Estrelas, Financiadores créditos da imagem: Runa Capital
Metodologia e antecedentes
Vale a pena considerar a metodologia por trás de tudo isso.Que factores influenciam se uma empresa é considerada “principal tendência”?Primeiro, todas as empresas estão incluídas Você deve ter pelo menos 1.000 estrelas no GitHub (uma métrica do GitHub semelhante às curtidas nas redes sociais) para ser considerado. Mas o número de estrelas por si só não diz muito sobre o que é tendência. As estrelas se acumulam com o tempo, portanto, um projeto que está no GitHub há 10 anos pode ter acumulado mais estrelas do que um projeto que está no GitHub há 10 meses. Em vez disso, Runa utiliza a taxa de crescimento anual (AGR) para medir o crescimento relativo de uma estrela durante um determinado período de tempo. Isso compara o valor atual das estrelas com o período correspondente anterior para ver o que cresceu de forma mais impressionante.
Especialmente considerando que o objetivo é descobrir “startups” de código aberto, um certo grau de curadoria manual também é necessário aqui. Portanto, a equipe de investimentos da Runa precisa retirar projetos que pertençam a “organizações comerciais centradas em produtos”. Foi fundada há menos de 10 anos e tem menos de US$ 100 milhões em financiamento conhecido.
Definir o que é “código aberto” também apresenta seus próprios desafios. Há uma grande variedade de quão “código aberto” é uma startup. Algumas startups estão mais próximas do “núcleo aberto”, onde a maioria dos principais recursos estão bloqueados pelo premium. Alguns têm acesso pago e licenças mais restritivas do que outros. Por esse motivo, os curadores de Runa decidiram que as startups simplesmente precisavam ter um produto “r”.“Podemos conectar-nos facilmente a repositórios de código aberto”, mas está claro que há alguma subjetividade envolvida na decisão de quais repositórios serão adotados.
Existem também nuances mais sutis. O índice ROSS adota uma interpretação particularmente liberal de “código aberto”. Por exemplo, tanto a Elastic quanto o MongDB abandonaram suas raízes de código aberto em favor de licenças de “fonte disponível” para se protegerem de abusos por parte de grandes provedores de nuvem. De acordo com a metodologia do Índice ROSS, ambas as empresas seriam qualificadas como “código aberto”, mesmo que as suas licenças não tenham sido formalmente aprovadas pela Open Source Initiative. Além disso, esses exemplos específicos de empresas não se referem mais a si mesmos como “código aberto”. ”
Portanto, de acordo com a metodologia de Runa, a empresa utiliza o que chama de “reconhecimento comercial de código aberto” em seus relatórios, em vez das licenças reais que concede aos projetos. Isso ocorre porque licenças com fonte restrita, como BSL (Business Source License) e SSPL (Server Side Public License), que o MongoDB introduziu como parte de sua transição do código aberto em 2018, tornaram-se muito difíceis de usar para empresas comerciais. Isso significa está em muitos menus. O índice ROSS é uma preocupação.
“Essa licença preserva o espírito do OSS e mantém todas as suas liberdades, com exceção de pequenas restrições à redistribuição. A redistribuição não afeta os desenvolvedores. Mas dá ao fornecedor original uma vantagem competitiva de longo prazo”, Konstantin Vinogradov, sócio geral da Runa Capital, com sede em Londres, explicou ao TechCrunch. “Do ponto de vista de capital de risco, esta é apenas uma estratégia evoluída para exatamente o mesmo tipo de empresas. A definição de código aberto se aplica a produtos de software, não a empresas”.
Existem outros filtros notáveis também. Por exemplo, as empresas que se concentram principalmente na prestação de serviços profissionais ou em projetos paralelos com apoio ativo limitado ou sem componente comercial não estão incluídas no índice ROSS.
Para fins de comparação, existem outros índices e listas para determinar “o que está em alta” no espaço de código aberto. Por exemplo, outra empresa de capital de risco chamada Two Sigma Ventures gerencia o Open Source Index. É semelhante em conceito ao Runa, mas abrange todos os tipos de projetos de código aberto (não apenas startups) e possui filtros adicionais. Alguns argumentam que a métrica de “observadores” do GitHub fornece uma imagem mais precisa da verdadeira popularidade de um projeto.
O próprio GitHub publica uma página de repositório de tendências, mas, como o Two Sigma Ventures, não se concentra no negócio por trás do projeto.
Assim, o Índice ROSS surgiu como uma ferramenta complementar útil para entender quais “startups” específicas de código aberto valem a pena monitorar.

