Sundar Pichai e Tim Cook
Fonte: maçã da Reuters;
A Apple anunciou na segunda-feira que os modelos de inteligência artificial por trás de seu sistema de IA, Apple Intelligence, foram pré-treinados em processadores projetados pelo Google, enquanto a gigante da tecnologia busca alternativas à Nvidia para treinar IA de ponta. .
A escolha da Apple das unidades de processamento de tensores (TPUs) do próprio Google para treinamento é detalhada em um documento técnico que a empresa acaba de publicar. Separadamente, a Apple lançou uma versão prévia do Apple Intelligence para alguns dispositivos na segunda-feira.
As caras unidades de processamento gráfico (GPUs) da Nvidia dominam o mercado de chips de treinamento de IA de ponta e têm tido uma demanda tão alta nos últimos anos que tem sido difícil adquirir as quantidades necessárias. OpenAI, Microsoft e Anthropic usam GPUs Nvidia em seus modelos, enquanto outras empresas de tecnologia como Google, Meta, Oracle e Tesla também contam com GPUs Nvidia para construir seus sistemas e produtos de IA.
O CEO da Meta, Mark Zuckerberg, e o CEO da Alphabet, Sundar Pichai, fizeram comentários na semana passada sugerindo que suas empresas e outras do setor podem estar investindo demais em infraestrutura de IA. No entanto, ele admitiu que os riscos de negócios eram altos demais para fazê-lo.
“A desvantagem de ficar para trás é que você perde sua posição como a tecnologia mais importante nos próximos 10 a 15 anos”, disse Zuckerberg em podcast com Emily Chan, da Bloomberg.
A Apple não cita Google ou Nvidia em seu artigo de 47 páginas, mas diz que seu Apple Foundation Model (AFM) e servidores AFM são treinados em “clusters de TPU em nuvem”. Isso significa que a Apple alugou servidores de provedores de nuvem para realizar os cálculos.
“Este sistema agora permite o treinamento eficiente e escalonável de modelos AFM, incluindo AFM no dispositivo, servidores AFM e modelos maiores”, disse a Apple no artigo.
Representantes da Apple e do Google não responderam aos pedidos de comentários.
A Apple revelou seus planos de IA mais tarde do que muitos de seus concorrentes, que adotaram abertamente a IA generativa, logo após a OpenAI anunciar o ChatGPT no final de 2022. Na segunda-feira, a Apple anunciou o Apple Intelligence. O sistema inclui vários novos recursos, incluindo um novo visual para Siri, processamento de linguagem natural aprimorado e resumos gerados por IA em campos de texto.
No próximo ano, a Apple planeja lançar recursos baseados em IA generativa, incluindo geração de imagens, geração de emojis e um recurso Siri aprimorado que usa informações pessoais dos usuários para realizar ações dentro de aplicativos.
Em um artigo divulgado na segunda-feira, a Apple disse que o AFM no dispositivo foi treinado em uma única “fatia” de 2.048 chips TPU v5p trabalhando juntos. Esta é a TPU mais avançada lançada pela primeira vez em dezembro. De acordo com o artigo, o servidor AFM foi treinado em chips 8192 TPU v4 configurados para trabalhar juntos como oito fatias em uma rede de data center.
De acordo com o site do Google, as TPUs mais recentes do Google custam menos de US$ 2 por hora de uso do chip quando reservadas com três anos de antecedência. O Google introduziu pela primeira vez TPUs para cargas de trabalho internas em 2015 e as disponibilizou publicamente em 2017. Atualmente, os TPUs são um dos chips personalizados mais maduros projetados para inteligência artificial.
Ainda assim, o Google é um dos principais clientes da Nvidia. O Google usa GPUs da Nvidia e suas próprias TPUs para treinar seus sistemas de IA, e também vende acesso à tecnologia da Nvidia em sua nuvem.
A Apple disse anteriormente que parte da inferência (ou seja, pegar um modelo de IA pré-treinado e executá-lo para gerar conteúdo ou fazer previsões) é feita nos próprios chips da Apple localizados em data centers.
Este é o segundo artigo técnico da Apple sobre seu sistema de IA, depois que uma versão mais geral foi publicada em junho. A Apple disse na época que estava usando TPUs para desenvolver modelos de IA.
A Apple está programada para divulgar seus resultados trimestrais após o fechamento do pregão de quinta-feira.
relógio: Como o enorme consumo de energia da IA generativa está sobrecarregando a rede