Num movimento que está a agitar os mundos da tecnologia e dos negócios, a Meta Platforms anunciou o seu modelo de IA mais avançado até à data, desafiando os líderes da indústria OpenAI e Google.
O lançamento da família de modelos Llama 3 da Meta, a maioria dos quais disponíveis gratuitamente, marca uma escalada significativa na corrida armamentista de IA e tem o potencial de redefinir a forma como as empresas operam em vários setores.
O principal modelo Llama 3 da Meta possui 405 bilhões de parâmetros, é multilíngue em oito idiomas e demonstra geração de código aprimorada e recursos de resolução de problemas. O lançamento segue o GPT-4o mini da OpenAI e o Gemini atualizado do Google.
A família Llama 3 inclui três modelos de tamanhos variados: 8 bilhões, 70 bilhões e 405 bilhões de parâmetros. Todos os três modelos apresentam uma “janela de contexto” expandida que permite processar grandes quantidades de informações e processar solicitações mais complexas de várias etapas.
Uma nova era de capacidades de IA
A OpenAI adicionou recentemente o GPT-4o mini à sua linha, uma versão menor do modelo GPT-4o lançado em maio.
“Esperamos que o GPT-4o mini expanda significativamente a gama de aplicações construídas com IA, tornando a inteligência mais acessível”, disse a OpenAI em um comunicado anunciando o lançamento.
Este modelo mantém muitos dos recursos do modelo maior, incluindo uma janela de contexto de 128.000 tokens, que é 8 vezes maior que o GPT-3.5 Turbo.
O Gemini do Google foi lançado em três versões: Ultra, Pro e Nano, e foi projetado para ser mais eficiente e ter melhor desempenho em diversas tarefas. Gemini Ultra apresenta desempenho superior em inferências complexas e tarefas multimodais, e rivaliza com especialistas humanos em determinados benchmarks.
Estes modelos estão a ultrapassar os limites do que é possível em inteligência artificial, com cada empresa a reivindicar um desempenho superior numa variedade de benchmarks.
OpenAI relata que GPT-4o mini supera seus concorrentes em vários testes padrão, incluindo o benchmark Massive Multitasking Language Understanding (MMLU), com uma pontuação de 82%, em comparação com 77,9% do Gemini Flash do Google, em comparação com 73,8% de Claude Haiku da Anthropic.
O Google também anunciou grandes atualizações em sua plataforma Gemini AI, aprimorando suas capacidades e expandindo seu alcance. A empresa está lançando uma versão mais rápida e capaz, Gemini 1.5 Flash, para usuários de nível gratuito em mais de 230 países e territórios. Esta atualização quadruplicou a janela de contexto para 32.000 tokens, permitindo conversas mais longas e consultas mais complexas. Além disso, o Google está introduzindo um novo recurso para combater as ilusões de IA, exibindo links para conteúdo relevante nas respostas do Gemini.
A gigante da tecnologia também está expandindo a acessibilidade do Gemini. A aplicação móvel Gemini está a ser lançada em mais países e a integração com o Mensagens do Google está a expandir-se para o Espaço Económico Europeu, o Reino Unido e a Suíça. Em um esforço para envolver os usuários mais jovens, o Google introduzirá medidas de segurança adicionais e fará parceria com especialistas em segurança infantil para expandir o acesso ao Gemini para adolescentes em mais de 40 idiomas em todo o mundo.
Transformação de negócios em todos os setores
As implicações comerciais são de longo alcance.
OpenAI sugere que a janela de contexto maior e os recursos aprimorados do GPT-4o mini o tornam “particularmente útil para processar documentos grandes e vincular múltiplas interações com modelos de IA”.
Isso poderia permitir recomendações mais fortes em lojas online, respostas de texto mais rápidas em tempo real no atendimento ao cliente e respostas mais precisas e detalhadas aos alunos.
Das ruas principais a Wall Street, as empresas estão a tomar nota do potencial revolucionário destes avanços da IA. Os chatbots com tecnologia de IA podem ter um impacto imediato no atendimento ao cliente, fornecendo suporte mais granular 24 horas por dia. Os gigantes do comércio eletrônico estão aproveitando esses modelos para permitir recomendações de produtos altamente personalizadas e estratégias de preços dinâmicas.
A gestão da cadeia de abastecimento, um problema persistente para muitas indústrias, pode exigir uma grande revisão. Os modelos de IA têm o potencial de otimizar os níveis de inventário e as redes de distribuição com uma precisão sem precedentes, reduzir os custos operacionais e aumentar a capacidade de resposta às flutuações do mercado.
No setor financeiro, a avaliação de riscos e a deteção de fraudes são os principais objetivos da melhoria da IA. Os robo-consultores que aproveitam estes modelos avançados têm o potencial de democratizar o acesso ao planeamento financeiro avançado e perturbar os serviços tradicionais de gestão de património.
Os cuidados de saúde não ficam muito atrás, com a IA preparada para acelerar a descoberta de medicamentos e melhorar a precisão do diagnóstico. A capacidade destes modelos de analisar grandes quantidades de dados médicos pode levar a avanços na medicina personalizada e nos protocolos de tratamento.
Desafios e oportunidades futuras
Para os departamentos de marketing, o conteúdo gerado por IA pode ser uma faca de dois gumes. Embora prometa agilizar a produção de conteúdo, as preocupações com a desinformação gerada pela IA são grandes, tornando difícil manter a credibilidade e a confiança da marca.
A estratégia da Meta de oferecer o Llama 3 quase de graça tem o potencial de democratizar o acesso a recursos de IA de ponta e nivelar o campo de atuação para startups e pequenas empresas. Da mesma forma, a introdução do GPT-4o mini pela OpenAI por “pouco mais da metade do preço por token do GPT-3.5 Turbo” visa tornar a IA mais acessível a uma gama mais ampla de empresas.
À medida que estes modelos de IA evoluem, espera-se que o seu impacto no comércio acelere. Versões futuras, incluindo versões multimodais que incorporam recursos de imagem, vídeo e áudio, poderão desencadear uma nova onda de inovação em toda a indústria. A OpenAI já indicou que expandirá os recursos do GPT-4o mini para incluir “entrada e saída de imagem, vídeo e áudio”.

