OpenAI lança novo modelo de IA GPT-4o com demonstração ao vivo
Numa demonstração no palco, os pesquisadores da OpenAI mostraram as capacidades do novo modelo, que é gratuito para todos os usuários.
Em um mercado altamente competitivo como o dos smartphones, às vezes pode fazer sentido observar a concorrência. Isso é especialmente verdadeiro quando se trata do Android do Google e do iOS da Apple no espaço de IA dos smartphones.
Embora o Google já tenha anunciado alguns recursos significativos baseados em IA para smartphones Android, a Apple é amplamente conhecida por estar atrasada na corrida “IA no smartphone”. Os observadores da indústria de tecnologia esperam que isso mude em cerca de um mês, com a Apple esperando anunciar uma série de novos recursos de geração alimentados por IA na Worldwide Developers Conference (WWDC).
Enquanto isso, o Google continua mantendo sua liderança, anunciando vários novos recursos para Android esta semana em sua própria conferência de desenvolvedores Google I/O. A empresa começou expandindo seu já impressionante recurso Circle-to-Search, que foi exibido pela primeira vez com a Samsung no evento Galaxy Unpacked da empresa no início deste ano.
Caso você ainda não tenha visto, o círculo para pesquisar oferece uma maneira muito intuitiva e gráfica de encontrar o que está sendo exibido no display do seu telefone. Basta pressionar e segurar o botão home do seu smartphone Android e, como o nome sugere, usar o dedo (ou caneta) para selecionar um objeto ou texto na tela do seu telefone em um círculo ou rabisco, e o Google realizará uma pesquisa automaticamente. Item destacado. Você também pode fazer perguntas sobre objetos para saber mais.
É uma extensão simples, mas muito útil para o seu telefone (ou tablet) que aproveita os processadores de IA dos dispositivos modernos para essencialmente “ver” o que está na tela de dentro para fora. Mais importante ainda, é o tipo de experiência que faz com que seu smartphone finalmente pareça “inteligente”. Afinal, se você consegue ver o que está na tela, por que não consegue?
O aprimoramento mais recente do Circle-to-Search é o recurso Homework Helper, que curiosamente parece compartilhar muitas semelhanças com a versão mais recente do ChatGPT 4o que a OpenAI acaba de lançar. A versão do Google ajuda os alunos a resolver problemas de física e matemática na tela do dispositivo, explicando como resolvê-los ao longo do caminho (em vez de apenas dar-lhes a resposta). Este é um ótimo exemplo de como os recursos alimentados por IA podem trazer novas experiências incrivelmente úteis para o seu telefone ou tablet.
O Google potencializa a pesquisa: O Google aposta tudo na IA e no Gemini: como isso afetará a Pesquisa Google
O Google também explicou como está integrando mais profundamente os modelos de IA gerados pelo Gemini no Android. O Google forneceu exemplos de como o Gemini pode ser usado para realizar ações como arrastar e soltar imagens geradas por IA em documentos, e-mails e mensagens. Além disso, graças ao recurso de resumo do Gemini, você pode encontrar as informações específicas que procura em um vídeo por meio de um recurso chamado “Pergunte a este vídeo”.
Uma das grandes tendências que a Apple deverá destacar na WWDC é a capacidade de executar modelos de linguagem em larga escala (LLMs) diretamente no iPhone para potencializar recursos generativos de IA. Isso permite que alguns aplicativos funcionem por conta própria, sem acessar a nuvem. Embora possa não parecer grande coisa à primeira vista, esta abordagem tem alguns benefícios, especialmente quando se trata de privacidade e desempenho. Para ser claro, a conectividade externa ainda é necessária para pesquisas de uso geral, mas os aplicativos e experiências que utilizam seus documentos, e-mails, mensagens, etc. só podem ser executados no seu dispositivo, potencialmente expondo suas informações pessoais.
O Google também reconheceu esses benefícios, observando que seu modelo Gemini Nano será incluído na próxima versão do Android, tornando-o o primeiro sistema operacional móvel a fazê-lo. Mais importante ainda, o Google também anunciou que uma versão multimodal do Gemini Nano (ou seja, uma versão que reconhece linguagem falada, áudio e entrada de câmera, além de texto) chegará ao Android ainda este ano. Isso melhora muito a experiência e permite a criação de assistentes digitais poderosos e inteligentes que podem compreender e responder de forma inteligente às solicitações dos usuários. Na verdade, o Google apresentou uma visão interessante e convincente do que poderia ser um assistente digital por meio do Projeto Astra em seu evento I/O.
O Google também demonstrou alguns aplicativos de IA que vão muito além dos usos típicos de IA generativa que vimos até agora. Por exemplo, o novo recurso TalkBack, que aproveita os recursos multimodais do Gemini Nano, pode descrever imagens para pessoas com deficiência visual. A empresa também exibiu um recurso de detecção de fraude que escuta a conversa durante uma ligação e alerta caso pareça ser um tipo de golpe. Algumas pessoas estão compreensivelmente preocupadas com o monitoramento de conversas por agentes com tecnologia de IA, mas esse processo ocorre apenas no dispositivo. (Este também é um bom exemplo de por que é muito importante executar determinados aplicativos apenas no dispositivo.)
Se você é um usuário de smartphone Android, pode esperar ver esses tipos de recursos alimentados por IA sendo lançados em novas gerações de dispositivos ao longo do ano. Para os proprietários de iPhone, a Apple apresentará recursos exclusivos baseados em IA, muitos dos quais provavelmente serão semelhantes aos anunciados pelo Google. Na verdade, existem até rumores de que a Apple pode licenciar algumas tecnologias tanto do Google quanto da OpenAI para integração na próxima versão do iOS.
De qualquer forma, está claro que estamos entrando em uma nova era emocionante de dispositivos verdadeiramente “inteligentes” com recursos alimentados por IA, tornando a experiência de usá-los mais intuitiva e gratificante.
O colunista do USA TODAY Bob O'Donnell é o presidente e analista-chefe do USA TODAY. pesquisa de análise técnica, uma empresa de pesquisa de mercado e consultoria. Você pode segui-lo no Twitter @bobodtech.

