Essa história deveria ter um começo diferente. No início desta semana, participei de um evento de lançamento chamativo do Rabbit R1, um novo gadget de IA, na cidade de Nova York e depois parei em uma calçada com muito vento do lado de fora do local para chamar um dispositivo Uber para casa. Em vez disso, depois de provavelmente uma hora de configuração e ajustes, ele não conseguiu se conectar.
O R1 é um dispositivo laranja brilhante com câmera, microfone e tela pequena. Pressione e segure um botão, faça uma pergunta ou dê um comando usando sua voz, e o lindo coelhinho saltitante na tela ouvirá e falará com você. Em teoria, é como comunicar-se com o ChatGPT por meio de um walkie-talkie. Você pode pedir que identifiquem flores específicas através da câmera ou tocar uma música baseada em letras meio memorizadas. Você poderia pedir um Uber, mas seu telefone poderia desligar na última etapa e você ficaria preso no Queens.
Quando finalmente voltei para o meu quarto de hotel, liguei a câmera do R1 e apontei-a para uma fatia de pizza fria. “O que estou olhando?”, perguntei. “Você está olhando para uma fatia de pizza”, a voz me disse. (Correto!) “Parece recém-assado e delicioso.” (Bem, não.) Decidi tentar outra coisa. “Qual é o Top 10…” Tropecei e soltei o botão. Pensei novamente. “Quais são os 10 melhores casos de uso de IA para a pessoa média?” O dispositivo, talvez confuso com nossa interação anterior, começou a listar coberturas de pizza começando no número dois. salsicha. 3. Cogumelos. 4. Queijo extra. ”
Até agora, a IA do consumidor era definida principalmente por software: chatbots como o ChatGPT e a poderosa correção automática no iPhone. Agora estamos experimentando algo assim: materialização: As empresas estão lançando e fabricando peças físicas de metal e plástico inteiramente dedicadas à funcionalidade de IA. Esses dispositivos diferem dos gadgets de IA anteriores, como o Amazon Echo, porque incorporam tecnologias de IA generativa mais avançadas que estão em alta atualmente, permitindo que os usuários interajam de forma mais natural. Há também broches, pingentes e óculos inteligentes totalmente novos.
Mas apesar da sua promessa, esta nova era não está a correr muito bem. Veja o caso do Humane, um concorrente do Rabbit que lançou o AI Pin vestível no início deste mês. O aparelho se posiciona como uma alternativa aos smartphones e tem um preço adequado. Custa US$ 699 e requer uma taxa de assinatura mensal de US$ 24. Os revisores criticaram o alfinete por ser lento, superaquecer e ter dificuldade em responder a perguntas básicas. “É difícil escolher algo que realmente se destaque”, escreveu The Verge.
Em comparação, o R1 é pequeno o suficiente para sua finalidade e (relativamente) acessível (US$ 199, sem assinatura). O dispositivo em si é divertido e retrô chique. O fundador e CEO da Rabbit, Jesse Lyu, supostamente comprou para cada membro de sua equipe um Tamagotchi para se inspirar. E para ser justo, o R1 faz algumas coisas interessantes. No palco, Lyu demonstrou como o dispositivo pode interpretar uma tabela manuscrita e transformá-la em uma planilha digital funcional. Quando perguntei, ele conseguiu fornecer um resumo da página manuscrita, mas com apenas cerca de 65% de precisão. Embora eu pudesse pedir tigelas de açaí com o DoorDash usando este gadget, ele não permitia personalização. (Eu queria manteiga de amendoim.) E não consegui fazer um Uber funcionar. (A certa altura, porém, o dispositivo me notificou que a solicitação havia falhado, quando na verdade não havia falhado, e fui forçado a fazer uma viagem de US$ 9 que nem sequer fiz.)
Um dos grandes pontos de venda do R1 é que ele faz visivelmente o que chamaríamos de “grande”. Ação Modelo, ou LAM – um jogo de palavras modelo de linguagem grande, que é a tecnologia que alimenta os chatbots modernos. ChatGPT pode responder perguntas e escrever redações medíocres, enquanto R1 pode, teoricamente, realizar ações que você executaria em outro aplicativo, como dar US$ 20 a um amigo. Rabbit diz que se você ensinar um dispositivo, ele poderá aprender com qualquer aplicativo. Liu comparou a tecnologia à Tesla. Enquanto estiver no piloto automático, um Tesla pode, teoricamente, reconhecer um sinal de stop, não porque os engenheiros lhe ensinaram como é um sinal de stop, mas porque foi treinado em inúmeras horas de filmagem para reconhecer os atributos físicos do sinal. Da mesma forma, o R1 permite realizar tarefas no seu telefone sem precisar ensinar cada aplicativo.
O problema é que nada disso é realmente real. Pelo menos ainda não. Como muitos produtos de IA, o R1 é apoiado por entusiasmo, e não por um caso de uso atraente. (Afinal, muitas de suas funcionalidades podem ser executadas em um smartphone.) Em fevereiro, Lyu disse que o Rabbit estava treinando seus modelos em 800 aplicativos. Foi lançado esta semana com a capacidade de usar apenas quatro: Spotify, DoorDash, Uber e Midjourney (um popular gerador de arte de IA). A empresa diz que a LAM está em “estágios muito iniciais”.
No palco na noite de terça-feira, diante de uma plateia de repórteres e fãs dos Rabbitohs, Liu às vezes parecia nervoso, até incentivando as pessoas a rir para aliviar a tensão. Antes do evento, um usuário postou no GitHub acusando o Rabbit de deturpar sua tecnologia. “Para qualquer pessoa com formação técnica, é dolorosamente óbvio que não existem inteligência artificial e modelos de ação em escala”, dizia a postagem anônima, que já foi excluída. Sobre X, Liu caracterizou a postagem como “todas as alegações falsas”. Lyu prometeu corrigir quaisquer bugs que possam ocorrer em dispositivos R1. Antes de fazer a demonstração do DoorDash no palco, ele admitiu que o recurso ainda não está funcionando tão rápido quanto ele esperava. “Mas eu quero mostrar a vocês e quero ser honesto com vocês.”
Mas Lyu também prevê sistemas de alto conceito que um dia fundirão o físico e o digital, permitindo que as pessoas apontem para vários itens inteligentes em suas casas e os controlem por meio da IA do Rabbit. Anunciamos sem fôlego muitas novas iniciativas, incluindo. (Não importa que o R1 tenha sido lançado sem muitos dos recursos prometidos.) No final da apresentação, havia estas palavras: seja humilde Apareceu na enorme tela atrás de mim. “Somos um time muito, muito humilde”, disse Liu à multidão. Poucos minutos depois, as cortinas de cada lado do palco baixaram dramaticamente para revelar uma esteira rolante carregada com caixas de R1, mas as palavras ainda eram visíveis. A música tocou e as pessoas começaram a fazer fila para colocar as mãos nele.
R1 é um lembrete da desconexão, para o bem ou para o mal, entre a cultura do Vale do Silício, que muitas vezes prioriza a velocidade em detrimento da qualidade, e as altas expectativas dos consumidores em relação aos produtos que utilizam. E para ser justo, as expectativas aumentaram, pelo menos em parte, devido aos produtos extraordinários que surgiram da mesma cultura de competição e repetição ao longo dos anos.
Terminada a festa, chegou a notícia do primeiro bug. Não havia como alterar o fuso horário nos dispositivos e muitos foram programados para a Costa Oeste por padrão. O futuro está três horas atrasado.

