Suqian, China – 30 de março de 2024 – Ilustração OpenAI lança mecanismo de fala, modelo de fala, Suqian … [+]
O aplicativo AI de clone de voz do Chat GPT é muito perigoso para ser lançado. O Speech Engine da OpenAI é um modelo de IA que gera fala que imita a voz do locutor a partir de uma amostra de áudio de 15 segundos. Ele pode ser usado para fins como suporte educacional, tradução e suporte para pessoas com habilidades não-verbais. O que poderia dar errado? Devido ao potencial de uso indevido, a OpenAI está adotando uma abordagem cautelosa em relação à adoção, permitindo que apenas um pequeno número de empresas teste novas ferramentas. Por que testar isso se é muito arriscado publicar? O que realmente me preocupa é que, se a Open AI pode fazer isso, outros também podem. E eles não emitem comunicados de imprensa. Na Schwab, minha voz é minha senha. seriamente. Espero que eles saibam disso.
O Diffuse de Higgsfield cria vídeos curtos, semelhantes a sola, a partir de prompts de texto e imagens.
Higgsfield AI lança Diffuse. A empresa é liderada por Alex Mashrabov, ex-chefe de IA da Snap, que vendeu sua startup anterior AI Factory para a Snap por US$ 166 milhões em 2020. O aplicativo móvel Diffuse apresenta uma pessoa que pode gerar vídeos a partir de instruções de texto e até mesmo gerar clipes usando selfies. Os usuários podem se inscrever para uma versão beta gratuita em breve no site. Eventualmente, a Diffuse planeja cobrar dos criadores de conteúdo de mídia social e profissionais de marketing pelo aplicativo. Sora também foi testado por profissionais de mídia, mas é muito mais caro computacionalmente. Os preços da Sora quase certamente serão direcionados a empresas de mídia e não a indivíduos. O financiamento para Higgfield vem de uma rodada inicial de US$ 8 milhões liderada pela Menlo Ventures.
BERLIM, ALEMANHA – 6 DE NOVEMBRO: Jens Hilgers (BITKRAFT Esports) fala no palco durante “Esport” … [+]
Bitkraft Ventures levanta US$ 275 milhões para terceiro fundo interativo. O Venture Fund 3 investe em estúdios, plataformas e tecnologias de jogos e mídia interativa. Bitkraft se concentra em startups iniciais e de estágio Série A. A Bitkraft opera seis fundos de risco com 130 empresas do portfólio, incluindo Frost Giant, Anzu, Carry1st, InWorld, Voicemod, Immutable e Karate Combat.
Andrew Bosworth, vice-presidente de hardware do Facebook, gesticula ao falar em entrevista à AFP. … [+]
Reality Labs da Meta comemora 10 anos de aquisição da Oculus VR. Na época, custou US$ 3 bilhões e todos pensaram que estavam loucos. Claro, as pessoas disseram isso sobre a aquisição mais presciente do Instagram do nosso tempo. A Meta atualmente gasta mais de US$ 10 bilhões anualmente em seus esforços de XR. Não é exagero dizer que atualmente custa mais de US$ 100 bilhões. O editor XR da CNet viajou ao passado com o CTO Andrew Bosworth, que supervisiona o Reality Labs. Bos diz que embora a exibição em óculos normais continue sendo um desafio, adicionar IA a wearables, como óculos inteligentes, abrirá novas maneiras de pensar sobre XR.
Persona espacial para Vision Pro da Apple. Tecnicamente, o Persona está disponível desde o lançamento do fone de ouvido em 2 de fevereiro, mas parecia mais um Memoji mal animado. Eles receberam uma grande atualização esta semana, da qual todos estão falando. Sua persona é criada escaneando seu rosto e expressões em tempo real. Costumava existir em uma moldura, mas agora existe no espaço. A persona consiste apenas na cabeça, ombros e mãos. Ainda não há corpo, mas o rosto e o rastreamento próximo criam uma presença palpável.
Esta coluna, anteriormente chamada de “This Week in XR”, também é um podcast Será apresentado pelo autor Charlie Fink, pelo ex-executivo e cofundador do estúdio Red Camera, Ted Shirowicz, e pelo fundador do Magic Leap, Ronnie Abowitz. A convidada desta semana é Maureen Fan, CEO da Baobab Studios. Você pode nos encontrar no Spotify, iTunes e YouTube.
o que estamos lendo
A IA poderia realmente acabar com o mundo (Blog de Sherry Palmer)
Os 7 melhores vídeos de Sora (Guia do Tom)

