O Google leva a sério o vídeo gerado por IA no Google I/O 2024

O Google está de olho no Sora da OpenAI com Veo. O modelo de IA pode criar videoclipes em 1080p com aproximadamente um minuto de duração quando recebe uma solicitação de texto.

Veo, anunciado terça-feira na conferência de desenvolvedores I/O 2024 do Google, pode capturar uma variedade de estilos visuais e cinematográficos, incluindo paisagens e tomadas com lapso de tempo, e editar e ajustar as imagens já produzidas.

“Para ver o que o Veo pode fazer, estamos analisando recursos como storyboards e geração de cenas mais longas”, disse Demis Hassabis, diretor do laboratório de pesquisa e desenvolvimento de IA do Google, DeepMind, aos repórteres durante uma mesa redonda virtual. ele disse. “Fizemos um progresso incrível com o vídeo.”

Veo se baseia no trabalho comercial preliminar do Google sobre geração de vídeo, que foi apresentado em abril, e aproveita a família Imagen 2 de modelos de geração de imagens da empresa para criar videoclipes em loop.

Mas, ao contrário das ferramentas baseadas no Imagen 2, que só podiam criar vídeos de alguns segundos de duração em baixa resolução, o Veo suporta os principais modelos de geração de vídeo da atualidade (Sora, bem como aqueles de startups como Pika, Runway e Ireverent) parecem ser competitivos. . Laboratório.

Durante o briefing, Douglas Eck, que lidera os esforços de pesquisa de mídia generativa da DeepMind, forneceu alguns exemplos selecionados do que a Veo pode fazer. Em particular, as imagens aéreas de praias movimentadas demonstraram os pontos fortes da Veo em relação aos modelos de vídeo concorrentes, disse ele.

“Representar os detalhes de todos os nadadores na praia tem se mostrado difícil tanto para os modelos de geração de imagens quanto para os de vídeo, uma vez que há tantos personagens em movimento”, disse ele. “Se você olhar de perto, as ondas parecem muito boas. E acho que o sentido imediato da palavra 'agitado' é capturado por todas as pessoas ao longo da costa vibrante e cheia de banhistas.”

Veo foi treinado com muita filmagem. É assim que os modelos generativos de IA geralmente funcionam. Quando o FRB toma algum tipo de dado como exemplo, o modelo pode detectar padrões nos dados e gerar novos dados (vídeo no caso do Veo).

De onde vieram as imagens para treinar Veo? Eck não disse exatamente, mas reconheceu que algumas podem ter sido obtidas no próprio YouTube do Google.

“Os modelos do Google podem ser treinados em alguns conteúdos do YouTube, mas sempre de acordo com acordos com os criadores do YouTube”, disse ele.

A parte “concordo” é Tecnicamente É verdade. Mas, dados os efeitos de rede do YouTube, os criadores não têm outra escolha senão seguir as regras do Google se quiserem atingir o público mais amplo possível.

Uma reportagem de abril do New York Times revelou que o Google expandiu seus termos de serviço no ano passado para permitir o uso de mais dados para treinar seus modelos de IA. Segundo os antigos termos de serviço, não estava claro se o Google poderia usar os dados do YouTube para criar produtos além de sua plataforma de vídeo. As novas condições não o fazem e as rédeas afrouxam consideravelmente.

O Google não é o único gigante da tecnologia que utiliza grandes quantidades de dados de usuários para treinar seus modelos internos. (Veja: Meta.) Mas o que certamente decepcionará alguns criadores é a afirmação de Eck de que o Google estabelece o “padrão ouro” quando se trata de ética.

“A solução para isso é [training data] “Encontraremos desafios reunindo todas as partes interessadas para considerar os próximos passos”, disse ele. “Até que tomemos estas medidas com as partes interessadas – a indústria cinematográfica, a indústria musical, os próprios artistas – não poderemos agir rapidamente.”

Mas o Google já disponibilizou o Veo para criadores selecionados, incluindo Donald Glover (também conhecido como Childish Gambino) e sua agência criativa, Gilga. (Assim como o OpenAI com Sora, o Google está posicionando o Veo como uma ferramenta para a criatividade.)

Source link

What's Hot

Matosinhos reforça segurança com 86 câmaras de videovigilância em 56 pontos do concelho

8º Moinho Cine Fest celebra liberdade em Custóias

Evento “X64 & Opala Consult 2026” em Matosinhos redefine o futuro tecnológico da Restauração

O Google leva a sério o vídeo gerado por IA no Google I/O 2024

As ações da Microsoft caem mais de 6% após queda nos lucros devido à última decepção com IA

Airtable adquire startup de integração de talentos de IA Dopt

Os avatares de IA poderão em breve participar de reuniões em nosso nome, mas certamente parece uma ladeira escorregadia em direção a um futuro de IA que nenhum de nós deseja.

As ações da Microsoft caem mais de 6% após queda nos lucros devido à última decepção com IA

Airtable adquire startup de integração de talentos de IA Dopt

Os avatares de IA poderão em breve participar de reuniões em nosso nome, mas certamente parece uma ladeira escorregadia em direção a um futuro de IA que nenhum de nós deseja.

Microsoft pede novas leis contra golpes deepfake e imagens de abuso sexual de IA

Subscribe to Updates

What's Hot

O Google leva a sério o vídeo gerado por IA no Google I/O 2024

Related Posts