Google anuncia Veo, uma IA avançada de texto para vídeo para competir com Sora

O Google está acompanhando rapidamente o OpenAI, pois apenas três meses depois de anunciar seu gerador de texto para vídeo Sora, o mecanismo de busca e tecnologia lançou sua própria versão.

Na conferência anual de desenvolvedores de I/O do Google na terça-feira (14 de maio), Veo abriu.

É o modelo mais recente e avançado da geração de vídeos do Google, capaz de produzir vídeos com resolução de 1080p em diversos estilos cinematográficos e visuais.

A gigante da tecnologia afirma que “Veo se baseou em anos de trabalho em nosso modelo de vídeo, incluindo Generative Query Network, DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet e Lumiere – novas arquiteturas, leis de escala e outras técnicas para melhorar a qualidade e resolução de saída”.

A capacidade de produzir vídeo é descrita como um “nível sem precedentes de controle criativo”.

Semelhante ao Sora da OpenAI, a estreia do Google ainda não está disponível para o público, já que a equipe está trabalhando apenas com criadores selecionados em uma visualização privada para fins de teste.

Alguns dos recursos do Veo chegarão aos curtas do YouTube e outros produtos no futuro.

Anúncios da conferência de desenvolvedores do Google – Veo e Imagen 3

Veo não é a única ferramenta nova que o Google anunciou esta semana, já que houve muitas surpresas no evento anual.

Junto com o modelo de vídeo, o recém-lançado Imagen 3 também foi revelado. É um modelo de texto para imagem que pode criar imagens fotorrealistas e realistas.

O Google afirma: “O Imagen 3 entende melhor a linguagem natural, que inclui a intenção por trás de sua consulta e inclui pequenos detalhes de consultas mais longas. A compreensão avançada do modelo ajuda-o a aprender uma variedade de estilos.”

Google anuncia Veo, uma IA avançada de texto para vídeo para competir com Sora

Imagem criada por Imagen 3 a pedido: Foto de um homem de cabelo curto e barba sorrindo para a câmera. O fundo está desfocado e os edifícios têm cores vivas.

Novamente, o modelo de imagem estará disponível apenas para alguns selecionados.

Como a empresa se concentra na inteligência artificial, eles divulgaram detalhes sobre suas práticas responsáveis ​​para modelos de vídeo e imagem.

“Trabalhamos não só no avanço da tecnologia, mas também com responsabilidade. É por isso que estamos tomando medidas para resolver os desafios que as tecnologias geradas por IA representam e capacitar pessoas e organizações para trabalharem com conteúdo gerado por IA.”

Imagem em destaque: Foto Kai Wenzel em Remover respingo

Fonte