Home Tecnologia Google anuncia Veo, uma IA avançada de texto para vídeo para competir...

Tecnologia

Google anuncia Veo, uma IA avançada de texto para vídeo para competir com Sora

15 May 2024

O Google está acompanhando rapidamente o OpenAI, pois apenas três meses depois de anunciar seu gerador de texto para vídeo Sora, o mecanismo de busca e tecnologia lançou sua própria versão.

Na conferência anual de desenvolvedores de I/O do Google na terça-feira (14 de maio), Veo abriu.

É o modelo mais recente e avançado da geração de vídeos do Google, capaz de produzir vídeos com resolução de 1080p em diversos estilos cinematográficos e visuais.

A gigante da tecnologia afirma que “Veo se baseou em anos de trabalho em nosso modelo de vídeo, incluindo Generative Query Network, DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet e Lumiere – novas arquiteturas, leis de escala e outras técnicas para melhorar a qualidade e resolução de saída”.

A capacidade de produzir vídeo é descrita como um “nível sem precedentes de controle criativo”.

Semelhante ao Sora da OpenAI, a estreia do Google ainda não está disponível para o público, já que a equipe está trabalhando apenas com criadores selecionados em uma visualização privada para fins de teste.

Alguns dos recursos do Veo chegarão aos curtas do YouTube e outros produtos no futuro.

Anúncios da conferência de desenvolvedores do Google – Veo e Imagen 3

Veo não é a única ferramenta nova que o Google anunciou esta semana, já que houve muitas surpresas no evento anual.

Junto com o modelo de vídeo, o recém-lançado Imagen 3 também foi revelado. É um modelo de texto para imagem que pode criar imagens fotorrealistas e realistas.

O Google afirma: “O Imagen 3 entende melhor a linguagem natural, que inclui a intenção por trás de sua consulta e inclui pequenos detalhes de consultas mais longas. A compreensão avançada do modelo ajuda-o a aprender uma variedade de estilos.”

Google anuncia Veo, uma IA avançada de texto para vídeo para competir com Sora

Imagem criada por Imagen 3 a pedido: Foto de um homem de cabelo curto e barba sorrindo para a câmera. O fundo está desfocado e os edifícios têm cores vivas.

Novamente, o modelo de imagem estará disponível apenas para alguns selecionados.

Como a empresa se concentra na inteligência artificial, eles divulgaram detalhes sobre suas práticas responsáveis para modelos de vídeo e imagem.

“Trabalhamos não só no avanço da tecnologia, mas também com responsabilidade. É por isso que estamos tomando medidas para resolver os desafios que as tecnologias geradas por IA representam e capacitar pessoas e organizações para trabalharem com conteúdo gerado por IA.”

Imagem em destaque: Foto Kai Wenzel em Remover respingo

Fonte