O Google está acompanhando rapidamente o OpenAI, pois apenas três meses depois de anunciar seu gerador de texto para vídeo Sora, o mecanismo de busca e tecnologia lançou sua própria versão.
Na conferência anual de desenvolvedores de I/O do Google na terça-feira (14 de maio), Veo abriu.
É o modelo mais recente e avançado da geração de vídeos do Google, capaz de produzir vídeos com resolução de 1080p em diversos estilos cinematográficos e visuais.
A gigante da tecnologia afirma que “Veo se baseou em anos de trabalho em nosso modelo de vídeo, incluindo Generative Query Network, DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet e Lumiere – novas arquiteturas, leis de escala e outras técnicas para melhorar a qualidade e resolução de saída”.
A capacidade de produzir vídeo é descrita como um “nível sem precedentes de controle criativo”.
Semelhante ao Sora da OpenAI, a estreia do Google ainda não está disponível para o público, já que a equipe está trabalhando apenas com criadores selecionados em uma visualização privada para fins de teste.
Alguns dos recursos do Veo chegarão aos curtas do YouTube e outros produtos no futuro.
Anúncios da conferência de desenvolvedores do Google – Veo e Imagen 3
Veo não é a única ferramenta nova que o Google anunciou esta semana, já que houve muitas surpresas no evento anual.
Junto com o modelo de vídeo, o recém-lançado Imagen 3 também foi revelado. É um modelo de texto para imagem que pode criar imagens fotorrealistas e realistas.
O Google afirma: “O Imagen 3 entende melhor a linguagem natural, que inclui a intenção por trás de sua consulta e inclui pequenos detalhes de consultas mais longas. A compreensão avançada do modelo ajuda-o a aprender uma variedade de estilos.”
Imagem criada por Imagen 3 a pedido: Foto de um homem de cabelo curto e barba sorrindo para a câmera. O fundo está desfocado e os edifícios têm cores vivas.
Novamente, o modelo de imagem estará disponível apenas para alguns selecionados.
Como a empresa se concentra na inteligência artificial, eles divulgaram detalhes sobre suas práticas responsáveis para modelos de vídeo e imagem.
“Trabalhamos não só no avanço da tecnologia, mas também com responsabilidade. É por isso que estamos tomando medidas para resolver os desafios que as tecnologias geradas por IA representam e capacitar pessoas e organizações para trabalharem com conteúdo gerado por IA.”
Imagem em destaque: Foto Kai Wenzel em Remover respingo