O Google começou a liberar nesta terça-feira (15) o Veo 2, sua nova inteligência artificial generativa voltada para criação de vídeos a partir de comandos de texto. A tecnologia está disponível para usuários do plano Gemini Advanced e também no app experimental Whisk, destinado aos assinantes do plano IA Premium do Google One.
A ferramenta permite criar vídeos de até oito segundos em alta definição, com limite mensal de gerações. O diferencial do Veo 2 é sua capacidade de interpretar comandos textuais complexos, como a descrição de cenas, escolha de gênero visual, tipo de lente de câmera e aplicação de efeitos cinematográficos. A promessa da empresa é entregar imagens mais realistas, com atenção à física do mundo real e aos pequenos detalhes, o que o coloca como rival direto do Sora, modelo da OpenAI.
Como funciona a nova IA de vídeo do Google?
Para usar o Veo 2, é necessário acessar o menu de modelos de IA dentro da interface do Gemini, selecionar o modelo correspondente e digitar o comando descritivo. A IA processa a informação e gera uma animação curta que segue o roteiro textual fornecido.
Segundo o Google, os vídeos produzidos são moldados diretamente pelas instruções dos usuários. Isso significa que a qualidade e a fidelidade das cenas estão diretamente ligadas à clareza e especificidade do texto inserido.
A IA também pode ser ajustada para estilos diferentes, incluindo escolhas visuais inspiradas no cinema, como tomadas em plano aberto, câmera tremida ou até simulações de ambientes com profundidade de campo.
Quais os limites e preocupações de segurança do Veo 2?
Apesar do avanço, o Google afirma estar atento aos riscos de uso indevido. A empresa implementou um processo robusto de red teaming, uma estratégia voltada à detecção de vulnerabilidades e potenciais violações de segurança. Além disso, as criações passam por avaliações regulares para evitar a geração de vídeos que contrariem as diretrizes de uso da plataforma.
Essa medida reflete uma preocupação crescente no setor com os deepfakes e conteúdos enganosos, principalmente em ano eleitoral e diante da expansão das tecnologias de IA generativa.
O que muda com a chegada dessa nova ferramenta?
O lançamento do Veo 2 reforça a disputa entre as big techs pela liderança na próxima geração da inteligência artificial. Com esse movimento, o Google não apenas responde à OpenAI e ao seu modelo Sora, mas também avança em uma das fronteiras mais sensíveis da IA: a geração de vídeos realistas baseados apenas em texto.