Google lança Gemini Omni para edição de vídeos com IA
19/05/2026 / 15:15
Compartilhe:
Foto: Reprodução

O Google lançou na terça-feira (19) o Gemini Omni, uma nova tecnologia de inteligência artificial voltada à criação e edição de vídeos com aspecto ultrarrealista. O anúncio foi feito durante o evento Google I/O 2026, realizado em Mountain View, Califórnia (EUA).

O Gemini Omni destaca-se por permitir a combinação de imagens, áudio, vídeo e texto para gerar vídeos de alta qualidade. A ferramenta possibilita que usuários enviem vídeos já gravados e façam alterações por meio de comandos em texto, sem a necessidade de programas profissionais de edição, como o Adobe Premiere.

Funcionalidades da tecnologia

Com a nova tecnologia do Google, é possível modificar detalhes específicos ou transformar completamente uma cena em um vídeo, apenas interagindo com a inteligência artificial por meio de comandos escritos. Alguns exemplos citados pela empresa incluem mudar ações em um vídeo, adicionar personagens e objetos, além de alterar ambientes, ângulos e estilos visuais, mantendo a consistência da gravação original.

O Google informa que o Omni utiliza o conhecimento do modelo Gemini para integrar linguagem, imagens e contexto, sendo capaz não só de criar cenas realistas, mas também de prever o que deve acontecer a seguir para dar continuidade ao vídeo.

Disponibilidade e recursos adicionais

A tecnologia está disponível globalmente desde o dia do lançamento para assinantes dos planos Google AI Plus, Pro e Ultra. O Gemini Omni pode ser utilizado no aplicativo Gemini, no Google Flow e no YouTube Shorts. Além disso, o Google anunciou que a ferramenta será liberada gratuitamente no YouTube Shorts e no app YouTube Create ainda nesta semana.

O Google também revelou que o Gemini Omni permite a criação de avatares digitais baseados na voz e aparência dos usuários, o que caracteriza uma forma de deepfake. A empresa afirmou que possui políticas claras para proteger os usuários e evitar danos causados pelo uso inadequado dessas tecnologias.

Para garantir a identificação dos vídeos gerados ou editados com o Omni, todo conteúdo terá automaticamente o SynthID, uma marca-d’água digital imperceptível criada pelo Google para verificar mídias produzidas por inteligência artificial.

Outros projetos do Google na área

O Google já possui outro modelo de IA para vídeos, o Veo 3, que gera imagens em movimento a partir de texto. Segundo Koray Kavukcuoglu, diretor de tecnologia do Google DeepMind, o Gemini Omni difere pois é um modelo multimodal, capaz de receber e combinar diversos tipos de arquivos — fotos, áudio e texto — para produzir um resultado integrado.

A empresa também informou que trabalha em uma versão mais potente chamada Omni Pro, porém não divulgou detalhes nem previsão de lançamento, apenas afirmou que estará disponível em breve.