Na terceira das doze transmissões ao vivo da OpenAI planejadas para dezembro, a empresa anunciou, nesta segunda-feira, 9, o lançamento oficial da Sora, IA que gera vídeos realistas a partir de comandos de texto para o público. Depois de meses de espera, o produto já está disponível para os assinantes do ChatGPT Plus e ChatGPT Pro em Sora.com em quase todo o mundo, exceto para a países da União Europeia e Reino Unido.
A Sora é a ferramenta de inteligência artificial (IA) da empresa para produção de vídeos. Sam Altman, CEO da OpenAI, disse na live que "não queremos que o mundo seja só texto". A tecnologia funciona com base nos comandos dos usuários, podendo transformar textos e imagens em vídeos de até 20 segundos, em diferentes formatos e em resolução de até 1080p.
Além de criar um vídeo do zero, o usuário também poderá trazer um vídeo "real" e alterar partes dele, por exemplo. A ferramenta chamada Storyboard permitirá que o usuário "brinque" com a sequência produzida pela IA, podendo mudá-la quando e como quiser. Além disso, é possível continuar o vídeo apenas escrevendo o que deseja ver e, assim, a IA criará uma imagem com base na descrição de texto fornecida pelo usuário.
A Sora oferecerá quatro versões do vídeo, em diferentes ângulos e estilos. Depois de pronto, o usuário poderá pedir alterações, desde as mais nítidas até os pequenos detalhes. No exemplo da empresa, eles substituíram um vídeo de mamutes no deserto por robôs no deserto. Os detalhes permaneceram o mesmo, mas mudanças tão grandes como essa são do nível mais "desafiador", segundo a OpenAI.
Também, o usuário terá a opção de trazer uma imagem e pedir para que a IA produza um vídeo com base nela. Por exemplo, na live, os criadores trouxeram uma imagem de um farol e, em texto, pediram para que a ferramenta criasse um vídeo para aquele cenário. Os resultados, aparentemente, foram bons. Entretanto, a OpenAI disse que essa é apenas a primeira versão da ferramenta e, que em breve, ela estará muito melhor.
Now you can generate entirely new videos from text, bring images to life, or extend, remix, or blend videos you already have. We've developed new interfaces to allow easier prompting, creative controls, and community sharing: https://t.co/HMcAKwaCCw pic.twitter.com/gtMiFkT6GB
— OpenAI (@OpenAI) December 9, 2024
Os usuários também terão acesso a um feed onde poderão acompanhar criações de outros membros da comunidade da Sora. A ferramenta só está disponível para os assinantes do ChatGPT Plus - com até 50 vídeos em 720p por mês - e para os assinantes do ChaGPT Pro, que contam com até 500 vídeos em 1080p por mês.
A Sora já tinha sido anunciada pela OpenAI no início de 2024. Após uma longa fase de testes e questões regulatórias, a ferramenta foi disponibilizada para um grupo seleto de pessoas, como artistas e criadores. O novo produto da OpenAI não é o primeiro a gerar vídeos com inteligência artificial generativa, o Google e a Meta oferecem serviços parecidos, por exemplo. Entretanto, a qualidade dos vídeos da empresa de Sam Altman já chamou a atenção.