Por Wagner Albuquerque
A OpenAI introduziu sua mais recente ferramenta, denominada Sora, destinada à criação de vídeos de até um minuto de duração a partir de texto. A empresa destaca que essa inteligência artificial é capaz de gerar “cenas complexas com vários personagens” e proporcionar “detalhes precisos do sujeito e do plano de fundo”.
A Sora entra na competição com modelos similares desenvolvidos pela Google (Lumiere) e pela Meta (Make-A-Video), todos ainda em fase de testes e não disponíveis para os usuários.
A promessa da OpenAI é que sua IA consiga criar personagens convincentes, capazes de expressar emoções vibrantes, chegando ao ponto de superar muitos atores no processo.
No material promocional da Sora, a OpenAI destaca a capacidade da IA de compreender as solicitações dos usuários e interpretar como os elementos mencionados no texto “existem no mundo físico”. Além disso, a ferramenta é projetada para criar múltiplas cenas em um único vídeo, mantendo a consistência dos personagens e do estilo visual.
Embora a página da OpenAI apresente vídeos de demonstração visualmente satisfatórios e detalhados, a Sora ainda enfrenta desafios típicos de inteligência artificial. A empresa reconhece que a IA tem dificuldades em simular a física de cenas complexas, muitas vezes compreendendo erroneamente causas e efeitos. A página ilustra problemas como objetos que surgem ou se movem de maneira não realista, confusões espaciais e lapsos na compreensão de eventos temporais.
A Sora, por enquanto, não estará disponível para o público geral. A OpenAI planeja disponibilizá-la apenas para os “red teamers” da empresa, responsáveis por testar riscos e possíveis perigos. Artistas visuais, cineastas e designers também terão acesso à ferramenta para fornecer feedbacks.
Confira os vídeos produzidos por comando de texto: