Criando vídeo a partir de texto
Sora é um modelo de IA que pode criar cenas realistas e imaginativas a partir de instruções de texto.
Estamos ensinando IA a compreender e simular o mundo físico em movimento, com o objetivo de treinar modelos que ajudem as pessoas a resolver problemas que exigem interação no mundo real.
Apresentando Sora, nosso modelo de texto para vídeo. Sora pode gerar vídeos de até um minuto, mantendo a qualidade visual e a aderência às instruções do usuário.
Sora é capaz de gerar cenas complexas com vários personagens, tipos específicos de movimento e detalhes precisos do assunto e do fundo. O modelo entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico.
O modelo tem um profundo conhecimento da linguagem, o que lhe permite interpretar com precisão as instruções e gerar personagens atraentes que expressam emoções vibrantes. Sora também pode criar várias tomadas em um único vídeo gerado que persistem com precisão os personagens e o estilo visual.
Segurança
Tomaremos várias medidas de segurança importantes antes de disponibilizar o Sora nos produtos da OpenAI. Estamos trabalhando com red teamers — especialistas em áreas como desinformação, conteúdo de ódio e preconceito — que testarão o modelo de forma adversa.
Técnicas de pesquisa
Sora é um modelo de difusão, que gera um vídeo começando com um que se parece com ruído estático e gradualmente o transforma removendo o ruído ao longo de várias etapas.
Sora é capaz de gerar vídeos inteiros de uma só vez ou estender os vídeos gerados para torná-los mais longos. Ao fornecer ao modelo a previsão de muitos quadros ao mesmo tempo, resolvemos um problema desafiador de garantir que um objeto permaneça o mesmo mesmo quando sai temporariamente de vista.
Sora é um modelo de IA que pode criar cenas realistas e imaginativas a partir de instruções de texto.
Estamos ensinando IA a compreender e simular o mundo físico em movimento, com o objetivo de treinar modelos que ajudem as pessoas a resolver problemas que exigem interação no mundo real.
Apresentando Sora, nosso modelo de texto para vídeo. Sora pode gerar vídeos de até um minuto, mantendo a qualidade visual e a aderência às instruções do usuário.
Sora é capaz de gerar cenas complexas com vários personagens, tipos específicos de movimento e detalhes precisos do assunto e do fundo. O modelo entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico.
O modelo tem um profundo conhecimento da linguagem, o que lhe permite interpretar com precisão as instruções e gerar personagens atraentes que expressam emoções vibrantes. Sora também pode criar várias tomadas em um único vídeo gerado que persistem com precisão os personagens e o estilo visual.
Segurança
Tomaremos várias medidas de segurança importantes antes de disponibilizar o Sora nos produtos da OpenAI. Estamos trabalhando com red teamers — especialistas em áreas como desinformação, conteúdo de ódio e preconceito — que testarão o modelo de forma adversa.
Técnicas de pesquisa
Sora é um modelo de difusão, que gera um vídeo começando com um que se parece com ruído estático e gradualmente o transforma removendo o ruído ao longo de várias etapas.
Sora é capaz de gerar vídeos inteiros de uma só vez ou estender os vídeos gerados para torná-los mais longos. Ao fornecer ao modelo a previsão de muitos quadros ao mesmo tempo, resolvemos um problema desafiador de garantir que um objeto permaneça o mesmo mesmo quando sai temporariamente de vista.
Mostrar