Unreal Engine FranceUnreal Engine France

OpenAI Sora permet de créer des vidéos incroyables à partir de prompts

Sora est un modèle d’IA capable de créer des scènes réalistes et imaginatives à partir d’instructions.

L’intelligence artificielle peut générer des vidéos d’une durée maximale d’une minute tout en conservant la qualité visuelle et le respect du prompt de l’utilisateur. Sora est capable de générer des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis du sujet et de l’arrière-plan. Le modèle comprend non seulement ce que l’utilisateur a demandé dans le prompt, mais également comment ces choses existent dans le monde physique. Le modèle possède une compréhension approfondie du langage, ce qui lui permet d’interpréter avec précision les prompts et de générer des personnages convaincants qui expriment des émotions vibrantes. Sora peut également créer plusieurs plans dans une seule vidéo générée qui conservent avec précision les personnages et le style visuel.

Le modèle actuel présente des faiblesses. Il peut avoir du mal à simuler avec précision la physique d’une scène complexe et ne pas comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut mordre dans un cookie, mais par la suite, le cookie peut ne pas avoir de marque de morsure. Il peut également confondre les détails spatiaux d’une invite, par exemple en mélangeant la gauche et la droite, et peut avoir du mal à décrire avec précision les événements qui se déroulent au fil du temps, comme suivre une trajectoire de caméra spécifique.

OpenAI présente Sora comme étant une « voie prometteuse » vers l’élaboration de modèles capables de simuler le monde physique, ce qui n’est pas du tout garanti. Si ses performances sont indéniables, il s’agit avant tout d’un modèle entraîné à générer des vidéos à partir d’une grande quantité de vidéos. Cela ne signifie pas qu’il appréhende le monde physique. La start-up s’est d’ailleurs bien gardée de donner des détails sur les données d’entraînement du modèle, qui sont sans doute déterminantes pour obtenir ce niveau de qualité.

Fidèle à son approche propriétaire, OpenAI a publié des détails limités sur ses recherches, et son patron Sam Altman a mis en garde sur le fait que Sora ne serait pas disponible au public avant un bon moment. Aujourd’hui, Sora devient disponible pour les équipes red pour évaluer les zones critiques en termes de dommages ou de risques. Open AI partagera bientôt les progrès de ses recherches pour commencer à travailler avec des personnes extérieures et obtenir leurs avis pour donner au public une idée des capacités de l’IA à l’avenir.

Retrouvez plus d’infos et d’exemples de vidéos générées sur le site officiel OpenAI Sora: https://openai.com/sora