El mundo de la inteligencia artificial hoy amaneció con un nuevo escenario. OpenAI lanzó Sora, su nueva herramienta de inteligencia artificial que genera videos a partir de texto. Pero, con una particularidad: su alto nivel de verosimilitud en la recreación de escenas y movimientos.
¿Cómo funciona? Como todas las otras plataformas de inteligencia artificial, Sora no se aleja de un manejo fácil y amigable para cualquier usuario. Basta con solo escribir un prompt (es decir, un texto con determinadas instrucciones) y, casi por arte de magia, la IA generará un video que intente representar de la manera más fiel el pedido.
Sora es capaz de crear videos de hasta un minuto con escenas complejas que contengan múltiples personajes, tipos específicos de movimientos y detalles precisos de los sujetos y el fondo, según describe el comunicado oficial de la empresa. Además, el modelo está entrenado para comprender no solo lo que el usuario ha pedido en la instrucción, sino también cómo existen esas cosas en el mundo físico.
En detalle, la herramienta tiene un profundo conocimiento del lenguaje, lo que le permite interpretar con precisión las indicaciones y generar personajes convincentes que expresan “emociones”. A su vez, Sora también puede crear varias tomas dentro de un mismo vídeo generado que persistan con precisión los personajes y el estilo visual.
Los videos creados con Sora
Aquí unos ejemplos de las indicaciones de texto y los videos generados por Sora compartidos por OpenAI.
La instrucción (prompt): Vista de dron de las olas rompiendo contra los escarpados acantilados de la playa de Garay Point en Big Sur. Las aguas azules crean olas de punta blanca, mientras que la luz dorada del sol poniente ilumina la costa rocosa. A lo lejos se divisa una pequeña isla con un faro, y arbustos verdes cubren el borde del acantilado. La pronunciada caída desde la carretera hasta la playa es espectacular, con los bordes del acantilado sobresaliendo sobre el mar. Es una vista que capta la cruda belleza de la costa y el escarpado paisaje de la autopista de la costa del Pacífico.
El video creador por Sora AI:
La instrucción (prompt): Un primer plano extremo de un hombre canoso con barba de unos 60 años, está sumido en sus pensamientos reflexionando sobre la historia del universo mientras está sentado en un café de París, sus ojos enfocan a la gente fuera de la pantalla mientras caminan mientras él está sentado casi inmóvil, está vestido con un traje de chaqueta de lana con una camisa de botones , lleva una boina marrón y gafas y tiene un aspecto muy profesoral, y al final ofrece una sutil sonrisa con la boca cerrada como si hubiera encontrado la respuesta al misterio de la vida, la iluminación es muy cinematográfica con la luz dorada y las calles parisinas y la ciudad de fondo, profundidad de campo, película cinematográfica de 35 mm.
El video creador por Sora AI:
La instrucción (prompt): La escena animada muestra un primer plano de un pequeño monstruo esponjoso arrodillado junto a una vela roja que se derrite. El estilo artístico es tridimensional y realista, con especial atención a la iluminación y la textura. El ambiente del cuadro es de asombro y curiosidad, ya que el monstruo contempla la llama con los ojos muy abiertos y la boca abierta. Su pose y su expresión transmiten una sensación de inocencia y alegría, como si estuviera explorando el mundo que le rodea por primera vez. El uso de colores cálidos y una iluminación espectacular realzan aún más el ambiente acogedor de la imagen.
El video creador por Sora AI:
La instrucción (prompt): Primer plano extremo del parpadeo del ojo de una mujer de 24 años, de pie en Marrakech durante la hora mágica, película cinematográfica rodada en 70mm, profundidad de campo, colores vivos, cinematográfico.
El video creador por Sora AI:
La instrucción (prompt): Un vídeo de celebración del Año Nuevo Lunar chino con un dragón chino.
El video creador por Sora AI:
Las críticas
Una de las críticas más importantes a esta herramienta es con qué contenido se entrenó. Una pregunta que ha generado muchas polémicas con los creadores de contenidos el año pasado, en especial con escritores y la llegada de las “novelas” creadas por Chat GPT que son exclusivamente potenciadas por historias escritas por profesionales y sin remuneración alguna.
Sobre esta cuestión, según informa un artículo de The New York Times, OpenAI se negó a decir de cuántos vídeos aprendió el sistema o de dónde procedían, salvo que el entrenamiento incluyó tanto vídeos disponibles públicamente como vídeos con licencia de titulares de derechos de autor. En general, la compañía nunca da detalles sobre los pocos datos utilizados para entrenar sus tecnologías.
Por el momento, Sora se encuentra en una etapa de desarrollo y, para ello, está solamente disponible para las personas dentro del equipo de OpenAI que están evaluando los riesgos de esta herramienta y, también, para algunos artistas visuales, diseñadores o cineastas que están dando una retroalimentación crítica sobre el modelo.