SORA IA: Impactantes Videos Creados por Inteligencia Artificial

  

OpenAI presenta una inteligencia artificial que genera vídeos impactantes al instante

En abril, una nueva empresa neoyorquina llamada Runway AI presentó una tecnología que permitía generar vídeos, como el de una vaca en una fiesta de cumpleaños o el de un perro chateando en un smartphone, simplemente escribiendo una frase en un recuadro de la pantalla del ordenador.

Los vídeos de cuatro segundos eran borrosos, entrecortados, distorsionados e inquietantes. Pero eran una clara señal de que las tecnologías de inteligencia artificial generarían vídeos cada vez más convincentes en los meses y años venideros.

Apenas 10 meses después, la empresa de San Francisco OpenAI ha presentado un sistema similar que crea vídeos que parecen sacados de una película de Hollywood. Una demostración incluía vídeos cortos -creados en minutos- de mamuts lanudos trotando por un prado nevado, un monstruo contemplando una vela que se derrite y una escena callejera de Tokio aparentemente filmada por una cámara que atraviesa la ciudad en caída libre.

OpenAI, la empresa que está detrás del chatbot ChatGPT y del generador de imágenes fijas DALL-E, es una de las muchas compañías que se apresuran a mejorar este tipo de generador de vídeo instantáneo, incluidas empresas de nueva creación como Runway y gigantes tecnológicos como Google y Meta, propietaria de Facebook e Instagram. La tecnología podría acelerar el trabajo de los cineastas experimentados y sustituir por completo a los artistas digitales con menos experiencia.

También podría convertirse en una forma rápida y barata de crear desinformación en línea, haciendo aún más difícil distinguir lo que es real en Internet.

Me aterra absolutamente que este tipo de cosas puedan influir en unas votaciones muy reñidas"

afirma Oren Etzioni, profesor de la Universidad de Washington especializado en inteligencia artificial. También es fundador de True Media, una ONG que trabaja para identificar la desinformación online en las campañas políticas.

OpenAI llama a su nuevo sistema Sora, por la palabra japonesa que significa cielo. El equipo que está detrás de la tecnología, incluidos los investigadores Tim Brooks y Bill Peebles, eligió el nombre porque "evoca la idea de un potencial creativo ilimitado".

En una entrevista, también dijeron que la empresa aún no estaba liberando Sora al público porque todavía estaba trabajando para comprender los peligros del sistema. En su lugar, OpenAI está compartiendo la tecnología con un pequeño grupo de académicos y otros investigadores externos que la someterán a un "equipo rojo", término con el que se conoce la búsqueda de posibles usos indebidos.

La intención es ofrecer un adelanto de lo que está por venir, para que la gente pueda ver las posibilidades de esta tecnología y nosotros podamos conocer su opinión"

afirma Brooks.

 

OpenAI ya está etiquetando los vídeos producidos por el sistema con marcas de agua que los identifican como generados por la inteligencia artificial. También pueden ser difíciles de detectar.

 

El sistema es un ejemplo de inteligencia artificial generativa, que puede crear texto, imágenes y sonidos al instante. Al igual que otras tecnologías de inteligencia artificial generativa, el sistema de OpenAI aprende analizando datos digitales, en este caso vídeos y subtítulos que describen su contenido.

OpenAI no ha querido decir de cuántos vídeos ha aprendido el sistema ni de dónde proceden, salvo que el entrenamiento ha incluido tanto vídeos públicos como vídeos con licencia de titulares de derechos de autor. La empresa dice poco sobre los datos utilizados para entrenar sus tecnologías, probablemente porque quiere mantener una ventaja sobre sus competidores, y ha sido demandada varias veces por utilizar material protegido por derechos de autor.

Ships in Coffee by OpenAI Sora

Sora genera vídeos en respuesta a descripciones breves, como "un mundo de papel magníficamente representado de un arrecife de coral, plagado de peces de colores y criaturas marinas". Aunque los vídeos pueden ser impresionantes, no siempre son perfectos y pueden incluir imágenes extrañas e ilógicas. El sistema, por ejemplo, generó hace poco un vídeo de alguien comiéndose una galleta, pero la galleta nunca se hizo más pequeña.

DALL-E, Midjourney y otros generadores de imágenes fijas han mejorado tan rápidamente en los últimos años que ahora producen imágenes casi indistinguibles de las fotografías. Esto ha hecho más difícil identificar la desinformación en Internet, y muchos artistas digitales se quejan de que les ha dificultado encontrar trabajo.

"Todos nos reímos en 2022 cuando salió Midjourney por primera vez y dijimos: 'Oh, qué bonito'", cuenta Reid Southen, un artista conceptual de cine de Michigan. "Ahora la gente está perdiendo su trabajo por Midjourney".

Administrador de Maro Magazine

Comentarios

https://maromagazine.com/assets/images/user-avatar-s.jpg

0 comment

Write the first comment for this!