Midjourney
Midjourney es un laboratorio independiente de investigación y el nombre de un programa de inteligencia artificial con el cual sus usuarios pueden crear imágenes a partir de descripciones textuales, similar a Dall-e de OpenAI y al Stable Diffusion de código abierto.[1][2]
Midjourney | ||
---|---|---|
Una "paloma mecánica" creada con el algoritmo V5 de Midjourney | ||
Información general | ||
Tipo de programa | sitio web de inteligencia artificial generativa | |
Lanzamiento inicial | 1 de febrero de 2022 | |
Idiomas | inglés | |
Enlaces | ||
La herramienta funcionó bajo versión de beta cerrada hasta que el 13 de julio de 2022 el laboratorio anunció el comienzo de una beta abierta.[3] El equipo de Midjourney está dirigido por David Holz, cofundador de Leap Motion. Los usuarios pueden crear obras de arte con Midjourney dando órdenes a un bot alojado en la plataforma Discord, ya sea enviando mensajes directos o invitando a dicho bot a un servidor de terceros.
Historia
editarMidjourney entró por primera vez en beta abierta el 12 de julio de 2022.
La empresa ha estado trabajando para mejorar sus algoritmos, lanzando nuevas versiones cada pocos meses. La versión 2 de su algoritmo se lanzó en abril de 2022 y la versión 3 en julio. El 10 de noviembre de 2022 se lanzó a los usuarios la iteración alfa de la versión 4,[4] y el 15 de marzo de 2023 fue lanzada la versión 5 (en fase beta).[5] La versión 5.2, lanzada en junio de 2023, tuvo como novedad la introducción de la función de outpainting o zoom out, que permite extender el campo de visión original de una imagen.[6] El 21 de diciembre de 2023 se lanzó la iteración alfa de la versión 6. El modelo, que se entrenó desde cero durante nueve meses, trajo mejoras en la reproducción de texto y una interpretación más literal de las instrucciones.[7]
Equipo
editarSon un pequeño equipo autofinanciado centrado en el diseño, la infraestructura humana y la IA. Tienen 11 empleados a tiempo completo y un conjunto de asesores.[8]
Ejecutivos:
- David Holz (fundador de Leap Motion, investigador de la NASA, Max Planck).
Asesores:
- Jim Keller (ingeniero de microprocesadores de Apple, AMD, Tesla, Intel, coautor de x86-64, CTO Tenstorrent).
- Nat Friedman (CEO de GitHub, presidente de la Fundación GNOME).
- Philip Rosedale (fundador de Second Life, CTO RealNetworks).
- Bill Warner (fundador de Avid Technology, inventor de la edición de vídeo no lineal).
Funcionamiento
editarPor el momento sólo se puede acceder a Midjourney mediante un bot en su Discord oficial, enviando mensajes directos al bot o invitando al bot a un servidor de terceros. Para generar imágenes, los usuarios utilizan el comando /imagine
y escriben una descripción o estímulo (prompt en inglés), como en otras herramientas de generación de arte mediante inteligencia artificial. Por ejemplo:
/imagine futuristic building with trees
El bot generará una vista previa con cuatro imágenes, y los usuarios podrán elegir entre generar otras variantes de cada una de ellas, generar la imagen deseada con una mayor resolución o bien descartar los cuatro diseños y solicitar cuatro imágenes completamente distintas.[9]
Además del comando /imagine
, Midjourney dispone de muchos otros comandos que se pueden enviar al bot de Discord, como por ejemplo /blend
, que permite al usuario combinar dos imágenes.
Midjourney se podía probar de forma gratuita hasta finales de marzo de 2023, fecha en la que se cerró esta opción debido a "una demanda extraordinaria" y "abuso" por parte de los usuarios. Hasta entonces, Midjourney permitía que cualquier persona que se registrara en Discord pudiera generar hasta 25 imágenes de manera gratuita.[10] Los usuarios de la versión de pago pueden elegir entre cuatro modelos de suscripción, que varían en función del número de minutos de computación disponibles, es decir, el tiempo que consume el bot para crear la imagen.[11]
Comandos utilizados con frecuencia por Midjourney
editarHay una serie de ajustes, preferencias, parámetros y comandos que los usuarios pueden utilizar en el servidor de Midjourney para relacionarse con el bot. De los comandos básicos, los más comunes son:[12]
/imagine
- genera una matriz de 4 imágenes a partir de una descripción textual/relax
- las creaciones son gratuitas, pero el tiempo de espera para la generación de imágenes es mayor/fast
- prioriza la capacidad de generación, pero es más caro/private
- las creaciones son privadas/public
- las creaciones son públicas/help
- proporciona información sobre el bot/info
- proporciona información sobre el perfil del usuario/settings
- permite ver y cambiar las preferencias actuales mediante unos botones/subscribe
- crea un enlace único a la página de suscripción de la cuenta de Discord actual
Usos
editarSegún la visión de su fundador, David Holz, en declaraciones a The Register, los artistas utilizan Midjourney para crear prototipos rápidos de conceptos artísticos que puedan mostrar a los clientes antes de empezar a trabajar ellos mismos.[13] Algunos artistas han acusado a Midjourney de devaluar el trabajo creativo original, ya que su conjunto de datos de entrenamiento incluye obras artísticas con derechos de autor.[14]
Las potencialidades del software basado en inteligencia artificial como Midjourney, DALL-E y Stable Diffusion, entre otros, pueden tener grandes aplicaciones en la industria publicitaria. La capacidad de estas herramientas de IA para crear imágenes personalizadas y únicas en poco tiempo puede reducir el tiempo de producción y los costos en comparación con la creación manual de imágenes por parte de diseñadores y artistas.
Usos destacados y polémicas
editarEl programa fue utilizado por la revista británica The Economist para crear la portada de un número de junio de 2022.[15][16] En Italia, el Corriere della Sera, uno de los principales diarios del país, publicó en agosto de 2022 un cómic creado con Midjourney, firmado por el escritor Vanni Santoni.[17] Charlie Warzel utilizó Midjourney para generar dos imágenes de Alex Jones para un boletín de la revista estadounidense The Atlantic. El hecho de publicar una portada generada por inteligencia artificial suscitó críticas de personas que consideraban que se estaba devaluando el trabajo de los artistas ilustradores. Esta polémica provocó que Warzel considerase "un error" su decisión de usar imágenes generadas por inteligencia artificial.[18] El programa de la HBO Last Week Tonight with John Oliver incluyó en un segmento de 10 minutos dedicado a la inteligencia artificial varias imágenes creadas con Midjourney en un episodio emitido en agosto de 2022.
Una imagen de Midjourney llamada Théâtre d'Opéra Spatial ganó el primer puesto en un concurso de arte digital de la Feria Estatal de Colorado (EE. UU.), en su edición de 2022.[14] Jason Allen, que escribió la descripción que llevó a Midjourney a generar la imagen, imprimió la imagen en un lienzo y la presentó al concurso con el nombre "Jason M. Allen v. Midjourney". Algunos artistas digitales se mostraron molestos por la noticia.[19] Allen no se disculpó e insistió en que había seguido las reglas del concurso. Los dos jueces de la categoría desconocían que Midjourney utilizaba la inteligencia artificial para generar imágenes, aunque después dijeron que si lo hubiesen sabido, habrían otorgado a Allen el primer premio de todos modos.[20]
En diciembre de 2022 se utilizó Midjourney para crear las ilustraciones de un libro infantil en un solo fin de semana. El libro, titulado Alice and Sparkle, cuenta la historia de una niña que construye un robot que adquiere conciencia de sí mismo. Su creador, Ammaar Reeshi, pasó horas ajustando las instrucciones dadas a Midjourney y descartando cientos de resultados hasta que escogió las 13 ilustraciones definitivas del libro.[22] Tanto el proceso como el producto suscitaron críticas; según un artista: "El principal problema... es que se ha elaborado tomando como base el trabajo de los artistas. Son nuestras creaciones, los estilos característicos que nosotros hemos creado y que no hemos dado nuestro consentimiento para que se utilicen".[23]
El 15 de marzo de 2023, a raíz del lanzamiento de la versión 5, la propia compañía anunció que comenzaría a publicar una revista mensual para mostrar y celebrar la creatividad de la comunidad que han construido.[24]
Mientras que en 2022 todavía era relativamente fácil detectar una foto falsa generada por IA, en 2023 las fotos generadas por IA alcanzaron un nivel de realismo tal que podrían ser confundidas con fotos reales a primera vista. Como resultado, se produjo una ola de "fotos" generadas por IA que se creían inicialmente como fotos reales por muchos espectadores. Una imagen generada por Midjourney que se volvió especialmente conocida mostraba al Papa Francisco con un elegante abrigo blanco de invierno.[25][26] El fotógrafo Boris Eldagsen ganó el primer lugar en la categoría "Creativa" en el concurso Sony World Photography Awards 2023. La imagen premiada que presentó fue creada utilizando inteligencia artificial.[27] Sin embargo, después de recibir el premio, él decidió rechazarlo. Aunque había insinuado previamente al concurso que la imagen no era una fotografía convencional, al rechazar el premio buscaba fomentar un debate sobre el papel de la inteligencia artificial en el arte.
Diversos estudios apuntan a que las imágenes generadas por Midjourney pueden presentar sesgos.[28] Por ejemplo, en un estudio incluso las instrucciones "neutras" arrojaron resultados desiguales en lo que respecta al sexo, el color de la piel y la ubicación.
Ejemplos
editarA continuación se muestran algunos ejemplos de imágenes que Midjourney es capaz de generar. Las instrucciones o prompts correspondientes se encuentran en la página de descripción de cada imagen.
-
Midjourney puede crear imágenes de objetos, como por ejemplo un ordenador futurista.
-
Midjourney puede crear imágenes de personas ficticias, como este niño de 8 años.
-
Midjourney puede crear fotos "antiguas" que parecen reales.
-
Midjourney puede crear personajes de cómic, como este pequeño dinosaurio.
-
Midjourney puede crear imágenes de animales, como este cachorro de oso polar.
-
Midjourney puede crear imágenes de paisajes, por ejemplo, esta imagen panorámica de un castillo sobre una colina.
-
Midjourney puede utilizar diferentes estilos pictóricos, por ejemplo, una acuarela de un paseo en trineo.
-
Midjourney puede generar imágenes con elementos de fantasía.
Véase también
editarReferencias
editar- ↑ «Huge “foundation models” are turbo-charging AI progress». The Economist. Consultado el 26 de junio de 2022.
- ↑ Hertzmann, Aaron. «Give this AI a few words of description and it produces a stunning image – but is it art?». The Conversation (en inglés). Consultado el 26 de junio de 2022.
- ↑ Pérez, Enrique. «Midjourney: así es la IA rival de DALL-E 2 que ahora está en beta abierta para que cualquiera pueda probarla». xataka.com. Consultado el 16 de julio de 2022.
- ↑ «Midjourney v4 greatly improves the award-winning image creation AI». TechSpot. 10-11-2022.
- ↑ «Starting today our community can test Midjourney V5.».
- ↑ «Midjourney v5.2 revoluciona la generación de imágenes con su impresionante herramienta ‘Zoom Out’». Noticias.ai. 24 de junio de 2023.
- ↑ Franzen, Carl (21 de diciembre de 2023). «Midjourney V6 is here with in-image text and completely overhauled prompting». VentureBeat (en inglés).
- ↑ «Midjourney» (en inglés). Consultado el 25 de noviembre de 2022.
- ↑ «Quick Start». Midjourney (en inglés). Consultado el 12 de febrero de 2023.
- ↑ Figueroa, Juan Carlos (30 de marzo de 2023). «Midjourney: no más pruebas gratuitas tras el escándalo de Trump y el Papa Francisco». Hipertextual.
- ↑ «Subscription Plans». Midjourney (en inglés). Consultado el 28 de octubre de 2023.
- ↑ «Command List». Midjourney (en inglés).
- ↑ Claburn, Thomas (01-08-2022). «Holz, Founder of AI Art, service Midjourney on future images». The Register.
- ↑ a b Gault, Matthew (31 de agosto de 2022). «An AI-Generated Artwork Won First Place at a State Fair Fine Arts Competition, and Artists Are Pissed». Vice.
- ↑ «How a computer designed this week’s cover». Consultado el 26 de junio de 2022.
- ↑ Liu, Gloria (21 de junio de 2022). «DALL-E 2 Made Its First Magazine Cover». Cosmopolitan. Consultado el 26 de junio de 2022.
- ↑ «Su "La Lettura", Highsmith inedita e la città che mutano». Corriere della Sera.
- ↑ «I Went Viral in the Bad Way». Galaxy Brain (en inglés). 17 de agosto de 2022. Consultado el 28 de septiembre de 2022.
- ↑ «An AI-Generated Artwork Won First Place at a State Fair Fine Arts Competition, and Artists Are Pissed». www.vice.com (en inglés). Consultado el 28 de septiembre de 2022.
- ↑ Roose, Kevin (2 de septiembre de 2022). «An A.I.-Generated Picture Won an Art Prize. Artists Aren’t Happy.». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 28 de septiembre de 2022.
- ↑ «He Made A Children's Book Using AI. Artists Are Not Happy». Time (en inglés). 14 de diciembre de 2022. Consultado el 19 de agosto de 2023.
- ↑ Stokel-Walker, Chris (13 de diciembre de 2022). «A Tech Worker Is Selling A Children's Book He Made Using AI. Professional Illustrators Are Pissed.». BuzzFeed News (en inglés). Consultado el 19 de diciembre de 2022.
- ↑ Popli, Nic (14 de diciembre de 2022). «He Used AI to Publish a Children's Book in a Weekend. Artists Are Not Happy About It». Time. Consultado el 19 de diciembre de 2022.
- ↑ «MidJourney Magazine».
- ↑ DM (28 de marzo de 2023). «La imagen viral del Papa con un abrigo blanco que no es lo que parece». El Diario Montañés. Consultado el 1 de junio de 2023.
- ↑ Stokel-Walker, Chris (27 de marzo de 2023). «We Spoke To The Guy Who Created The Viral AI Image Of The Pope That Fooled The World». BuzzFeed News (en inglés). Consultado el 1 de junio de 2023.
- ↑ RTVE.es (17 de abril de 2023). «Renuncia a un premio tras ganarlo con una imagen creada con IA». RTVE.es. Consultado el 1 de junio de 2023.
- ↑ Thomas, Ryan J.; Thomson, T. J. (07-07-2023). «What Does a Journalist Look like? Visualizing Journalistic Roles through AI». Digital Journalism (en inglés): 1-23. ISSN 2167-0811. doi:10.1080/21670811.2023.2229883.