Revisamos el funcionamiento de la herramienta, que trabaja de forma similar a DALL-E de OpenAI y Midjourney.
Apple acaba de ingresar al mundillo de la inteligencia artificial generativa, un sector en auge, con su propio generador de imágenes. MGIE —así se llama— funciona de forma similar a como lo hacen otros sistemas como DALL-E de OpenAI, Stable Diffusion y Midjourney. Básicamente, el usuario escribe comandos y la tecnología convierte el pedido en contenido visual.
Apple MGIE: todo lo que hay que saber del nuevo generador de imágenes con inteligencia artificial
La compañía de la manzana mordida no es uno de los jugadores más relevantes en el negocio de la inteligencia artificial. Tal como señalamos anteriormente en Tecno, integrantes de la firma estadounidense manifestaron sus preocupaciones por el evidente retraso de Siri —el asistente virtual de la empresa— en relación con los flamantes chatbots, ChatGPT a la cabeza.
La aparición de MGIE muestra que Apple tiene planes en el ámbito de la IA. No es un ingreso por la puerta grande, pero nos deja en claro que la firma liderada por Tim Cook no se quedará simplemente con los brazos cruzados, viendo cómo sus competidores le sacan jugo a la tecnología de moda.
¿Cómo funciona y para que sirve Apple MGIE? Veamos algunos datos del generador de imágenes.
Su denominación hace referencia a un modelo de generación de imágenes guiada por lenguaje. En ese sentido, tal como señalamos, trabaja mediante comandos de texto: el usuario escribe indicaciones —prompts, en la jerga de la IA— para que el sistema genere una imagen en función de ese pedido.
En concreto, MGIE opera con MLLM, modelos que son capaces de convertir indicaciones de texto simples o ambiguas en indicaciones detalladas y comprensibles.
Más arriba, en la imagen vemos algunos ejemplos de cómo funciona MGIE de Apple. Por caso, partiendo de la pizza de la izquierda, el sistema puede añadir vegetales en la imagen al recibir el comando “hacerla más saludable”. Lo que hace es interpretar que el usuario pretende que se incluyan ingredientes más nutritivos y entonces edita el contenido.
MGIE es de código abierto; esto quiere decir que los desarrolladores e investigadores interesados pueden revisar sus entrañas, e incluso realizar modificaciones.
Apple desarrolló el sistema junto a investigadores de la Universidad de California en Santa Bárbara.
También es una especie de Photoshop de la nueva era. Además de realizar cambios en las imágenes, puede hacer recortes, cambiar el tamaño y rotar las fotografías; mejorar el brillo, el contraste y el equilibrio de color, siempre mediante indicaciones de texto.
Apple no dijo si MGIE potenciará alguno de sus productos
Según informa el sitio VentureBeat, Apple lanzó MGIE a través de GitHub —una plataforma muy frecuentada por desarrolladores— y también hay una demo disponible en Hugging Face Spaces. La firma californiana aún no informó si prevé llevar los aprendizajes de este proyecto a una herramienta o característica para alguno de sus productos.
A un lado de este generador, se ha rumoreado que Apple ya trabaja en su propia versión de ChatGPT. Informes que circularon el año pasado indicaron que ingenieros de la compañía llaman a este desarrollo AppleGPT, aunque no es probable que aquella sea la denominación del sistema en un eventual lanzamiento. El proyecto con el que se especula (pues la empresa no habló oficialmente al respecto) estaría siendo liderado por Craig Federighi, jefe de la división de inteligencia artificial de la empresa.
El músico británico continúa con su gira “Got Back”, que lo trae nuevamente a nuestro país con tres conciertos durante octubre. Paul McCartney actuando en el festival de Glastonbury, en junio...