
La IA de Google que funciona como un Photoshop a golpe de prompt
En esta guía te quiero hablar de un nuevo modelo de IA lanzado por Google que permite editar fotos a golpe de prompt como si estuvieras en Photoshop. Lo más interesante de esta nueva variante de Gemini Flash 2.0 es que es capaz de mantener la consistencia de la imagen a medida que se introducen las ediciones.
Lo habitual es que, si envías una imagen a un chatbot con modelo de difusión integrado y le adjuntas una petición, lo que va a hacer es generar una nueva imagen a partir de lo que le has enviado. Lo mismo pasa si, después de obtener los resultados, se le piden cambios a la IA. Lo normal es que la salida sea siempre una imagen nueva.
Sin embargo, uno de los nuevos trucos de Google Gemini permite aplicar ediciones sobre una imagen, pero sin alterar sus características principales. Es como si hicieras una edición de Photoshop, pero sin tener que dedicar horas. De hecho, como se basa en Gemini Flash, los resultados estarán disponibles en cuestión de segundos. ¿Quieres ver cómo funciona?
Cómo probar Gemini Flash 2.0 (Image Generation)
Para probar Gemini Flash 2.0 (Image Generation), lo primero que debes hacer es acceder a Google AI Studio. Vas a poder hacerlo de forma gratuita, sin suscripciones ni pagos por uso. Lo único que necesitas es acceder con una cuenta de Google.
Una vez te encuentras en esta web, fíjate que en la barra lateral hay un selector de menús. Si no ves la barra lateral, haz más grande la ventana o presiona en el icono de los ajustes que verás en la parte superior. En el selector de modelos, elige la opción Gemini Flash 2.0 (Image Generation) Experimental.
Bien, una vez hecho esto, ya te puedes poner a "jugar" con el modelo. Lo que yo he hecho es enviarle una de mis fotos, donde se ve un lago parcialmente helado, y pedirle que en el centro agregue un barco. Como ves en el resultado, la imagen es exactamente la misma, pero en ella se ve un barco.
Lo más interesante es que, una vez ha hecho una primera edición, es posible solicitar más ediciones. Por ejemplo, después de agregar el barco, le he dicho que edite la imagen para que sea de noche y que, además, el barco tenga las luces encendidas. Sin duda, el resultado es bueno. Ahora bien, de nuevo, lo que más llama la atención es que la imagen sigue siendo la misma.
Aquí voy con otro ejemplo. En este caso, he subido la imagen de un edificio. Le he pedido que agregue tres mástiles en la azotea. Además, le he hecho saber que las banderas deben ser también tres y que su diseño debe ser desconocido.
Como se aprecia arriba, la IA se ha comportado bien en este caso, aunque no ha sido del todo precisa. Aunque he especificado con claridad cuántas banderas debían aparecer, ha colado una cuarta.
He querido continuar con lo de las banderas en la siguiente petición y pedirle que cambie las que había creado por unas nuevas. En este caso, le he pedido que fueran las banderas de Francia, España y Portugal.
Curiosamente, solo la bandera de España es la que más realismo tiene. El resto siguen siendo inventadas. De todos modos, no hay que olvidar que este es un modelo bastante pequeño, así que sus capacidades son limitadas. Lo interesante, nuevamente, es que la imagen enviada al principio no ha cambiado, sino que sigue siendo la misma.
Por último, le he pedido que abra todas las ventanas del edificio. Es interesante que, en este caso, la precisión ha sido alta, pues la puerta se ha mantenido cerrada. Gemini ha sabido diferenciar bien entre lo que es una ventana y lo que es una puerta.
Algo que debes tener en cuenta con respecto a las funciones descritas en esta guía es que están destinadas a experimentos. De hecho, con cada edición, la imagen principal pierde algo de calidad, así que no es viable emplear las imágenes resultantes para trabajos profesionales. La única forma sería emplear un servicio de escalado de imagen basado en IA, como Upscale.media.
Gracias a la IA, editar fotos será coser y cantar
La edición de fotos es uno de los campos que la IA está dispuesta a revolucionar. Ahora bien, todavía el camino por recorrer es largo, especialmente si se buscan resultados profesionales. Por el momento, lo que obtenemos es cuanto menos sorprendente, especialmente cuando la IA distingue entre lo que no hay que editar y lo que sí, tal y como te mostramos en el análisis de Pixel 9 Pro.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!