Midjourney ha rilasciato una nuova funzione di "descrizione" che consente di trasformare le immagini in parole.
"Pensiamo che questo strumento trasformerà il vostro processo linguistico-visivo sia in termini di potenza creativa che di scoperta".
- Il team di Midjourney
L'importanza delle descrizioni immagine-testo
Le descrizioni delle immagini hanno importanti implicazioni più ampie che vale la pena menzionare:
Miglioramento dell'accessibilità: Le descrizioni delle immagini rendono i contenuti digitali più accessibili alle persone con problemi di vista o di lettura. Questo avviene tramite l'elemento di testo ALT per le visualizzazioni web.
Miglioramento della ricercabilità: Le descrizioni possono consentire una migliore funzionalità di ricerca e indicizzazione attraverso i motori di ricerca.
Utilizzo per le didascalie: Le didascalie possono incorporare descrizioni per fornire ulteriore chiarezza alle immagini.
Prompt dettagliati: Le descrizioni possono essere utilizzate per creare prompt più dettagliati per la creazione di nuove varianti. Possono fornire ispirazione per l'ingegnerizzazione dei prompt.
Midjourney genera quattro descrizioni diverse in base a un'immagine caricata e rende facile la generazione di nuove varianti.
Come lavora questa nuova funzione
Il modo in cui funziona è che si inizia semplicemente scrivendo /describe e Midjourney fornisce un modo per caricare un'immagine.
Dopo aver caricato l'immagine, premi enter
Midjourney ti restituirà quattro descrizioni
I quattro numeri in basso sono pulsanti di remix attivi - ogni numero corrisponde alla descrizione corrispondente. Facendo clic sul numero si rimescola l'immagine in base alla nuova descrizione.
È anche possibile modificare il prompt tramite il remix:
Questa è in realtà una bella versione remix: Quale ti piace di piu'?
Questo è stato il comado originale che ho usato per creare questa immagine campione:
un'illustrazione di un cervello con radici d'albero, arte psichedelica, vibrante, di Alex Grey, di Amanda Sage, di Robert Venosa, colori al neon
E questo è uno dei suggerimenti descritti da Midjourney, che ho utilizzato per il remix:
Un'immagine di un albero cerebrale astratto con radici, nello stile di Mark Henson, colori luminosi, simbolismo oscuro, anatomia dettagliata, linee audaci, colori vibranti, illustrazioni di fenomeni psicologici, xilografie chiaroscurali.
E' affascinante vedere come le richieste siano diverse, ma in qualche modo simili.
Per divertimento, ho caricato una foto degli astronauti della NASA attraverso la nuova missione lunare e ho chiesto a Midjourney di descrivere e generare una nuova versione di astronauti AI.
Comments