DALL-E, l’IA che disegna

DALL-E è un’estensione di GPT-3 che analizza i prompt di testo e risponde non con le parole ma con le immagini

Al suo interno, DALL-E utilizza la stessa nuova architettura di rete neurale che è responsabile di tonnellate di recenti progressi in ML: il Transformer.

Ciò che rende DALL-E unica è che è stata addestrata su sequenze che erano una combinazione di parole e pixel.

Inoltre, questi strani suggerimenti suggeriscono qualcosa di ancora più affascinante di DALL-E: la sua capacità di eseguire “ragionamenti visivi a colpo zero”.

Per testare la capacità di ragionamento visivo di DALL-E, gli autori hanno fatto fare un test del QI visivo.

“DALL-E è spesso in grado di risolvere matrici che implicano la continuazione di schemi semplici o di un ragionamento geometrico di base”, scrivono gli autori, ma in alcuni casi ha fatto meglio di altri.

illustrazione di un ravanello daikon in un tutù mentre pattina sul ghiaccio (creata da DALL-E)
#openai #science #gpt3
FONTE : https://openai.com/blog/dall-e/
riassunto con : https://smmry.com/
riassunto con : https://app.scholarcy.com/
Se ti è piaciuto il contenuto: condividilo!

You may also like...

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

Translate »