DALL-E, l’IA che disegna
DALL-E è un’estensione di GPT-3 che analizza i prompt di testo e risponde non con le parole ma con le immagini
Al suo interno, DALL-E utilizza la stessa nuova architettura di rete neurale che è responsabile di tonnellate di recenti progressi in ML: il Transformer.
Ciò che rende DALL-E unica è che è stata addestrata su sequenze che erano una combinazione di parole e pixel.
Inoltre, questi strani suggerimenti suggeriscono qualcosa di ancora più affascinante di DALL-E: la sua capacità di eseguire “ragionamenti visivi a colpo zero”.
Per testare la capacità di ragionamento visivo di DALL-E, gli autori hanno fatto fare un test del QI visivo.
“DALL-E è spesso in grado di risolvere matrici che implicano la continuazione di schemi semplici o di un ragionamento geometrico di base”, scrivono gli autori, ma in alcuni casi ha fatto meglio di altri.
FONTE : https://openai.com/blog/dall-e/ riassunto con : https://smmry.com/ riassunto con : https://app.scholarcy.com/