Cose che non vediamo dell’AI

24 Febbraio 2025

Cose che non vediamo dell’AI

di

A chi servono davvero, chi le ha inventate, chi ci lavora, perché consumano tutta questa energia. Domande che è arrivata l’ora di porsi in un altro modo.

L’ipotesi di una nuova alfabetizzazione

E se avessimo sbagliato tutto nel guardare e raccontare le intelligenze artificiali generative, come ChatGPT o Midjourney?

A chi servono davvero

E se non servissero solo a chi, di lavoro, scrive testi o codice, disegna fumetti o fotografa, ma a chi non riesce a farlo, pur avendo ottime idee? Lo esprime perfettamente Pietro Speroni di Fenizio su Facebook:

Vedi, io non so disegnare. Sono totalmente incapace di andare oltre le persone fatte con stuzzicadenti. Ma questo non vuol dire che non abbia idee creative. Solo non le so trasformare in immagini. E come me miliardi di persone.

In realtà lo aveva già scritto Marcel Proust nella sua Recherche, a fare la differenza è la visione, non la tecnica:

La vera vita, la vita finalmente riscoperta e illuminata, la sola vita, dunque, pienamente vissuta, è la letteratura. Vita che, in un certo senso, abita in ogni istante in tutti gli uomini non meno che nell’artista. Ma essi non la vedono, perché non cercano di illuminarla.

E così il loro passato è ingombro di innumerevoli negativi, che restano inutili perché l’intelligenza non li ha “sviluppati”. La nostra vita, e anche la vita degli altri; perché lo stile per lo scrittore, come il colore per il pittore, non è una questione di tecnica, ma di visione.

Noi consideriamo intelligente una persona che capisce e agisce di conseguenza, spesso in campi limitati: la lettura e scrittura, la soluzione di problemi logico-matematici, la capacità di sintesi e di spiegarsi, la creatività. Il test originale del QI, poi integrato, misurava solo l’intelligenza logico-matematica. Con una teoria mai del tutto dimostrata scientificamente, ma utile per il nostro ragionamento, lo psicologo statunitense Howard Gardner ha distinto diversi tipi fondamentali d’intelligenza: linguistica, logico-matematica, musicale, corporeo-cinestetica, spaziale, interpersonale, intrapersonale, naturalistica, spirituale, morale. È una teoria efficace perché ci permette di vedere qualcosa che è sotto i nostri occhi e cioè le diverse forme che possono prendere la nostra comprensione del mondo e la nostra capacità di agire. Ci aiuta anche a capire che, a volte, siamo intelligenti senza saperlo, senza capirlo, senza scegliere di farlo: lo chiamiamo talento ed è centrale nella nostra società.

Torniamo alla domanda iniziale, e se avessimo sbagliato tutto? Abbiamo dei software per creare contenuti partendo da istruzioni (i prompt), che devono prevedere anche informazioni corrette, per evitare errori. A chi servono questi software?

Una risposta alternativa a quanto normalmente si pensa, soprattutto quando si teme che verranno usati per sostituire dei professionisti, è: servono a chi ha idee, intuizioni, informazioni, ma non la capacità per creare gli artefatti necessari per condividerli. Che siano un testo, un’immagine, musica, un video, un’illustrazione. Questo punto di vista ci risulta difficile perché tendiamo a considerare il risultato come parte integrante dell’intelligenza: sapere cosa scrivere per poter scrivere, sapendolo fare.

Leggi anche: Una AI che cambia il nostro modo di pensare

E se ci fossero migliaia di persone che sanno cosa scrivere ma non lo sanno fare? Magari perché disgrafiche o semplicemente perché la scrittura è un’attività profondamente innaturale, che richiede anni di studio? E se ci fossero fotografi ciechi ma con visioni potentissime? Illustratori senza la manualità per disegnare? È per loro che le GenAI sono state create, magari non nelle intenzioni originarie degli sviluppatori, ma realizzando possibilità impensabili fino a pochissimo tempo fa. E se invece della fine della scuola le GenAI rappresentassero una seconda alfabetizzazione?

La piena alfabetizzazione, in Italia, è stata raggiunta da poco tempo: gli analfabeti erano il 74,1% nel 1861, il 12,9% nel 1950, l’1,06% nel 2011. Una volta raggiunta la piena alfabetizzazione abbiamo dovuto ammettere che non tutto era andato come previsto, introducendo il concetto di analfabeta funzionale, cioè chi, pur sapendo tecnicamente leggere, scrivere e far di conto, non è in grado di farlo a un livello sufficiente per approfittarne davvero. Noi oggi guardiamo gli analfabeti funzionali come un tempo si guardavano i neurodiversi, forse dovremmo davvero cambiare sguardo ed essere felici per l’arrivo di software che permettono a chi è a disagio con tecnologie come la lettura, la scrittura, il calcolo, l’illustrazione di esprimere comunque idee, pensieri, a volte creando opere d’arte impossibili da realizzare altrimenti.

E, ultimo ma non per minore importanza: permettendo a chi ha una formazione umanistica di scrivere codice, una forma di scrittura che crea mondi. Il tutto con minore tecnica, ma non certo con minore impegno e passione.

Chi le ha inventate e chi ci lavora

Probabilmente hai sentito ripetere mille volte un’affermazione riconducibile a Tom Goodwin:

Uber, la più grande compagnia di taxi del mondo, non possiede auto. Facebook, il proprietario di media più importante al mondo, non crea contenuti. Alibaba, il rivenditore con più volumi di vendita, non ha un magazzino. E Airbnb, il più grande fornitore di alloggi al mondo, non possiede immobili.

Una narrazione tanto intrigante quanto imprecisa, come tutte le narrazioni che scelgono di raccontare solo una versione dei fatti, quella più efficace per nascondere una parte della realtà (anche per questo viene definita framing) e per suggerire altro. In questo caso quello che viene suggerito è una certa immaterialità e leggerezza, spesso associata alla fine del lavoro necessario per produrre profitti, confrontando i numeri dei dipendenti di Instagram con quelli della Ford, per dirne una. Anche per l’AI si tende a enfatizzare il deep learning di macchine che imparano a imparare e a mettere sullo sfondo il lavoro dei correttori umani (AI trainer), un lavoro intensivo e sempre più raffinato che può prendere diverse forme:

  • machine learning training (addestramento di modelli di apprendimento automatico);
  • data labeling (etichettare i dati per addestrare l’AI);
  • AI fine-tuning (perfezionare un modello già esistente);
  • prompt engineering (interazione tra AI e persone tramite prompt ottimizzati);
  • AI alignment (etica e comportamento dell’AI).

Un intenso lavoro umano, a vari livelli di difficoltà e di competenza, di persone molto più colte e specializzate (e ben pagate) di quanto normalmente si pensi (prova a proporti come trainer a una delle tante società che li cercano disperatamente). Un lavoro durato decenni, letteralmente, come fotografato dalla risposta di uno degli assistenti di Fei-Fei Li, la ricercatrice che ha insegnato ai computer a vedere:

”Sono io, Jia, o sembra tutto un tantino… lento?”
“Sì, avevo paura che succedesse. In effetti ho cronometrato per qualche minuto il loro ritmo di lavoro e ho fatto qualche estrapolazione.”
Oh, oh.
“Al ritmo a cui stiamo procedendo, possiamo aspettarci che ImageNet sia completa tra…”
Ho deglutito con forza e lui se n’è accorto.
“Sì: diciannove anni, più o meno. Fei-Fei, credo in questo progetto, ci credo davvero, ma non posso aspettare così tanto per il mio PhD.”

Era il mondo prima delle reti neurali, o meglio, prima che si capisse come usarle:

“Ok, allora… abbiamo riesaminato i risultati di quest’anno, e uno è proprio… cioè…”. Esitava.
“Cioè? Com’è?”
“Va bene. Allora, per prima cosa, usa un algoritmo davvero poco ortodosso. È una rete neurale, se riesci a crederci.”
Ho rizzato le antenne ancora di più. Se un momento prima non aveva avuto tutta la mia attenzione, adesso l’aveva sicuramente.
“È… antico.”
Non ho potuto fare a meno di ridere. Uno studente del Ventunesimo secolo che usa il termine “antico” per descrivere un lavoro di una ventina d’anni prima era la dimostrazione di quanto fosse giovane il nostro settore. (Ma poteva anche essere la dimostrazione che io stavo invecchiando. Ho deciso di ignorare quella eventualità). Ma non si sbagliava. Il nostro mondo si era evoluto velocemente e negli anni Dieci la maggior parte di noi considerava la rete neurale – quella serie di unità decisionali interconnesse organizzate in una gerarchia di ispirazione biologica – un oggetto polveroso, racchiuso in una teca e protetto da cordoni di velluto.
“Davvero? Una rete neurale?”
“Sì. Ma c’è di più. Fei-Fei, non crederai a quanto funziona bene.”

Un mondo di impegno, di sforzi e di passione che arriva da molto lontano, geograficamente, culturalmente e nel tempo. Forse oggi i genitori di Fei-Fei Li non potrebbero emigrare negli Stati Uniti, forse Joe Sabella, l’insegnante italoamericano che l’ha aiutata a studiare quando lei non conosceva l’inglese, sarebbe più diffidente nei confronti di una bambina di un altro colore: in questo caso chi avrebbe avuto la tigna, il talento e la passione per insegnare ai computer a vedere? E se Geoffrey Hinton non fosse stato così sicuro dell’importanza delle reti neurali, il software antico che finora non era servito a niente, Fei-Fei Li sarebbe riuscita ad accelerare il training, o ci sarebbero davvero voluti 19 anni di lavoro manuale di osservazione, catalogazione e controllo? La storia delle AI non inizia con OpenAI, anche se la stragrande maggioranza delle persone ci hanno fatto caso quando un software ha imparato a scrivere. E non finisce con il software, perché la narrazione di Goodwin di aziende leggere, immateriali, impalpabili si scontra con la fisicità energivora dei dataset che permettono a questo mondo di funzionare, dei cavi sottomarini che trasportano bit immateriali, della quantità e della dedizione delle persone che fanno funzionare quelli che Alessandro Aresu in Geopolitica dell’intelligenza artificiale chiama mulini satanici, quelli evocati dal poeta inglese William Blake in Milton.

Lasciamo la parola a lui – Aresu, non Milton – per descrivere il lavoro tutt’altro che immateriale e smart che permette alle AI (predittive e generative) di funzionare:

Chi sono allora le menti e le mani ben addestrate che dominano e fanno progredire incessantemente la tecnica? Morris lo svela sempre nello stesso incontro (al MIT), raccontando gli spazi di Taiwan che ospitano le fabbriche, collegati da treni ad alta velocità, dove si muovono gli ingegneri, i tecnici, gli operatori. Mentre sono qui a parlare con voi, élite del MIT – ammonisce Morris –, loro si stanno muovendo. Se volete gli smartphone, se volete le armi, se volete i data center, se volete i proiettori e le lavatrici, devono muoversi sempre. Riuscite a sentire i loro passi, il loro respiro? I tecnici partono dalla loro città di residenza e TSMC fa in modo che vivano durante la settimana in appositi dormitori per essere più produttivi, perché non venga sottratto il prezioso tempo in cui possono essere vigili. Il lunedì mattina – dice Morris – prendono il treno rapido, per vivere nei dormitori durante la settimana e tornare il venerdì pomeriggio. Sempre che qualcosa non si rompa, perché devono esserci sempre manutentori, occhi e mani a disposizione. È il sistema operativo, la piattaforma che fa respirare il mondo, che produce nuovi pezzi di realtà.

Continua il racconto di Morris:

Se a Taiwan un ingegnere riceve una chiamata mentre dorme, si sveglierà e inizierà a vestirsi. Sua moglie gli chiederà: Qual è il problema?. Lui risponderà: Devo andare in fabbrica. La moglie tornerà a dormire senza fiatare. E questa è la cultura del lavoro.

Un’altra realtà che non vediamo quando crediamo alla narrazione delle aziende leggere e smaterializzate è questa: la totale dedizione al lavoro di quelli che potrebbero diventare i nuovi padroni del mondo, a Oriente. Una dedizione molto simile a quella dei Mechanical di Silo, una trilogia di fantascienza trasformata in serie TV da Apple: l’umanità è costretta a vivere sottoterra da una catastrofe ignota e tenuta segreta da un Patto che punisce il possesso di reliquie che ricordano il mondo di prima, visibile solo da una grande finestra panoramica (forse). Più sottoterra di tutti vivono quelli che devono far funzionare il motore che permette agli abitanti del Silo di vivere, i Meccanici, finché uno di loro non sale ai piani alti, diventando Sceriffo, al servizio non della politica ma dell’IT, che mantiene il potere gestendo il sapere e le informazioni. Chi sopravviverà a una catastrofe, noi umanisti/scienziati convinti di manipolare solo dati e informazioni o i piedi nei tempi antichi che nella notte vanno a riavviare le macchine? E se i data center sottomarini, come pare possibile, si moltiplicheranno, dove saranno i nostri dati? Sotto quale giurisdizione? Chi si sveglierà di notte per riavviare le macchine se una nuova guerra fredda taglierà fuori l’Oriente?

Perché consumano così tanta energia

Torniamo al racconto di Fei-Fei Li, perché quello che le succede nel 2012 ricorda da vicino quello che sta succedendo in questi mesi.

In un ennesimo scherzo del destino, lo stile di calcolo preferito dalle reti neurali è simile sotto il profilo funzionale alla tipologia usata nel rendering grafico dei videogiochi, un’industria da miliardi di dollari che era stata il motore dell’avanzamento e della commercializzazione di hardware personalizzato dagli anni Novanta e aveva alimentato la crescita di megabrand come Nvidia, l’azienda leader del settore. Nel 2012, questo hardware – processori specializzati noti come unità di elaborazione grafica (graphic processing unit o GPU) – era diventato accessibile ai consumatori. Per il laboratorio di Hinton questo significava che il silicio necessario per far funzionare AlexNet non era più un investimento che richiedeva un finanziamento del governo e permessi di costruzione. Era disponibile a scaffale nei negozi di elettronica.

Il Morris di cui Aresu cita il discorso al MIT è Morris Chang, un miliardario di Taiwan, naturalizzato americano. È il fondatore di TSMC, che progetta e produce semiconduttori. Insieme a Jensen Huang, anche lui di Taiwan, anche lui naturalizzato americano e fondatore di Nvidia, domina (a dir poco) la parte hardware di tutto quello che richiede potenza di calcolo (e centrali nucleari). Insieme a loro pochi altri produttori rendono possibile la tecnologia così come la conosciamo. Senza GPU, passare dal potenziare il rendering grafico al permettere il calcolo parallelo delle AI generative, non c’è gioco. O videogioco, da sempre, nella storia della tecnologia, il grande motore dell’innovazione (insieme al porno e alla guerra, ovviamente).

Cos’hanno in comune un missile e un computer? L’interesse militare per una nuova tecnologia è stato spesso cruciale per superare quelle che altrimenti sarebbero state barriere economiche invalicabili al suo sviluppo e alla sua adozione, così come gli interessi e le preoccupazioni politiche e militari hanno spesso plasmato lo sviluppo e alcuni particolari progettuali delle nuove tecnologie.

Fei-Fei Li. Chang. Huang. Capisci perché meravigliarsi dell’intelligenza asiatica nello sviluppo tecnologico è quantomeno bizzarro? Bastava fare un giro nei campus americani negli ultimi decenni, invece di scambiare lo stupore cinese per la vittoria di AlphaGo per ingenuità e ritardo tecnologico.

Nel 2012 GPU e reti neurali sono la soluzione ai problemi della ricerca scientifica, prima ancora che della sua applicazione.

Da allora la scaling law applicata all’intelligenza artificiale regna sovrana: più potenza, più dati, più energia = migliori risultati (e viceversa: minore potenza, meno dati, meno energia = peggiori risultati). È una questione di gettoni, non quelli telefonici, ma i token diventati unità di misura del lavoro delle AI perché il loro numero è proporzionale alla quantità di calcoli che l’AI deve effettuare per svolgere un determinato compito, come tradurre un testo, rispondere a una domanda o scrivere un articolo.

E poi arrivò DeepSeek

Dalla Cina arriva DeepSeek, una nuova AI open source che spariglia lo scacchiere delle intelligenze artificiali, lancia la sfida alle aziende statunitensi e ci costringe a rimettere in discussione quello che credevamo di sapere.

A seconda dei modelli linguistici un token può essere una parola o parte di una parola; nella generazione di immagini corrisponde a un pixel o a un blocco di pixel e nelle criptovalute un asset digitale creato e gestito su una blockchain (da cui, per esempio, NFT, not fungible token). Qualunque sia il contesto, il gettone ci aiuta a capire, metaforicamente e concretamente, che ogni azione svolta da un’AI costa ed è cara, anche quando il modello è gratuito o libero. Almeno era quello che pensavamo fino a che DeepSeek ha dichiarato di aver fatto molto con poco.

Intendiamoci, l’energia consumata è ancora elevata, lo era anche prima delle AI. Quello che è cambiato è che all’improvviso applicare una proporzione matematica in modo deterministico all’intelligenza (seppur artificiale) non sembra più un’idea indiscutibile. D’altra parte, in teoria, sappiamo che questo vale anche per l’intelligenza umana: il valore del risultato non è direttamente proporzionale alla fatica fatta. In teoria un’ottima notizia, in pratica, come abbiamo visto dalle reazioni, non per tutti.

Questo articolo richiama contenuti da E poi arrivò DeepSeek.

Immagine originale di Solen Feyissa su Unsplash.

L'autore

  • Mafe De Baggis
    Mafe de Baggis, pubblicitaria, scrittrice ed esperta di media digitali, da trent’anni studia il modo migliore per usarli senza lasciarsi sopraffare. Lavora come consulente di comunicazione per aziende piccole e grandi, per liberarne le energie e aiutarle a raccontarsi in modo più consapevole. Già autrice di #Luminol (Hoepli, 2018) e di Libera il futuro (Enrico Damiani Editore, 2020).
  • Alberto Puliafito
    Alberto Puliafito, giornalista, regista, produttore, analista dei media, direttore di Slow News. Con una formazione in ingegneria biomedica, oggi si occupa di comunicazione interculturale e lavora all'intersezione fra tecnologia, informazione e media digitali. Ha scritto, insieme a Daniele Nalbone, Slow Journalism (Fandango Libri, 2019). Per Internazionale cura la newsletter "Artificiale".

Iscriviti alla newsletter

Novità, promozioni e approfondimenti per imparare sempre qualcosa di nuovo

Gli argomenti che mi interessano:
Iscrivendomi dichiaro di aver preso visione dell’Informativa fornita ai sensi dell'art. 13 e 14 del Regolamento Europeo EU 679/2016.

Libri che potrebbero interessarti

Tutti i libri

E poi arrivò DeepSeek

Dalla Cina in open source: l’AI che ha cambiato le regole del gioco

18,00

24,99€ -28%

14,25

15,00€ -5%

9,99

di Mafe De Baggis, Alberto Puliafito