Cose da sapere sui nostri assistenti digitali per sfruttarli al massimo
- Di che cosa parliamo quando parliamo di macchine che creano
- Qual è stata la più famosa chat a sembrare quasi umana prima di ChatGPT
- Che cos’è la cultura del remix e che cosa c’entrano gli assistenti digitali
- Che cosa si può fare con ChatGPT
- Come stanno le cose con il copyright a prescindere dagli assistenti digitali
1. Di che cosa parliamo quando parliamo di macchine che creano
Le intelligenze aliene sono capaci di creare da zero immagini, video, musica, audio, coreografie e movimenti.
È lecito, quindi, immaginarle incorporate – in robot? In stampanti 3D? In altri tipi di macchine o oggetti? – e in grado di creare anche oggetti materici, che potremo toccare e usare. E magari accadrà prima di quanto si pensi.
Siamo in difficoltà a delimitare un campo d’azione.
Allo stesso tempo, ogni volta che si immagina l’intelligenza artificiale in azione in un settore, i paradigmi di quel settore sembrano perdere senso. O forse acquisirne altro. In particolare, se consideriamo le intelligenze artificiali generative, si sgretola pian piano l’idea antropocentrica legata alla creatività stessa: in altre parole, l’approccio a queste macchine ci costringe a rivedere quanto che abbiamo sempre pensato della creatività, se l’abbiamo ritenuta un attributo esclusivamente umano.
È vero: qualcuno dirà che non creano da zero. Hanno imparato da milioni di immagini create da persone, tanto per cominciare. È proprio su questo punto, sulle immagini che sono state utilizzate per addestrarle, che, per semplificare, si fondano le ragioni di chi – con un po’ di ossessione tutta capitalistica – pensa che il problema principale sia la violazione del copyright. Più o meno funziona così: La macchina ha imparato vedendo i miei disegni/ascoltando la mia musica. Voglio avere dei soldi per questo.
L’approccio potrebbe anche sembrare sensato a una prima analisi: se creiamo qualcosa, vogliamo ricevere il giusto compenso e non troviamo corretto che qualcun altro monetizzi alle nostre spalle. È senz’altro anche un approccio contro le economie estrattive: non vogliamo che una grande azienda della Silicon Valley possa estrarre valore dal nostro lavoro senza che ne riceviamo qualcosa in cambio. Ma paradossalmente ha anche tutti i limiti delle economie estrattive. È ottocentesco – nella migliore delle ipotesi, novecentesco – perché è un approccio che mette recinti alla creatività e alle idee. E non è un approccio risolutivo: come ci insegna la storia recente, le grandi aziende che saranno in grado di fare grandi accordi quadro, si potranno permettere di addestrare le loro intelligenze artificiali con enormi quantità di contenuti. A qualche artista arriveranno molti soldi. Un insieme di creatori di contenuti di ogni formato ci camperà più o meno bene. Tutti gli altri avranno le briciole.
Leggi anche: Una AI che cambia il nostro modo di pensare
In generale, l’approccio di chiusura rispetto alle idee e ai diritti non fa i conti con il mondo che ci è cambiato sotto i piedi – o forse, che è sempre stato diverso da come lo ha raccontato la narrazione dominante. Da tempo, se solo vogliamo vederli, abbiamo a disposizione una serie di segnali e di conoscenze che risuonano coerenti: ci suggeriscono che tutto quel che pensiamo di sapere della storia dell’umanità è una visione parziale. È una storia eurocentrica prima e americanocentrica poi. È una storia sempre e comunque maschiocentrica e condizionata dalle modalità con cui viene gestito e mantenuto il potere. Non è l’unico modo in cui potevano andare le cose e spesso non è neanche il modo in cui sono davvero andate.
Passata la prima fase di stupore e, a seguire, quella di inquietudine, c’è, naturalmente, la fase della comprensione dei rischi. Abbiamo già conosciuto il problema dei deepfake e della necessità di affrontarli con metodo e tecnologie apposite. Forse occorre rassegnarsi al fatto che esisteranno sempre, da qui in poi. Crearli sarà sempre più facile e sempre meno costoso e diventerà impossibile distinguere da quelli reali non solo le sintografie, ma anche i video sintetici con personaggi noti o meno noti o del tutto anonimi. Poi c’è la fase di individuazione di eventuali limiti di questa creatività, sapendo che presto verranno superati e che è già arrivato il momento di cercare vie diverse che non siano né quelle tragicamente apocalittiche né quelle fanatiche, integrate e acritiche.
2. Qual è stata la più famosa chat a sembrare quasi umana prima di ChatGPT
Quando ho visto in azione ChatGPT per la prima volta, non ho potuto fare a meno di pensare a ELIZA. Nella prima occasione in cui ho visto funzionare ELIZA avevo, se ricordo bene, otto anni: erano gli anni Ottanta del secolo scorso e il software era in giro da almeno una ventina. Girava sul mio Commodore 64 ed era un programma che, proprio come ChatGPT, ti dava la sensazione di parlare con qualcuno. Si diceva in giro che ELIZA fosse stata scambiata più volte per un essere umano: ci credevo poco allora e ci credo poco anche adesso.
D’altra parte, quando si ha a che fare con i media e la tecnologia, è tradizione consolidata trattare e raccontare il pubblico come se fosse sempre un soggetto passivo o poco capace e altrettanto poco competente, oltre a ingigantire certi fenomeni.
Anche oggi, se vuoi, puoi utilizzare dei simulatori di ELIZA per renderti conto del suo funzionamento e di quanto fosse semplice. In un dialogo che ho sostenuto con il simulatore si può intuire cosa ci sia alla base del software. Il suo creatore, Joseph Weizenbaum, lo presentò come un programma per lo studio del linguaggio naturale di comunicazione tra uomo e macchina.
Con grande turbamento di Weizenbaum, alle persone piaceva parlare con ELIZA, programmata per rispondere simulando il comportamento di uno psicologo della scuola rogersiana. ELIZA era, però, totalmente incapace di generare una conversazione davvero sofisticata. Si basava su un meccanismo di riconoscimento di alcune parole-chiave che facevano partire risposte preconfezionate e, in generale, tentava sempre di offrire una domanda successiva alla risposta di chi dialogava con lei. Le frasi inserite come input – quelli che oggi chiamiamo prompt – venivano analizzate da ELIZA sulla base di una serie di regole che disassemblavano la frase stessa. Le regole venivano innescate dalla presenza di specifiche parole-chiave. Le risposte venivano poi generate da regole di riassemblamento delle parole-chiave per creare frasi nuove.
I problemi tecnici di ELIZA erano:
- l’identificazione delle parole chiave;
- la scoperta del contesto;
- la scelta di trasformazioni appropriate (per arrivare poi alla generazione di una risposta pertinente);
- la generazione di una risposta in assenza di parole-chiave riconoscibili;
- il montaggio di risposte a partire da alcuni pattern preconfigurati.
Nonostante fosse molto rudimentale – e pensata, ironicamente, per dimostrare l’assurdità del dialogo con una macchina – ELIZA è stata l’inizio di una serie di lavori che hanno portato allo sviluppo dei chatbot conversazionali che abbiamo iniziato a conoscere e che sono diventati virali.
Oggi siamo di fronte a macchine che, come ChatGPT, producono testi e conversazioni del tutto paragonabili a quelle che possiamo avere con un essere umano in chat. Ed è lecito immaginare che sia solo l’inizio: mentre leggi questa pagina, lo scenario si sarà già evoluto.
3. Che cos’è la cultura del remix e che cosa c’entrano gli assistenti digitali
Nel 1996 ero una studentessa di Scienze della Comunicazione a Torino e per l’esame di Storia della letteratura italiana moderna e contemporanea portai una tesina dal titolo Essere e apparire nella polis virtuale, che prendeva spunto dai personaggi in cerca d’autore di Pirandello per indagare la possibilità di esplorare personalità alternative offerte dalla rete. Il professor Mario Ricciardi ci insegnava a vedere la letteratura come una tecnologia e, per la prima volta, sentivo parlare non solo di ipertesti e di informatica umanistica, ma anche di decostruzione, di post-strutturalismo e della morte dell’autore. Un professore lungimirante – uno dei tanti che ho avuto la fortuna di incontrare – ma anche lui, nel veder associati nella mia tesina Pirandello e l’attivista punk Helena Velena, mi disse: Certo che voi ragazzi avete una facilità di associare alto e basso che persino io faccio fatica.
Proprio questa fatica è il cuore di molte resistenze al riuso, al remix, alla ricombinazione, al sampling, al mashup o, per usare un termine più classico, al collage: perché Marracash cita l’Ambra di Non è la RAI? Un gonfiabile, una ragnatela, pulire ossa di animali morti o tagli nella tela sono davvero arte? Perché non ci sono più idee nuove e quando ci sono le cantiamo con l’autotune? Sotto l’accusa di pigrizia, furto e morte della creatività fatta a moltissimi artisti contemporanei – e anche a molta industria editoriale – c’è questa resistenza qui. C’è ancora l’idea, fortissima, che qualcuno debba scegliere chi entra nei salotti buoni e nei musei e chi deve farsi il suo salone dei rifiutati e che mescolare questi mondi sia una cosa sbagliatissima, pericolosissima, da non fare mai. Vale anche per l’università, dove le cattedre sono spesso riservate a chi non si sporca le mani con la tastiera e con la divulgazione.
Sempre al professor Ricciardi devo la nozione di intertestualità, che si tratti di note a piè di pagina oppure di link o anche di pensieri derivati.
Ecco, la remix culture è intertestualità esplicita, visibile, ostentata: non possiamo approfondire qui la bellezza e l’importanza del ricombinare esplicitamente le nostre fonti, ma per noi è centrale riguardo alla comprensione del futuro delle intelligenze artificiali che vorremmo. Se vuoi approfondire, ti consigliamo alla lettura di uno dei testi più interessanti in merito, Of Remixology di David Gunkel.
In Of Remixology, Gunkel non solo fornisce un nuovo modo di comprendere il remix, ma offre anche una teoria innovativa del valore morale ed estetico per il Ventunesimo secolo. Se tutto ciò che è stato raccolto sotto il nome di linguaggio negli ultimi duemila anni viene trasferito al concetto generale di scrittura negli ultimi decenni del Ventesimo secolo, allora forse si può dire che ora, all’inizio del Ventunesimo secolo, tutto ciò che era stato raccolto e circoscritto dal concetto di scrittura può ora essere trasferito e riassunto sotto il nome di remix.
Se ti sembra esagerato, non pensare all’hip hop o a Banksy, pensa all’opera di Omero o di Shakespeare. Lo studiamo a scuola: l’Iliade e l’Odissea nascono come opere orali, raccontate di corte in corte, di piazza in piazza, per poi essere – forse – sistematizzate da un poeta cieco. L’autore nasce dopo l’opera ed entra in scena perché mette per iscritto opere orali. Lo evoca Nicola Lagioia nel primo episodio del podcast Fare un fuoco.
Oggi abbiamo macchine che ci permettono di mixare tutta la cultura di qualsiasi tempo e di riutilizzarla partendo da una nostra domanda. Un processo non privo di problemi, rischi e prepotenze, ma per reindirizzarlo dobbiamo partire da qui, dalla consapevolezza che non esiste autore o artista o scienziato senza il lavoro di tutti quelli che sono venuti prima.
4. Che cosa si può fare con ChatGPT
A costo di essere pedanti, bisogna ricordare che questo è un mondo in evoluzione costante: alcune delle cose che scriviamo potrebbero essere superate dai fatti. Per questo abbiamo bisogno, prima di tutto, del metodo.
La prima regola di ChatGPT – e di macchine analoghe – è: non pubblicare mai un testo generato da ChatGPT che tu non abbia verificato e revisionato. Questo perché le macchine generative sono pur sempre intelligenze aliene:
- non hanno la comprensione del mondo che desideriamo offrire come esseri umani;
- non lavorano per verificare quel che scrivono;
- non sanno quel che sappiamo noi;
- potremmo anche aver dato loro un comando sbagliato.
Sono macchine, insomma, che richiedono sempre una revisione. In quanto nostri assistenti digitali, non dobbiamo considerarle come generatori indipendenti di testo (né di altri output).
ChatGPT può essere di grandissimo aiuto per superare il famigerato blocco della pagina bianca, può generare per te suggerimenti di frasi o paragrafi, può supportarti nel continuare un testo quando ti blocchi. Può essere un utile strumento per trovare o sviluppare idee, fare brainstorming e costruire la struttura di trame per racconti o romanzi, oppure scalette e mappe mentali per testi brevi o lunghi, per slide, per eventi o percorsi di formazione. È una macchina in grado di tradurre testi e anche di sintetizzarli direttamente in un’altra lingua. È un grande democratizzatore perché, oltre ad aiutare chi sa scrivere, è d’aiuto a chi fa fatica a farlo. Può essere utilizzato per raccogliere informazioni su un argomento specifico, meglio se strutturato, rispondendo a domande o generando riassunti di testi complessi. Può funzionare come tutor virtuale, rispondendo a domande degli studenti, generando quiz o aiutando a spiegare in maniera più accessibile concetti complicati. Analizza i testi e individua gli stati d’animo espressi, le entità (persone, aziende, località o simili) nominate, i punti di forza e le carenze di quei testi.
Qui c’è un elenco di quel che abbiamo visto fare o di ciò per cui abbiamo usato in prima persona ChatGPT fino a ora:
- riassunti;
- sommari;
- elenchi puntati;
- diverse versioni ridotte di un testo;
- brainstorming generali, scalette, mappe mentali, generazione di idee;
- brainstorming per creazione di titoli;
- creazione di bozze di testi per compilare campi SEO;
- analisi di testo;
- revisione di testo;
- individuazione di refusi o errori grammaticali;
- individuazione di eventuali salti logici in un testo;
- individuazione di eventuali punti deboli, mancanze o vere e proprie lacune in un testo;
- schematizzazione e individuazione di parole-chiave e temi presenti in un testo;
- individuazione di entità di un testo – per esempio, le risposte alle 5W: chi, che cosa, dove, quando, perché; oppure l’estrazione di tutte le email nominate in un testo o di tutti i nomi/cognomi di persone, di tutti i luoghi, di tutte le aziende;
- sentiment analysis;
- generazione di bozze;
- generazione di differenti versioni di elementi di disseminazione di un testo – per esempio, thread su Twitter, post su Facebook, caption per Instagram o YouTube;
- simulazione di determinati toni di voce;
- compilazione di moduli che richiedono di inserire voci in maniera standard;
- creazione di bozze per slide;
- traduzioni o comprensione di testo in lingue note e meno note;
- scrittura di bozze per email o lettere;
- scrittura di codice;
- sviluppo di FAQ o documentazione;
- assistenza nella generazione di idee per il marketing;
- assistenza nella generazione di idee per promuovere un prodotto;
- assistenza nella generazione di piani editoriali (con tanto di titoli, titoli di paragrafo, meta-descrizioni e titoli SEO);
- individuazione di parole chiave collegate a un medesimo concetto;
- assistenza nella creazione di indici e glossari;
- assistenza nella creazione di mappe;
- creazione di formule Excel;
- spiegazione di righe di codice o di formule Excel;
- spiegazione di dati;
- creazione di quiz per autovalutazione – per esempio, se vuoi prepararti a un esame o testare la tua conoscenza su un certo argomento;
- ricette o, più in generale, elenchi di cose da fare per rendere un determinato compito schematizzabile;
- fare analisi SWOT.
Probabilmente questa lista andrà prolungata e le applicazioni pratiche delle macchine generative di testo assorbiranno, prima o poi, tutte le possibili funzioni di quel che già facciamo con il testo. Le vedremo – o le vediamo già – integrate un po’ ovunque, ed è lecito aspettarsi che le interfacce conversazionali presto usciranno dal look della chat per trovarsi in luoghi dove l’interazione mediante testi (scritti o orali) può essere facilmente automatizzata.
5. Come stanno le cose con il copyright a prescindere dagli assistenti digitali
Il copyright, in italiano diritto d’autore, letteralmente indica il diritto di copia, legato com’è alla nascita e alla diffusione di tecnologie che permettevano la produzione veloce ed economica di copie identiche di un’opera. Prima della stampa o, per citare Walter Benjamin, prima dell’Era della riproducibilità tecnica delle opere d’arte, ogni copia richiedeva un lavoro manuale, con errori e variazioni piccole e grandi. Gli artisti erano dei professionisti pagati a commissione o mantenuti da mecenati, molto più simili a un pubblicitario o a un architetto che a un poeta o a un pittore. La legge in questione è, quindi, figlia di una tecnologia (la stampa) che si cerca, a martellate, di usare per una tecnologia completamente diversa (i bit).
Negli ultimi anni le multinazionali dell’editoria e dell’intrattenimento hanno combattuto – e vinto – diverse battaglie per mantenere il copyright così com’è o anche per appesantirlo, come successo, per esempio, nel prolungamento della durata dei diritti d’autore, passati a settant’anni. Questo nonostante un cambiamento tecnologico, economico e industriale decisamente non di poco conto: il costo della copia è sceso tantissimo, in alcuni casi sfiora i pochi centesimi, se non lo zero. Una copia dell’edizione cartacea di un libro, infatti, ha un costo, quella di un’ebook quasi nessuno. Spedire in tutto il mondo le pizze di un film era dispendioso e limitato, un investimento in sé, come la tiratura di un libro, mentre proiettare una copia digitale dello stesso film ha un costo marginale che sfiora i pochi centesimi.
Ovviamente, ogni opera deve continuare a produrre reddito e riconoscimenti per l’autore, ma troppo spesso ormai questo va a vantaggio solo di un piccolo numero di persone famose – e delle multinazionali dell’intrattenimento –, mentre tutti gli altri guadagnano poco o niente.
Vorremmo proporti – anche dati alla mano, non soltanto a partire da posizioni personali – un’idea diversa di mondo. Sia chiaro: anche noi pensiamo che chi crea dovrebbe essere tutelato. Che non sia ammissibile che siano le grandi aziende a estrarre il massimo valore dall’arte, dalla creazione, persino dal giornalismo. Ma il copyright non tutela gli artisti indipendenti. Mette un recinto. Forse ti dà un minimo di potere contrattuale se sai come muoverti, se hai un agente, un avvocato, se hai una posizione da difendere, se hai già un tuo pubblico, una tua notorietà o se hai saputo costruirtela accettando le regole del gioco.
L’esistenza del copyright di per sé non è garanzia del fatto che l’artista, chi crea contenuti, riceva un giusto compenso.
Basta guardare i dati di Spotify per rendersene conto. Spotify paga 0,004 dollari – e saranno sempre meno – a stream, quindi per arrivare a 4.000 dollari di pagamento lordo occorre avere una canzone che abbia fatto almeno un milione di stream: solo lo 0,2 percento degli otto milioni di artisti su Spotify fa più di 50.000 dollari lordi l’anno. Vuol dire che sedicimila artisti (persone singole, gruppi) nel mondo, più o meno, hanno quel compenso per il loro lavoro. Nel frattempo, Spotify ricava 11,2 miliardi di dollari all’anno, è in lieve perdita e il suo CEO e co-founder, Daniel Ek, ha un patrimonio personale netto stimato in 2,7 miliardi di dollari. Potrà anche sembrare una semplificazione, ma un’occhiata a questi meccanismi serve a individuare tutti quei posti in cui si replicano le disuguaglianze anziché abbattere le barriere.
Oltre che per gli artisti e gli autori emergenti o con minore capacità contrattuale, il copyright è spesso un ostacolo anche per noi fruitori e per la cultura in circolazione. Trovare vecchi libri fuori commercio, per esempio, può essere un’impresa impossibile o costosissima. Gabriele Gargantini sul Post scrive:
Si potrebbe pensare che proiettare vecchi film sia semplice ed economico, ma in realtà può essere complicato e costoso, spesso per questioni di diritti: a volte può essere un’impresa anche solo trovare chi li detiene. […] Alessandro Rossi (regista, produttore e professore di cinema) dice che questa ricerca comporta spesso un lavoro certosino perché i diritti necessari per proiettare (anche gratuitamente) vecchi film nei cinema passano spesso da una società all’altra, o anche ai privati. Può inoltre capitare che i diritti di certi vecchi film siano spacchettati e che quelli per la distribuzione nei cinema finiscano chissà dove.
Questo articolo richiama contenuti da In principio era ChatGPT.
Immagine di apertura di Google DeepMind su Unsplash.