Valeria Girardi

Translator

Localization Expert

Communication Specialist

Journalist

Valeria Girardi

Translator

Localization Expert

Communication Specialist

Journalist

Blog Post

ChatGPT, una riflessione sulla nuova frontiera dell’AI

9 Febbraio 2023 Article, Editorial
ChatGPT, una riflessione sulla nuova frontiera dell’AI
Reading time: 18 min

Prima di lasciarvi alla lettura di queste mie considerazioni (ancora un po’ confuse, a dire il vero) sulla AI, ChatGPT e i text generator in generale, vorrei mettere le mani avanti, e premettere che questo articolo potrebbe contenere idee e punti di vista sui quali potrei tornare più in là – magari con un altro articolo di approfondimento, o un aggiornamento con cui rettifico quanto scritto finora. Inoltre, voglio sottolineare che si tratta puramente di considerazioni personali – non me ne vogliano i fan esaltati dell’intelligenza artificiale.

Esposizione

Siamo abituati ad avere a che fare con le AI da diverso tempo ormai. I più “vecchi” ricorderanno le varie applicazioni anni ’90 o 2000, come Dr. Sbaitso o Doretta, la “ricercatrice quasi perfetta” di Microsoft. Ma senza andare così indietro negli anni, Siri, Alexa, Spotify, i correttori di testo, i sistemi di riconoscimento facciale e vocale dei nostri smartphone, sono tutti esempi di come l’intelligenza artificiale sia una componente affezionata delle nostra vita quotidiana. Questo vale, ovviamente, anche per chi lavora assiduamente con progetti di traduzione. In questo caso, per chi di lavoro si occupasse di altro, basti pensare anche a Google Translate o a YouTube, ad esempio. Nel primo caso, il traduttore automatico di Google si basa su un sistema di “traduzione automatica neurale” (NMT), in grado di analizzare e tradurre testi molto velocemente da una lingua all’altra. Nel secondo caso, l’AI viene sfruttata per generare automaticamente i sottotitoli dei video caricati dagli utenti.

Ma, in tutta onestà: voi vi fidereste di una traduzione effettuata completamente ed esclusivamente da una o l’altra piattaforma? Il punto è che già solo Google Translate – e questo i clienti attenti lo sanno – non potrà mai sostituire il lavoro di un traduttore in carne e ossa. Per quanto i CAT tools e programmi di traduzione automatica possano in qualche modo agevolare il lavoro di un professionista, si tratta sempre e comunque di strumenti che necessitano della mano – e della testa – del loro artigiano.

Ma può dirsi lo stesso anche per la scrittura? Con quanto sta emergendo di recente, pare possa diventare presto possibile anche per i meno esperti del campo cimentarsi nella produzione di testi di vario genere: il tutto con un semplice click.

Esordio

Si tratta di un hot topic, quello delle AI, che è salito alla ribalta principalmente dopo il grandissimo exploit fatto dalle AI text to image. In questo senso, per chi non fosse avvezzo a questo tipo di tecnologie o non stia seguendo troppo da vicino la faccenda, si tratta di programmi che, dato un input testuale, sono in grado di produrre delle immagini, siano esse delle foto “realistiche”, o delle illustrazioni in digital art.

Ma come funzionano questo tipo di tecnologie? Lorenzo Ceccotti, in arte LRNZ, ne ha parlato ampiamente in un suo ultimo saggio (“Click to Imagine“). Un articolo in cui spiega, tra l’altro, come in buona sostanza le immagini che vengono prodotte dalle AI si presentano, in realtà, come una sorta di “collage raffazzonato” composto da “pezzetti” di varie foto e illustrazioni prese in giro per il web (a discapito dei permessi o dei copyright degli ignari autori) e “mescolate” tra loro. A volte producendo un risultato anche relativamente interessante, senza dubbio, ma altre volte offrendo delle immagini di dubbio successo – se non addirittura inquietanti.

foto by DALL·E AI text to image
(Entrambe le foto sono state realizzate con DALL·E)

«L’AI opera infatti all’interno di un sistema di referencing complesso che parte da opere e immagini preesistenti, che operano come “cultura” per l’intelligenza artificiale. Per quanto atomizzate nel processo di sintesi per diffusione, le Ai sono allenate su dei dataset, dei database di materiale visivo, e possono essere istruite sottoponendo ulteriori informazioni da parte degli utenti, siano esse ulteriori richieste di perfezionamento o immagini da usare come reference. In questo processo (training e perfezionamento) il materiale copyrighted o comunque flaggato come non utilizzabile a questi scopi non dovrebbe finirci in alcun modo; ma non è così che va, è pieno di immagini che hanno sorgenti coperte da copyright e centinaia di artisti vengono saccheggiati dalle AI senza alcun consenso degli autori o degli aventi diritto», spiega infatti Ceccotti nel suo lungo e dettagliatissimo articolo.

Dati tutti gli evidenti problemi in relazione all’autenticità delle immagini prodotte dalle AI, LRNZ ha anche per questo fatto partire un’importante campagna di sensibilizzazione, nonché raccolta fondi sul tema. Una campagna e una lotta, questa, che ha una risonanza internazionale, e che ha visto a San Francisco e a Londra le prime due denunce presentate contro alcune aziende sviluppatrici – accusate dagli artisti proprio di usare le loro immagini senza permesso per produrre delle rielaborazioni.

Peripezie

Ad ogni modo, per quanto il panorama della generazione di testi, la situazione è sì, diversa, ma non certo meno complessa. Anzitutto, è bene spiegare come funzionano tali tecnologie.

Un AI text generator è in buona sostanza un software che utilizza l’intelligenza artificiale per produrre contenuti scritti di vario tipo. Sfruttando delle avanzate tecniche di elaborazione del linguaggio naturale, è in grado di analizzare un corpus di dati testuali esistenti (tratti da libri, articoli o anche siti web) e generare un contenuto testuale nuovo. Grazie ai modelli inseriti nel database, il software può generare il nuovo testo prevedendo la parola, la frase successiva e così tutta una sequenza di parole coerenti per stile e per topic.

Tale processo di generazione del testo è avviato da un input testuale offerto dall’utente, un “seed” che il software può usare come rimando ai modelli sui quali è stato “addestrato”, e iniziare così a generare quanto richiesto. Partendo dal seed, il programma crea la parola o la frase successiva, quindi sfrutta questo stesso output per generare di nuovo la parola o la frase successiva, e così via. I paragrafi ottenuti saranno altamente coerenti e simili tra loro per stile e contenuto ai dati di addestramento.

Un sistema, questo, che per quei testi informativi, da social, o che siano comunque relativamente semplici e brevi, offre agli utenti dei risultati niente male. Vediamo insieme qualche esempio prodotto tramite ChatGPT:

“Un testo informativo è un tipo di testo che ha come scopo principale fornire informazioni o conoscenze su un argomento specifico. Questo tipo di testo è caratterizzato da un linguaggio preciso, oggettivo e spesso formale, e si basa su fatti verificati e fonti attendibili”.

Questo brevissimo testo, che spiega in maniera efficace che cos’è un testo informativo, è stato scritto completamente dall’AI text generator in questione. In alcun modo ho alterato o modifcato il risultato ottenuto dall’input che gli ho inviato. Ecco, poi, un altro esempio:

“La pace e la bellezza del mare sono sempre fonte di ispirazione per me 🌊🌞 Questa foto cattura l’essenza del mare, con le onde che si infrangono sulla spiaggia e l’orizzonte che si estende all’infinito. È il momento perfetto per rilassarsi, ricaricarsi e godersi la semplicità della vita 🌴 #beachlife #seaside #relaxation”.

Mica male per essere un’ipotetica didascalia da abbinare a una foto pubblicata su Instagram, vero? Da notare, inoltre, come il software sia stato istruito persino ad aggiungere i relativi hashtag ed emoji annesse. Insomma, sembra non manchi proprio niente.

Diverso, però, è il discorso se si prende in considerazione il tipo di testo narrativo, soprattutto quando si parla di Arte (letteraria nel nostro caso). Ecco quindi un altro esempio: dei prossimi che leggerete, uno è un passaggio tratto da un libro pubblicato da un noto autore, mentre l’altro è un testo scritto sempre tramite ChatGPT. Sapreste indicare quale sia l’uno e quale sia l’altro?

«Era una giornata calda d’estate quando l’uomo, un insegnante di un piccolo villaggio, decise di fare i bagagli e partire per la città. La sua casa, una piccola costruzione di legno, si ergeva solitaria in mezzo a un campo di granturco, circondata da alberi secolari e una vecchia siepe di rose. Gli abitanti del villaggio gli erano molto affezionati e lo salutavano con affetto ogni volta che incontravano. Lui era stato l’insegnante di molti di loro, e aveva visto crescere le loro famiglie. L’uomo si fermò un attimo sulla soglia della porta, guardando intorno. Era una scena familiare, ma sapeva che sarebbe stata l’ultima volta che l’avrebbe vista. Prese un respiro profondo e si avviò verso il carretto trainato da un vecchio cavallo, che aveva preparato per trasportare i bagagli. Era un carretto semplice, ma solido, con una vecchia coperta rossa che lo proteggeva dal sole».

«Il maestro di scuola stava per lasciare il villaggio, e tutti sembravano dispiaciuti. Essendo più che sufficiente per gli effetti che portava con sé, il mugnaio di Cresscombe gli aveva prestato il carretto con il telone bianco di farina, e il cavallo, per trasportare le sue cose alla città cui era diretto, distante una ventina di miglia da lì. Il suo alloggio presso la scuola, infatti, era stato arredato in parte dagli amministratori, e l’unico oggetto ingombrante di sua proprietà oltre alla cassa dei libri era un piccolo pianoforte verticale, da lui acquistato a un’asta l’anno in cui aveva pensato di imparare a suonare uno strumento. Svanito l’entusiasmo iniziale, non aveva mai raggiunto alcuna abilità con i tasti, e da allora l’acquisto era stato per lui fonte di continui fastidi durante i traslochi».

Ebbene, il primo è scritto dall’intelligenza artificiale, l’altro invece è stato scritto da Thomas Hardy, ed è l’incipit dell’edizione italiana di Jude l’Oscuro (1895). L’avreste mai detto? Un lettore attento probabilmente non farebbe fatica a distinguere i due testi. Saltano subito all’occhio, infatti, dettagli che sebbene non contengano errori di grammatica o sintassi, fanno sembrare la descrizione composta dalla AI strana, “stonata”: come se fosse stata scritta da un bambino incredibilmente dotato, o da un adulto con una capacità di linguaggio piuttosto scarna, essenziale. O questa, almeno, è l’impressione che mi provoca.

Del resto, se prendiamo brevemente in analisi il testo, vediamo come viene a mancare una “fluency” realmente italiana, che non suoni come un “calco” delle strutture inglesi. Del resto, buona parte delle frasi sono costruite secondo l’ordine classico SVO ed eventuale subordinata o proposizione relativa al seguito (anche se con virgole messe un po’ a caso). In un testo che dovrebbe raccontare una storia che interessi e tenga incollato il lettore, e che dovrebbe dunque dare anche una certa enfasi alle parole e all’ordine in cui queste vengono usate, le subordinate implicite farebbero non poco comodo (vedasi appunto “Svanito l’entusiasmo iniziale”, o “Essendo più che sufficiente”). Così come farebbe comodo evitare le ripetizioni, rendere implicito il soggetto quando più opportuno, e offrire un ventaglio più ricco di congiunzioni. Sfoggiare un linguaggio più “avanzato” (al di là delle collocazioni comuni, quali “alberi secolari” o “si ergeva solitaria”), inoltre, non guasterebbe proprio. E uno scrittore attento non si dimenticherebbe nemmeno di infondere un pizzico di stile personale che renda il testo meno asettico e magari anche più musicale (“Ma adesso vorrei sentire proprio la musica delle parole!” direbbe un certo Hans Landa). Tutte accortezze che, nemmeno a dirlo, nella versione italiana del Jude troviamo e apprezziamo.

(Art di Jorge Tabanera)

Stessa cosa vale anche per la poesia. Ho chiesto alla AI di scrivere una poesia sull’inverno – che fantasia, eh? – e questo è stato il risultato, proprio “buona la prima”.

«Sono le foglie che cadono
che segnano l’arrivo dell’inverno
il freddo si fa sentire

e il vento soffia forte.
La neve copre i campi
e il ghiaccio si forma sui laghi
ma nonostante tutto
l’inverno è una stagione magica.
Le luci della città
si riflettono sulla neve
e i bambini si divertono
a costruire pupazzi di neve.
E anche se l’inverno
può sembrare duro e freddo
è una stagione speciale
che ci offre un mondo di bellezza».

Anche in questo caso è possibile vedere come il software abbia usato delle parole semplici e usuali, con delle co-occorrenze piuttosto comuni in ambito letterario. Di nuovo troviamo il medesimo ordine SVO con brevi subordinate al seguito, soltanto “spezzato” da quella che sembra essere una divisione in versi direi poco ragionata. Oltre alle varie ripetizioni di “inverno”, il software ha sfruttato parole che semanticamente rientrano nel contesto di un quadro invernale, e che linguisticamente appaiono anche come delle collocazioni molto comuni (“le luci della città” ad esempio, che suppongo siano in qualche modo riferite all’immaginario del Natale nell’emisfero boreale).

(Grafico via Visual Thesaurus)

Ovviamente, non serve specificarlo, si tratta a prescindere di confronti impietosi. Accostare autori classici a dei testi generati in appena pochissimi secondi da un AI text generator non dà molta soddisfazione. Ma è bene però domandarsi e riflettere sul come potranno diventare tali tecnologie nel giro di un’altra manciata di anni- spoiler: probabilmente sempre più efficaci.

Conflitto

Alla luce di ciò, sono tante e disparate le sfumature con le quali tali tecnologie sono state (e stanno tuttora venendo) accolte dal pubblico. E per pubblico, attenzione, si intende non soltanto la fetta di webenauti o di appassionati di tecnologia: si parla anche di studiosi, ricercatori, massimi esperti di una scienza (quella linguistica) che su più fronti non si trova molto in linea con quanto decantato dai produttori di Ai text-generator.

Se si dovesse stilare un elenco delle più grandi sfide intellettuali affrontate dall’umanità, quella relativa alla “decodificazione” di noi stessi, del nostro linguaggio e di come funzionano la nostra mente e il nostro cervello, sarebbe sicuramente in cima. In tal senso, sono diversi i campi che hanno raccolto il guanto: dalla filosofia alla psicologia, dall’informatica e le neuroscienze alla linguistica.

Con l’AI (o meglio dire, con il suo “revival”) si tenta ancora una volta di dare una risposta ad alcuni quesiti: come funziona l’intelligenza? In che modo il cervello origina le nostre capacità cognitive? E tali capacità possono essere implementate all’interno di una macchina? Beh, le eventuali risposte sono ovviamente ben lontane da simili domande. E i tentativi che al momento la tecnologia sta spingendo verso questa direzione sembrano non convincere affatto Noam Chomsky.

Linguista e cognitivista, per Chomsky è improbabile che la “nuova intelligenza artificiale”, incentrata sull’uso di tecniche di apprendimento statistico per estrarre e prevedere in maniera più efficace e veloce i dati, fornisca principi generali sulla natura degli esseri intelligenti, sulla cognizione e la capacità di apprendere e produrre il linguaggio.

Chomsky ha riconosciuto che sì, l’approccio statistico potrebbe avere un effettivo valore pratico, proprio come un vastissimo motore di ricerca in grado di elaborare enormi dati in tempi rapidissimi. Tuttavia, dal punto di vista più scientificamente linguista, per l’esperto si tratta di una tecnologia inadeguata o, più duramente, un po’ superficiale. Non siamo ancora in grado di “insegnare” molto a un computer su cosa significhi veramente la frase “fisico Sir Isaac Newton”, anche nel caso in cui questo sia in capace di restituirci dei risultati sensati in merito.

Prese di posizione a parte, l’esperto solleva comunque punti interessanti sul funzionamento delle attuali AI. Senza mezzi termini, i software Ai text-generator copiano una serie di dati inseriti in un (vastissimo) database realizzato da noi. Un database che trova corpus e modelli di testo da articoli, libri, contenuti di vario tipo pubblicato per il web. Già da questa semplice analisi, nascono allora alcuni problemi relativi ai testi che questo tipo di programmi possono generare.

Anzitutto, i testi generati si basano (almeno per il momento) su informazioni e dati obsoleti, risalenti al 2021 nel caso di chatgpt. Alla luce di quanto è successo negli ultimi anni, potremmo persino rischiare di imbatterci in testi prodotti con contenuti discriminatori, o in generale non politically correct, così come anche del tutto fuorvianti. Peggio ancora, potrebbero persino produrre fake news.

Siccome non hanno coscienza del mondo reale, i software Ai text-generator possono generare testi come questo:

The Ten Hands of Shaolin is a set of traditional martial arts techniques that are said to have originated from the Shaolin Monastery in China. The techniques are designed to strengthen the body and improve martial arts skills. The ten techniques are:
1. Black Tiger Steals Heart: a hand technique that focuses on striking the opponent’s chest
2. Pluck Heart from Chest: a finger technique that targets vital points on the opponent’s body
3. Big Golden Wheel: a hand technique that uses circular movements to evade and strike the opponent
4. Snatch and Strike: a technique that involves quickly grabbing the opponent’s weapon and using it against them
5. Chop with Thousand Hands: a hand technique that involves rapid, consecutive strikes
6. Chop with Thousand Fists: a technique that involves using fists for consecutive strikes
7. Chop with Thousand Feet: a technique that involves using the feet for consecutive strikes
8. Chop with Thousand Elbows: a technique that involves using the elbows for consecutive strikes
9. Chop with Thousand Knees: a technique that involves using the knees for consecutive strikes
10. Chop with Thousand Heads: a technique that involves using the head for consecutive strikes It’s important to note that these names and techniques may vary depending on the source.”

(Seed: Tell me about the 10 hand sets of Shaolin)

O anche questo:

I sette re di Roma sono i leggendari fondatori e sovrani della città di Roma. La loro esistenza storica è molto discutibile, poiché la maggior parte delle fonti sui primi tempi di Roma sono mitiche e non storiche. Tuttavia, secondo la tradizione, i sette re di Roma sarebbero stati:
1. Romolo, il fondatore di Roma e il primo re della città.
2. Numa Pompilio, che sarebbe stato eletto come successore di Romolo e avrebbe introdotto le leggi sacre e religiose a Roma.
3. Tullo Ostilio, che avrebbe sconfitto i Sabini e fondato l’esercito romano.
4. Anco Marzio, che avrebbe costruito le prime fortificazioni intorno alla città di Roma
5. Tarquinio il Superbo, il cui regno è stato segnato dalla tirannide e dalla corruzione, e che sarebbe stato cacciato dai Romani nel 509 a.C.
6. Servio Tullio, che avrebbe introdotto le classi sociali a Roma e costruito il tempio di Giunone Moneta.
7. Tarquinio il Giovane, il figlio di Tarquinio il Superbo, che sarebbe stato cacciato insieme al padre dai Romani e che avrebbe portato alla fine della monarchia e all’inizio della Repubblica romana.

Si noti che la lista dei re può variare a seconda della fonte.”

(Seed: Chi sono i sette re di Roma?)

Il rischio è, però, che le persone che producono o si imbattono in certi testi possono credere a quanto riportato – in questo specifico caso, magari, giovanissimi alle prese con i compiti di scuola o perché no, chiunque sia interessato ma poco dotto sulla storia dell’antica Roma o sulle forme dello Shaolin. Del resto, i testi prodotti sono estremamente plausibili, rassomiglianti a un testo prodotto da una persona in carne e ossa.

Di fatto, però, quello su cui si basano tali software non è molto diverso dall’autocomplete di un telefono. Esattamente come avviene sul nostro iPhone, o su qualsiasi altro tipo di smartphone, tali programmi si basano sulla predizione delle parole e delle frasi successive: partendo da un “foglio” vuoto, accumulano statistiche, dati più statisticamente probabili e compatibili, e li compongono insieme – “you start with a blank state and you just accumulate statistics, direbbe Jeremy Kahn. Lo stesso che spiega, tra l’altro, come a differenza della Symbolic AI (comune fino agli anni ’90), l’attuale Artificial neural network sia in grado sì, di lavorare bene sull’estrazione dei dati, ma al contempo non è perfettamente efficiente nell’estrarre adeguatamente il “knowledge”. Ma quindi, a conti fatti, questi programmi a che servono? Possono essere un problema per gli scrittori? Per chi della scrittura ne fa arte e mestiere? E per chi legge, invece?

Spannung

Uno dei problemi principali, il climax di tutta questa faccenda, riguarda (in modo non dissimile rispetto a quanto avviene per le AI text to image) il concetto di autorialità dell’opera prodotta. Spero che a chiunque, o almeno a molti di coloro che si divertono con ChatGPT et similia, sia venuto in mente almeno una volta questa banalissima domanda: ma da dove vengono queste parole? Da dove trova i chunk, i pezzi di frase, così come le eventuali informazioni, il software che va così tanto di moda? Da Libri, siti, giornali, dai più disparati documenti, certo: lo scrive la stessa AI se la interpelliamo in merito, e noi di certo le crediamo. Ma quali libri? Di che autori? E da chi vengono aggiornati i siti? E a chi appartengono quei misteriosi documenti? Non c’è dato saperlo. Ed è in questo caso che scatta il rischio di plagio.

Questo perché gli AI text generator non usano in maniera senziente, cosciente e originale le parole che ci rimandano indietro: sono semplicemente istruiti a “predire” pezzi di frase, prendendole dalle fonti sulle quali sono state allenate, e inserendole una dopo l’altra stando “attenti” a dargli però anche senso logico (constraint della comunicazione verbale). Questo dunque può pericolosamente avvicinarsi alla definizione di plagio, dato che vengono prese idee e parole di altri senza permesso e senza nemmeno dare il giusto credito all’autore originale. Ci si avvicina, e non lo abbraccia, poiché in effetti il testo incriminato viene ri-generato da “qualcosa” piuttosto che da qualcuno: ChatGPT non sa che sta plagiando, non sa da chi e da dove sta “rubando” le informazioni. Per questo si tratta di una definizione difficile da applicare.

Con la scusa, però, tale ambiguità potrebbe essere sfruttata senza remore, sia in ambito scolastico che accademico, da tantissimi studenti. Del resto, l’infringement di diritti d’autore non è un fenomeno raro e isolato. Anche lo stesso prendere personalmente le informazioni da un sito web, senza poi menzionarlo nelle note o in sitografia, significa plagiare: così come lo è anche quando si prende “spunto” dagli articoli pubblicati su Wikipedia. Per molti giovani il fenomeno ChatGPT può essere paragonato a una sorta di “enciclopedia online”, soltanto più rapida nella ricerca e comoda nella produzione di testi. Chi ha poi trascorso le scuole elementari a comporre ricerche di storia tramite Microsoft Encarta non dovrebbe nemmeno parlare – e di questo faccio mea culpa.

Del resto, il punto non è che non si può prendere ispirazione da un modello, da un’idea di qualcun altro da ricondividere ed eventualmente rielaborare. Nulla è ormai più realmente originale, e la conoscenza, la cultura, la stessa capacità critica nasce e si nutre proprio grazie a questo: al sapere degli altri, carpito, analizzato, interiorizzato, apprezzato o messo in discussione. Ma questi altri un nome ce lo devono avere.

Quando viene fatta una reference (ed è normale farle), si sa da dove viene la fonte: l’omaggio è voluto, ponderato, valutato. Si cita, si omaggia, ma non si nega l’autorialità del prestito che abbiamo stipulato con l’altro. Anzi, gli si è riconoscente, sia all’opera che all’artista. Nel caso delle AI, però, la maternità o paternità delle informazioni non ci è nota. E si rischia di fare plagio pur non volendo, pur non avendone la benché minima intenzione.

Senza contare che – e in questo forse la situazione cambia se si parla di AI text to image – la questione plagio per un sistema come ChatGPT è anche intrinseca al suo stesso funzionamento. Dato un input simile, che chieda cioè (anche a parole diverse) di parlare di uno stesso argomento, o di un suo dettaglio più specifico, il software con buona probabilità genererebbe il medesimo contenuto a più persone diverse. Prendiamo come esempio un contesto classe: se un insegnante chiedesse agli studenti di scrivere un tema sull’impatto del riscaldamento globale, e questi scegliessero di svolgere il compito sfruttando ChatGPT, si ritroverebbero a consegnare più o meno tutti lo stesso elaborato. Un po’ come succedeva quando, alle elementari o alle medie, tutti si presentavano con la stessa ricerca sul Molise stampata dalla già menzionata Encarta.

Nel 2023 la situazione è ovviamente più complessa e intricata: ma, credo io, un sistema che permetta di evitare casi di plagio dovrebbe essere implementato quanto prima, in sistemi come ChatGPT. Mentre sul web è già possibile recuperare dei tool che permettono di analizzare il livello di “plagio” di un testo generato dall’AI, c’è chi avanza l’idea di una sorta di “watermark” per le informazioni, o gli stralci di testo palesemente ispirati ad opere già esistenti. O magari, proporrei io, sarebbe utile inserire una funzionalità che permetta di risalire alle fonti che il software sfrutta per l’elaborazione dei testi. In quel caso sarebbe possibile vedere, passadonci eventualmente sopra con il mouse, chi è l’effettivo autore (o il gruppo di autori) che si cela dietro le criptiche produzioni che ci vengono fornite in un semplice click.

Scioglimento: una riflessione

Dal canto mio, dopo aver giocato con ChatGPT, sono rimasta piuttosto sorpresa dalla qualità della scrittura, dalla sua reattività e dalla velocità di composizione dei testi. Pochi sarebbero in disaccordo sul fatto che questa nuova tecnologia abbia dei risvolti impressionanti. Ciò che resta da vedere, però, è l’impatto che avrà nel bene e nel male in alcuni ambiti lavorativi e/o educativi – e cioè sull’istruzione e sulla scrittura, in primis.

Chiaramente, scrivere un’opera letteraria – un libro, un racconto, o anche una poesia – è ben diverso dal produrre brevi frammenti tramite AI. Il punto è che un “autore” in erba, inesperto o poco consapevole delle meccaniche e delle strutture fondamentali di un racconto, di certo non può trarre dalle AI un’opera complessa e completa, quantomeno non trasformando la sua idea in un input per il software. Ma chi è invece bene a conoscenza di quello che è il complesso mondo che si cela dietro la stesura di un’opera letteraria può senz’altro prendere “ispirazione” e trarre giovamento da strumenti del genere.

Se persino James Joyce è stato dipinto come un “disperato”, a causa della mancanza di stimoli e processo creativo (fatto per il quale l’aneddoto delle sette parole diventa un po’ l’emblema del “blocco dell’autore“), questo tipo di tecnologie potrebbero in qualche modo aiutare uno scrittore a ritrovare la strada da percorrere per continuare a produrre testi. Una mano attenta, e una mente altrettanto astuta, sarà in grado di rimanipolarli e rimaneggiarli accuratamente, o semplicemente se ne servirà soltanto come spunto, così da dare alla sua opera la giusta piega.

Allo stato attuale delle cose, nel campo dell’Arte questo tipo di strumenti non trova ancora il suo spazio ben definito hic et nunc – e, direi io, per fortuna. L’essenza che l’autore infonde nei suoi testi, infatti, è fondamentale (a differenza di altri tipi di contenuti, quali ad esempio articoli di cronaca, saggi scientifici, o testi settoriali), così come lo è tutto il processo creativo nella sua più feconda interezza.

(Art di J.C. Green)

Dal punto di vista di una traduttrice, inoltre, troverei forse poco umano occuparmi di una traduzione di un’opera letteraria scritta tramite AI. E, nel caso più estremo, sintetico e distopico possibile, immaginare un futuro in cui i libri, che consumo spasmodicamente, verranno “scritti” da AI e (why not, a quel punto?) tradotti da AI, mi lascia piuttosto perplessa. Se una tale parentesi riuscisse a trovare realmente il suo spazio ben definito, potrebbero essere sviluppati dei software in grado di produrre testi direttamente in più lingue diverse, e magari anche simultaneamente. Aggirando in un certo senso il processo stesso di traduzione e di produzione di contenuti, da un punto di vista commerciale per le aziende sarebbe un grosso vantaggio. Immaginando poi che con il tempo i tool verrebbero affilati e sempre più “perfezionati”, una simile metodologia potrebbe essere esportata anche più in grande: dai fumetti ai videogiochi, dai siti web alle pubblicità, dai film alle serie tv, dai romanzi ai saggi.

Proprio come in uno dei racconti di Primo Levi: «Posseggo il Versificatore ormai da due anni. Non posso dire di averlo già ammortizzato, ma mi è diventato indispensabile. Si è dimostrato molto versatile: oltre ad alleggerirmi di buona parte del mio lavoro di poeta, […] mi fa anche la corrispondenza: infatti, gli ho insegnato a comporre in prosa, e se la cava benissimo. Il testo che avete ascoltato, ad esempio, è opera sua».

Solo che Ammaar Reshi l’ha fatto davvero. Suo è infatti il primo libro scritto e illustrato completamente tramite l’AI. Si intitola Alice and Sparkle, ed è un volumetto di appena 12 pagine rivolto ai bambini. La sua storia ce la racconta il Time, in un articolo di ormai un mesetto fa. Il libro è finito ben presto su Amazon, dato che l’autore ha scelto di stampare varie copie cartacee e di metterelo in vendita. Il tutto senza aver mai preso una penna in mano in vita sua – e indignando non poco la community di autori. Reshi, infatti, lavora come product design manager della San Francisco Bay Area: è stato grazie a Midjourney e a ChatGPT che è riuscito a mettere in piedi la mini avventura di Alice (sebbene gli siano comunque voluti diversi tentativi).

Se non è dunque remota la possibilità di generare opere esclusivamente tramite le AI, non è nemmeno remota la conseguente possibilità di vedere bypassato tutto quell’aspetto culturale che spesso entra in conflitto con il processo di localizzazione o di traduzione. Se il testo viene realizzato in modo “sintetico”, neutrale, da una AI super partes, la stessa AI può essere infatti in grado di o tradurlo nella lingua che vogliamo allo stesso modo, o di comporlo direttamente in più lingue contemporaneamente, evitando direttamente il processo traduttivo a monte.

Ad ogni modo, mi rendo conto che naturale avere dubbi, perplessità e opinioni contrastanti in tal senso sia perfettamente naturale. «Il pensiero di un futuro in cui i libri vengono scritti e tradotti da un’intelligenza artificiale può essere inquietante perché ci fa riflquettere sull’importanza dell’umanità nella creazione artistica e letteraria. La letteratura è spesso considerata un’espressione dell’umanità, dei suoi pensieri, sentimenti e desideri. Un’intelligenza artificiale, per quanto avanzata, non può avere la stessa profondità e complessità di pensiero e sentimento che caratterizza l’umanità.

Inoltre, la traduzione di un testo letterario scritto da un’intelligenza artificiale potrebbe presentare sfide uniche. Potrebbe essere difficile catturare lo stesso tono e significato del testo originale, poiché l’IA potrebbe non avere la comprensione umana delle sfumature linguistiche e culturali.

Detto questo, bisogna anche considerare che l’uso dell’IA per la scrittura e la traduzione potrebbe avere alcuni vantaggi. Potrebbe essere in grado di generare testi in modo più efficiente e veloce rispetto a un essere umano, e potrebbe anche essere in grado di generare nuove idee e concetti che gli esseri umani non avrebbero mai pensato». Questo, almeno, secondo ChatGPT…

Questa immagine ha l'attributo alt vuoto; il nome del file è vg.jpg

Per approfondire:

Robo-writers: the rise and risks of language-generating AI, Matthew Hutson, Nature, 03 March 2021
Noam Chomsky on Where Artificial Intelligence Went Wrong, Yarden Katz, The Atlantic, 1 November 2012
How AI Text Generators Will Impact the Writing Industry, Jose Luis Ontanon Nunez, Medium, 3 September 2022
Dizionario analogico della lingua italiana, Elena Dal Pra e Donata Feroldi, 2011
Dizionario delle collocazioni, Paola Tiberii, Zanichelli, 2012
Neural Networks and the Chomsky Hierarchy, Grégoire Delétang et al, Arxiv – Cornell University, 2022
Smart Enough to Talk With Us? Foundations and Challenges for Dialogue Capable AI Systems, Barbara J. Grosz, Computational Linguistics Volume 44, Issue 1 March 2018
Can artificial intelligence help end fake news?, European Commission, 15 April 2019
He Used AI to Publish a Children’s Book in a Weekend. Artists Are Not Happy About It, Nik Popli, Time, 2022

Licenza Creative Commons