(Adnkronos) – Il New York Times ha fatto causa a OpenAI e Microsoft per violazione del copyright, accusando le società di intelligenza artificiale di avere copiato illegalmente milioni di articoli del quotidiano americano per “addestrare” ChatGPT ed altri servizi a fornire articoli ed informazioni con una tecnologia che ora compete con il Times.
Il ricorso del giornale – ricorda la Cnn – è l’ultima di una serie di azioni legali avviate per limitare il recupero di grandi quantitativi di contenuti su Internet, senza nessuna forma di compenso, per addestrare i modelli di linguaggio artificiale. Attori, scrittori, giornalisti ed altri ‘creativi’ che hanno messo il loro lavoro online temono che l’Ai possa apprendere dai loro contenuti e provvedere dei ‘chatbot’ alternativi ed altre fonti di informazione, senza alcuna forma di compensazione.
Ma la causa del Times è la prima di una grande testata contro OpenAI e Microsoft, i brand principali di Ai che vengono accusati di “utilizzo illegale del lavoro del Times per creare prodotti di intelligenza artificiale che minacciano la capacità del Times di offrire i propri servizi”. Insomma, le due società vengono accusate di avere sfruttato in maniera gratuita “il massiccio investimento del Times sul suo giornalismo e di usarlo per costruire prodotti sostituitivi senza permesso né pagamento”.
“Per mesi, il Times ha cercato di negoziare un accordo, ma i negoziati non hanno condotto ad una risoluzione”, si legge nel ricorso. Portavoce di OpenAI e Microsoft non hanno ancora risposto ad una richiesta di commento, scrive il Washington Post. I cosiddetti modelli linguistici di grandi dimensioni (LLMs) che sono dietro agli strumenti di Ai come ChatGPT funzionano ingerendo un’enorme quantità di testi recuperati da Internet, apprendendo in questo modo le connessioni tra parole e concetti e quindi sviluppando la capacità di predire quale parola dire nella frase successiva, riuscendo così ad imitare il linguaggio e la scrittura umana. OpenAi, Microsoft e Google si sono rifiutati di rivelare quello che viene inserito nei modelli più nuovi, ma i precedenti LLMs hanno compreso enormi quantitativi di contenuti dei media e cataloghi di libri.
Le società tech sostengono che l’uso delle informazioni estratte da Internet per addestrare gli algoritmi di Ai rientra nell’ambito del “giusto uso”, un concetto che per la legge del copyright permette alle persone di usare il lavoro di altri se viene modificato in modo sostanziale. Nel ricorso del Times, però, sono elencati diversi esempi di modelli Gpt-4 Ai di OpenAi in cui compaiono articoli del Times copiati parola per parola.
Dallo scorso agosto sono almeno 538 i media, compresi New York Times, Washington Post e Reuters, che hanno installato dei sistemi di blocco ai loro siti per impedire alle società di Ai di ‘rubare’ i loro articoli. Intanto, OpenAI ha negoziato accordi con le organizzazioni dei media nell’ultimo anno per poter pagare i loro contenuti. A luglio, ha firmato un accordo con l’Associated Press per aver accesso ai suoi articoli. Ma lo scorso ottobre un portavoce della società ha detto che le precedenti pratiche non violavano le leggi del copyright e che i nuovo accordo fatto riguardava solo i contenuti che non sono reperibili online.