Il New York Times ha presentato una causa legale contro OpenAI e Microsoft, sostenendo che abbiano violato il copyright utilizzando milioni di articoli del giornale senza autorizzazione per addestrare i loro modelli di intelligenza artificiale generativa. I documenti giuridici depositati questa settimana presso il tribunale distrettuale federale di Manhattan affermano che OpenAI e Microsoft hanno copiato parti significative dell’archivio del Times senza permesso per sviluppare modelli linguistici di grande scala, come ChatGPT e Copilot.
La Controversia della Formazione
Il giornale sostiene che queste azioni costituiscano una violazione intenzionale del copyright secondo la legge federale. Il New York Times sta cercando un’ingiunzione che imponga a Microsoft e OpenAI di cessare l’uso dei suoi contenuti e sta chiedendo un risarcimento monetario che potrebbe raggiungere miliardi di dollari, basato sull’ampio utilizzo dei servizi di intelligenza artificiale di entrambe le società. La denuncia sostiene che questa pratica ha danneggiato il Times, poiché i sistemi di intelligenza artificiale distribuiscono gratuitamente i contenuti del giornale.
“[OpenAI e Microsoft] stanno cercando di sfruttare l’ampio investimento del Times nel giornalismo utilizzandolo per creare prodotti sostitutivi senza permesso o pagamento”, afferma la causa. “Se il Times e altre testate giornalistiche non possono più produrre e proteggere il proprio giornalismo indipendente, si creerà un vuoto che nessun computer o intelligenza artificiale potrà colmare. Ciò comporterà una produzione ridotta di giornalismo e avrà un costo significativo per la società”.
La Questioni Legale Chiave
Il cuore della questione giuridica riguarda se l’attività di web scraping, ossia l’ottenimento di dati di formazione da siti di notizie e altre fonti da parte delle società di intelligenza artificiale generativa, sia conforme alla legge sul copyright. Le aziende tecnologiche sostengono che sia legittimo, mentre gli editori affermano che i loro contenuti non possono essere copiati su vasta scala senza autorizzazione o pagamento. Molte organizzazioni mediatiche, tra cui il Times, hanno implementato misure tecniche per proteggere i loro siti da accessi non autorizzati.
Il New York Times sostiene che OpenAI e Microsoft abbiano copiato milioni di articoli risalenti agli anni ’80 prima che tali misure fossero adottate, al fine di addestrare i loro modelli. Questi modelli competono direttamente con il giornalismo del Times. Inoltre, i risultati prodotti dai modelli possono contenere citazioni inventate e fatti attribuiti al New York Times, il che potrebbe compromettere l’integrità delle informazioni fornite dal giornale. La causa menziona casi simili relativi al chatbot AI generativo Bing di Microsoft.
Risposte e Speranze di Risoluzione
Un portavoce di OpenAI ha dichiarato: “Rispettiamo i diritti dei creatori e dei proprietari di contenuti e ci impegniamo a collaborare con loro per garantire che traggano vantaggio dalla tecnologia AI e dai nuovi modelli di reddito. Le nostre conversazioni in corso con il New York Times sono state produttive e stanno procedendo in modo costruttivo, quindi siamo sorpresi e delusi da questo sviluppo”. OpenAI ha precedentemente raggiunto accordi simili con altre organizzazioni editoriali per l’accesso ai loro contenuti per la formazione di modelli AI.
In sintesi, questa controversia legale evidenzia le sfide inerenti all’uso dei dati di contenuti protetti da copyright per addestrare modelli di intelligenza artificiale generativa e il conflitto tra le aziende tecnologiche e gli editori nel determinare cosa costituisca un uso equo dei contenuti online.