Gracenote fa causa a OpenAI: guerra sui metadati AI
Il 2024 si conferma l’anno delle battaglie legali nell’universo dell’intelligenza artificiale. Dopo gli scontri con editori, artisti e creatori di contenuti, OpenAI si trova ora ad affrontare una nuova e particolare causa legale. Questa volta a scendere in campo è Gracenote, la storica azienda di metadati di proprietà di Nielsen, che accusa il colosso dell’AI di aver utilizzato senza autorizzazione i suoi preziosi database.
La causa, riportata da Axios, non si limita alla classica accusa di utilizzo non autorizzato di contenuti per l’addestramento dei modelli linguistici. Gracenote alza infatti l’asticella, sostenendo che OpenAI abbia copiato non solo i dati, ma anche la struttura e il framework utilizzato per organizzare e collegare queste informazioni. Si tratta di un precedente che potrebbe aprire nuovi scenari nelle dispute legali del settore tech.
Per chi non conoscesse Gracenote, parliamo di un’azienda che da oltre due decenni rappresenta il punto di riferimento mondiale per i metadati dell’intrattenimento. I suoi database contengono descrizioni dettagliate, identificatori univoci e informazioni strutturate su milioni di contenuti audiovisivi, utilizzati da broadcaster, piattaforme streaming e provider TV in tutto il mondo per migliorare l’esperienza di scoperta dei contenuti.
Un caso diverso dalle solite cause AI
Quello che rende particolare la causa intentata da Gracenote è la natura stessa dell’accusa. Mentre la maggior parte delle dispute legali contro le aziende di intelligenza artificiale si concentra sui contenuti utilizzati per addestrare i Large Language Model, questa volta il focus si sposta sui metadati e, soprattutto, sulla struttura organizzativa degli stessi.
Secondo la denuncia presentata in tribunale, OpenAI non si sarebbe limitata a “pescare” informazioni dai database Gracenote, ma avrebbe replicato il sistema di organizzazione e collegamento dei dati sviluppato dall’azienda nel corso degli anni. “Gli imputati avrebbero potuto pagare Gracenote per ottenere la licenza dei suoi preziosi dati. Oppure avrebbero potuto cercare di addestrare i loro modelli utilizzando solo informazioni di pubblico dominio. Non hanno fatto né l’una né l’altra cosa”, si legge nella denuncia.
L’accusa prosegue specificando che OpenAI “ha invece copiato e utilizzato impropriamente i dati Gracenote per creare i propri prodotti AI commercialmente preziosi, tutto senza pagare un centesimo”. Una formulazione che evidenzia non solo la presunta violazione del copyright, ma anche il danno economico derivante dall’utilizzo commerciale non autorizzato.
Tentativi di accordo falliti e partnership alternative
Particolarmente interessante è il retroscena che emerge dalla documentazione legale. Gracenote sostiene di aver tentato in passato di avviare negoziazioni con OpenAI per raggiungere un accordo di licensing, ma che tali tentativi sarebbero stati “respinti o ignorati” dalla società di Sam Altman. Una dinamica che, se confermata, potrebbe pesare non poco nelle valutazioni del tribunale.
Nel frattempo, Gracenote non è rimasta ferma sul fronte delle partnership nell’ambito dell’intelligenza artificiale. L’azienda ha recentemente siglato accordi strategici con giganti del calibro di Samsung e Google per supportare i loro progetti AI. Queste collaborazioni dimostrano come sia possibile – e auspicabile – trovare modalità di cooperazione legale e remunerativa nel settore, rendendo ancora più questionabile l’approccio adottato da OpenAI.
Il caso Samsung è particolarmente significativo: l’accordo con Gracenote permetterà al colosso sudcoreano di integrare metadati di alta qualità nei suoi dispositivi smart TV e negli ecosistemi connessi, migliorando l’esperienza utente attraverso raccomandazioni più accurate e funzionalità di ricerca avanzate.
Implicazioni per il futuro dell’AI e del copyright
La causa intentata da Gracenote potrebbe stabilire precedenti importanti per l’intero settore dell’intelligenza artificiale. Se il tribunale dovesse accogliere le argomentazioni dell’azienda, non solo sui contenuti ma anche sulla struttura organizzativa dei dati, si aprirebbe una nuova dimensione nelle dispute sul copyright nell’era dell’AI.
Per il mercato italiano ed europeo, questo caso assume particolare rilevanza alla luce del recente AI Act e delle crescenti preoccupazioni sulla trasparenza e la legalità dei dati utilizzati per addestrare i modelli di intelligenza artificiale. Le aziende europee che sviluppano soluzioni AI dovranno probabilmente prestare ancora maggiore attenzione non solo ai contenuti utilizzati, ma anche alle metodologie di strutturazione e organizzazione degli stessi.
La battaglia legale tra Gracenote e OpenAI rappresenta inoltre un banco di prova per comprendere fino a che punto si estende la protezione del copyright nell’era digitale. Non si tratta più solo di proteggere testi, immagini o audio, ma anche i sofisticati sistemi di catalogazione e correlazione che rendono questi contenuti facilmente accessibili e utilizzabili.
Con questa nuova causa, OpenAI si trova ad affrontare un fronte sempre più ampio di contestazioni legali, che potrebbero influenzare significativamente lo sviluppo futuro dei suoi modelli e, più in generale, l’approccio dell’intera industria AI alla gestione dei diritti di proprietà intellettuale. Il verdetto di questo caso potrebbe ridefinire le regole del gioco per tutti i player del settore.
Fonte: Engadget