Quali LLM resistono alla propaganda russa nel 2026
Mi trovo di fronte a una domanda che non posso più ignorare: come fanno i grandi modelli linguistici a distinguere tra informazione legittima e narrativa propagandistica? Non è una questione teorica. È pratica, urgente, e riguarda milioni di persone che ogni giorno chiedono a questi sistemi di aiutarli a capire il mondo.

L’Istituto della Lingua Estone, finanziato dal governo, ha affrontato il problema direttamente. Ha creato un benchmark chiamato “Propaganda Resistance” che classifica decine di modelli linguistici sulla loro capacità di resistere a quello che loro vedono come propaganda strategica russa. Non è una scelta casuale. L’Estonia, ex repubblica sovietica indipendente da solo pochi decenni, conosce bene il peso delle narrative false. Vive a pochi chilometri da un vicino potente e spesso ostile. Comprende il rischio meglio di molti.
Insieme al collettivo di difesa estone Propastop, gestito da volontari, l’Istituto ha identificato quattordici categorie di narrativa in cui Mosca cerca di influenzare il dibattito pubblico. Parliamo di tutto: lo status di Crimea, le giustificazioni per la guerra in Ucraina, la storia della NATO, persino le scuse storiche per l’annessione dei Baltici durante la Seconda Guerra Mondiale. Ogni categoria rappresenta un campo di battaglia informativo dove la verità viene sistematicamente distorta.
Quello che mi colpisce è il metodo. I ricercatori hanno formulato domande in tre lingue—inglese, estone e russo—strutturate in modo neutro, biased con false premesse tratte dalla propaganda russa, o addirittura maliziose, progettate per spingere il modello a generare disinformazione esplicita. Poi hanno valutato le risposte usando un altro modello di intelligenza artificiale, calibrato per allinearsi con gli esperti di Propastop. L’obiettivo era chiaro: misurare la capacità dei modelli di respingere le narrative propagandistiche senza aiuto esterno—niente ricerche sul web, niente strumenti supplementari.
Questo approccio rivela qualcosa di importante. I modelli linguistici non sono né neutrali né oggettivi per natura. Sono il riflesso dei dati con cui sono stati addestrati, dei valori impliciti nelle scelte progettuali, delle decisioni prese da chi li ha costruiti. Se un modello non sa riconoscere una narrativa propagandistica, non è un limite tecnico: è un fallimento etico. Significa che uno strumento di informazione di massa è vulnerabile a un attacco informativo coordinato.
A mio parere, questo benchmark rappresenta un cambio di paradigma importante. Non è una lista di “buoni” e “cattivi”, ma un test concreto di responsabilità. Mostra che i governi, almeno quelli che comprendono il peso della propaganda, stanno iniziando a chiedere conto ai costruttori di IA. Non è ancora uno standard globale, ma è un inizio.
Il problema resta: cosa facciamo con questi dati? Se scopriamo che alcuni modelli sono vulnerabili, chi li usa sa che lo sono? Gli utenti ricevono avvertenze? E soprattutto, cosa succede quando la stessa propaganda raggiunge gli LLM attraverso feedback dei modelli, conversazioni pubbliche, dati di training futuri? La propaganda non sparisce—si adatta. Si evolve. Continua a cercare crepe.
L’Estonia ha alzato lo standard. Ha detto che la resistenza alla propaganda non è un accessorio opzionale, ma una misura di qualità fondamentale. Io credo che sia giusto. Ma la domanda che rimane aperta è: i costruttori di LLM a livello globale adotteranno veramente questi standard, o continueranno a trattare la propaganda come problema altrui?
Via: Ars Technica