AI Detector: l’arma della disinformazione nel 2026?
Il caffè era ormai freddo sulla scrivania di Elena, la luce blu del monitor le illuminava il viso teso. Era il 2026, e come reporter d’inchiesta, ogni giorno era una corsa contro il tempo e, sempre più spesso, contro l’ombra digitale. Davanti a lei, un’immagine cruciale: un presunto attacco missilistico, virale sui social, ma con un’aura di ambiguità che le stringeva lo stomaco. La sua routine, ormai, includeva una sosta obbligata sui detector di immagini AI, strumenti nati per essere scudi, ma che ora, paradossalmente, sembravano trasformarsi in spade a doppio taglio. Tutti abbiamo immaginato il rischio principale: un algoritmo troppo ingenuo che non riconosce un falso ben fatto. Ma la realtà, come spesso accade, è molto più subdola e pericolosa.

Il vero incubo, quello che si materializza silenziosamente nelle nostre timeline, non è che questi tool falliscano nel classificare un’immagine generata dall’intelligenza artificiale come autentica. No, il problema, altrettanto grave e forse più insidioso, è l’esatto contrario: che etichettino immagini reali, scattate da fotografi in carne e ossa, come pure creazioni sintetiche. Immaginate la scena: una foto storica, un momento di pura verità, bollata come “falsa” da un algoritmo. In un mondo già saturo di polarizzazione, questo offre agli attori malintenzionati l’arma perfetta per seminare il dubbio, per erodere la fiducia, per mettere in discussione la realtà stessa, come un novello gioco delle tre carte dove la verità è sempre la carta che non si trova.
A dipingere questo quadro inquietante è stato un recente e approfondito audit condotto da NewsGuard, un nome che ormai risuona con autorevolezza nel panorama della disinformazione digitale. Hanno messo alla prova cinque dei principali strumenti di rilevamento AI – Hive, AI or Not, ZeroGPT, Sightengine e ScamAI – sottoponendoli a un banco di prova brutale: quindici fotografie autentiche, documentanti momenti cruciali della guerra tra Stati Uniti e Iran. Immagini provenienti da fonti inattaccabili come Reuters, Associated Press, il New York Times e il Guardian. Il verdetto complessivo? Un allarmante 13,33% dei casi in cui questi strumenti hanno classificato immagini reali come generate dall’AI. Non un errore marginale, ma una falla sistemica che, amplificata dalla risonanza dei social media, può avere conseguenze devastanti.
Le differenze tra i vari tool, poi, sono abissali, quasi a suggerire che non esista un criterio univoco per definire cosa sia “vero” o “falso” nell’era dell’AI. ScamAI, che sul proprio sito si vanta di un'”accuratezza leader del settore”, si è rivelato il peggiore del lotto, un lupo travestito da agnello della verifica. Ha etichettato come generate dall’AI ben sei immagini autentiche su quindici, un terrificante 40% di errori. ZeroGPT ha sbagliato nel 20% dei casi, mentre AI or Not si è fermato a un più contenuto 6,67%. E poi ci sono loro: Hive e Sightengine, gli unici due a identificare correttamente tutte e quindici le immagini reali. Un barlume di speranza, penserete. Ma, come vedremo, la trama si infittisce ben presto.
Dennis Ng, cofondatore di ScamAI, incalzato da NewsGuard, ha candidamente ammesso l’esistenza di questi “falsi positivi”, giustificando la cosa con la necessità di alta risoluzione e molti pixel per un’identificazione accurata. «Possiamo certamente adattare e perfezionare i nostri modelli in base a casi d’uso specifici», ha dichiarato, quasi a voler rassicurare. Rawad Baroud, CEO di ZeroGPT, ha aggiunto un tassello importante: tecniche comuni come il ridimensionamento e la compressione delle immagini, prassi quotidiana nel giornalismo online, possono indurre classificazioni errate. E non solo: le foto giornalistiche provenienti da zone di conflitto, spesso scattate in condizioni estreme, presentano caratteristiche visive (illuminazione insolita, forte contrasto, sfocatura) che, ironia della sorte, possono mimare quelle delle immagini sintetiche. Il caos visivo di una guerra diventa così un terreno fertile per l’errore algoritmico.
E qui arriva il paradosso più amaro, quello che ci fa dubitare dell’intera impalcatura della verifica automatizzata. Hive e Sightengine, i due “virtuosi” che non hanno sbagliato una virgola sulle immagini autentiche, sono anche quelli che peggio hanno riconosciuto le immagini davvero manipolate. Sightengine ha identificato correttamente solo cinque delle quindici immagini fortemente alterate (un misero 33%), mentre Hive si è spinto fino a nove (73%). Dall’altra parte, ScamAI ne ha beccate dodici (80%), ZeroGPT quattordici (93%), e AI or Not ha fatto punteggio pieno con un impeccabile 100%. È il classico dilemma: un tool che è bravo a non mentire, ma che è terribilmente ingenuo di fronte alla menzogna altrui. E viceversa. Come possiamo fidarci di strumenti che, per quanto eccellenti in un compito, falliscono miseramente in un altro, altrettanto cruciale?
Il caso più emblematico, quello che dovrebbe suonare come un campanello d’allarme nelle redazioni di tutto il mondo nel 2026, è stato documentato proprio da NewsGuard. Un video autentico del primo ministro israeliano Benjamin Netanyahu in un caffè, pubblicato online per smentire le voci sulla sua morte dopo un attacco missilistico iraniano. Alcuni utenti, forse con l’intento di verificare, lo hanno sottoposto allo strumento Hive. Il risultato? Classificato come “probabilmente generato dall’AI” con una percentuale del 96,9%. Immaginate l’onda d’urto. Account anti-Israele e filo-iraniani sui social hanno immediatamente brandito quel risultato come “prova” inconfutabile della morte di Netanyahu, alimentando una narrativa falsa e pericolosa. Solo un’attenta verifica incrociata con altre immagini dello stesso locale ha confermato l’autenticità del video. Hive era stato ingannato da un semplice filtro o da una leggera sfocatura dello sfondo. Un dettaglio tecnico trasformato in un’arma di propaganda.
Questo è esattamente il punto più preoccupante dell’intera vicenda. Un tool che sbaglia in questo modo non è più uno strumento di verifica, ma diventa, suo malgrado, un alleato della propaganda, un megafono per la disinformazione. E la risposta di Hive alle richieste di commento di NewsGuard? Silenzio. Un silenzio assordante, che pesa come un macigno sulla reputazione e sull’affidabilità di questi sistemi. La verità è che il confine tra un’immagine reale con un filtro e un’immagine generata dall’AI è sempre più labile per gli algoritmi attuali, e questa ambiguità è terreno fertile per chi vuole manipolare l’opinione pubblica.
NewsGuard non si è fermato qui, approfondendo l’analisi su immagini leggermente modificate (migliorate nell’illuminazione, con sfondo sfocato) e altre alterate in modo significativo (missili aggiunti, bandiere cambiate, scritte inserite). Per le modifiche leggere, i risultati sono stati ancora più sconcertanti per la loro variabilità: ScamAI ha classificato come AI il 93% delle immagini, AI or Not l’87%, ZeroGPT l’80%. Hive e Sightengine, invece, solo il 27%. Una variazione dal 27% al 93% sullo stesso set di immagini è una vera e propria campana a morto per l’affidabilità. Rivela che ogni tool utilizza soglie e criteri completamente diversi per definire cosa sia una “manipolazione AI”, trasformando la verifica in una lotteria.
David Lissmyr, fondatore di Sightengine, ha provato a chiarire la posizione, spiegando che il loro modello base è progettato per riconoscere immagini completamente generate dall’AI o pesantemente modificate, e che esistono modelli più avanzati per le modifiche leggere. Ng di ScamAI ha difeso l’approccio del suo tool con una logica differente: «Se il nostro modello rileva qualche tipo di filtro AI applicato a un’immagine reale, la classificheremo comunque come immagine manipolata dall’AI», perché anche i ritocchi minimi «lasciano tracce di manipolazione sintetica». È una questione di filosofia: dove finisce l’editing e inizia la manipolazione algoritmica? I detector non hanno ancora trovato una risposta comune.
Il risultato finale di questa babele algoritmica è che in 35 dei 45 casi totali analizzati, almeno uno dei cinque tool ha raggiunto conclusioni diverse dagli altri. Questo significa che chi, come Elena, prova a usare più strumenti per avere maggiore certezza, rischia di confondersi ancora di più, non di chiarirsi le idee. Un’immagine di un missile iraniano modificata per aggiungere la scritta “No Kings”, ad esempio, è stata classificata come AI da tre strumenti su cinque, e come autentica dagli altri due. Un vero e proprio rompicapo per i fact-checker.
La conclusione di Rawad Baroud di ZeroGPT risuona come un monito per il 2026: «Invitiamo giornalisti, ricercatori e fact-checker a combinare i risultati del rilevamento dell’AI con la verifica delle fonti, la ricerca inversa delle immagini, l’analisi dei metadati». In altre parole, la tecnologia è un aiuto, non un sostituto del pensiero critico e del lavoro umano. La sfida è immensa. Entro i prossimi 6-12 mesi, mi aspetto di vedere un aumento significativo delle linee guida etiche e dei protocolli di verifica manuale nelle principali redazioni, accompagnato da un’esigenza crescente di maggiore trasparenza da parte degli sviluppatori di AI detector, magari con l’indicazione esplicita delle soglie e dei criteri usati. Solo così potremo sperare di non affogare nel mare magnum della disinformazione.
Ripreso da: SmartWorld.it