Via Guglielmo Calderini, 68, Roma
segreteria@nexing.it

Blog Details

  • Nexing
  • News
  • Rimedi per identificare i video fatti con l’AI, ecco perché sono falliti tutti (finora)

Rimedi per identificare i video fatti con l’AI, ecco perché sono falliti tutti (finora)

Ma davvero il nostro gatto ci salta addosso se ci vede tagliare una torta a forma di gatto? E davvero è possibile camminare sull’acqua legandosi ai piedi tantissime bottigliette vuote? Se vedendo un video su internet ci è venuto il dubbio, sappiamo di cosa stiamo parlando: adesso è davvero difficile potersi fidarsi di qualunque immagine o video. Se invece il dubbio non c’è mai venuto, è peggio: significa che siamo facili vittime di bufale e alla disinformazione. Nessun inganno è innocuo come ci può sembrare. Nella migliore delle ipotesi abbiamo perso del tempo vedendo acrobazie, incidenti, stranezze credendoli veri. Nella peggiore, rischiamo conseguenze nel mondo reale. Di finire in mare con tutti i vestiti, ad esempio. O di subire la propaganda, pensando ad esempio che davvero l’avvocata per i diritti civili Nekima Levy Armstrong abbia pianto durante l’arresto nel Minnesota. Un altro caso di immagine alterata con l’AI. Ancora più grave che l’autore della finzione sia il Governo degli Stati Uniti.

Il problema è che questa invasione dei finti video AI era ampiamente prevista; previsti anche i danni che ne possono venire; e da anni, persino, sarebbero disponibili alcuni rimedi, sia tecnici sia normativi. Peccato che hanno fallito tutti questi, almeno per ora. Adesso, a tre anni circa dall’avvento dell’AI generativa, è possibile fare un bilancio, con anche un possibile indiziato come principale responsabile del flop: le grandi piattaforme social, che non hanno nessun interesse a diffondere etichette o altri sistemi per filtrare “l’AI slop”, i contenuti generati con l’AI e di qualità dubbia. L’AI sta aumentando di molto i contenuti video disponibili sui social e quindi l’engagement del pubblico.

 

Senza una collaborazione delle piattaforme è difficile che qualcosa cambi.

Per anni la risposta tecnica è sembrata semplice: aggiungere ai contenuti digitali una sorta di etichetta nutrizionale. È l’idea alla base di c2pa, lo standard di “Content Credentials” promosso da aziende come Adobe, Microsoft, OpenAI, Meta, Google e molte altre, riunite nella Coalition for Content Provenance and Authenticity. Secondo il sito ufficiale di Content Credentials oggi partecipano più di 500 aziende.

C2pa estende i vecchi metadati Exif delle fotografie: dentro al file si registra, in modo firmato crittograficamente, la storia del contenuto. La fotocamera o la videocamera scrive chi ha scattato, con quale dispositivo, in che momento. Il software di editing aggiunge le modifiche, compreso l’uso di strumenti generativi. I file viaggiano accompagnati da questo “manifesto” che, in teoria, le piattaforme dovrebbero leggere per mostrare al pubblico un pannello con autore, app utilizzate, eventuale uso di AI.

 

Negli ultimi anni alcune fotocamere professionali – per esempio modelli di Sony, Nikon e Leica – hanno iniziato a integrare Content Credentials all’origine, e software come Photoshop o Lightroom possono già scrivere manifest C2PA nei file.

Sulla carta, è la risposta perfetta: si certifica la provenienza dei contenuti seri, si etichettano quelli generati o manipolati dall’AI, si permette al pubblico di verificare. Nella pratica, però, questo “bollino di realtà” sta mostrando limiti strutturali.

Il primo limite è concettuale: c2pa non è un rivelatore di AI, ma un registro di provenienza. Funziona soltanto se chi crea il contenuto decide di farsi tracciare. Chi vuole produrre un deepfake in malafede può generare un file senza credenziali, o ripulirlo facendo uno screenshot, una registrazione dello schermo, una conversione.

Il secondo limite è tecnico: la catena dei metadati si spezza facilmente. Nell’ideale dei promotori il manifesto dovrebbe sopravvivere a compressioni, ridimensionamenti, upload. Ma come ammettono gli stessi tecnici CAI, è comune che social e piattaforme video eliminino o corrompano i metadati durante l’upload o la transcodifica.

Un test del Washington Post ha caricato lo stesso video generato con Sora, corredato di Content Credentials, su otto piattaforme social. Nessuna ha mantenuto intatti i metadati C2PA o li ha resi visibili agli utenti; solo YouTube ha mostrato una vaga dicitura “contenuto alterato o sintetico” nella descrizione, visibile solo aprendo il pannello dettagli.

Terzo, e forse più importante, il sistema si inceppa nella distribuzione. Sul lato creazione qualcosa si muove: le fotocamere più recenti, parte dei software professionali e diversi generatori di immagini e video AI scrivono già c2èa nei file. Ma il rispetto di quei metadati lungo la filiera – social network, app di messaggistica, piattaforme video – resta frammentario. Un’inchiesta di The Verge parla apertamente di “fallimento quasi totale” rispetto all’obiettivo di aiutare gli utenti a distinguere reale e sintetico.

Insomma: c2pa può essere utile a fotografi, media e creativi per certificare il proprio lavoro. Come scudo universale contro i deepfake non sta funzionando.

Un’alternativa tentata sono i watermark. TikTok è stato il primo grande social video ad annunciare, nel 2024, l’uso sistematico dello standard per riconoscere automaticamente contenuti AI provenienti da altre piattaforme e apporre un’etichetta “AI-generated”, oltre a incorporare watermark nei video scaricati dall’app per permettere la tracciabilità a valle.

YouTube richiede ai creator di dichiarare, in fase di upload, quando un contenuto realistico è stato generato o pesantemente alterato con strumenti sintetici. In quei casi compare la dicitura “altered or synthetic content”, a volte anche con un’etichetta più visibile sul player per temi sensibili come salute, elezioni o finanza.

Google, dal canto suo, ha sviluppato SynthID, un sistema di watermark “nascosto” che inserisce segnali statistici direttamente in immagini, audio, video e testi creati con i propri modelli. Oggi i contenuti generati dagli strumenti Google AI vengono marcati automaticamente e l’app Gemini permette di verificare se un’immagine o un video contengono il watermark.

Ma anche qui emergono i limiti: SynthID è efficace solo dentro l’ecosistema Google; altre piattaforme non sono obbligate né sempre tecnicamente attrezzate per riconoscerlo, e non mancano dubbi su quanto sia robusto rispetto a trasformazioni pesanti o ri-encoding aggressivi.

X, invece, ha scelto una strada opposta: dopo essere stata tra i membri originari dell’iniziativa Cai, si è ritirata dalla coalizione e oggi non ha alcun impegno pubblico sull’uso di c2pa o watermark strutturali, mentre è al centro di indagini europee per la diffusione di contenuti manipolati, inclusi deepfake e immagini sessualmente esplicite generate dall’AI. L’unica salvezza contro l’AI ingannevole su X sono le “note di comunità”, con tutti i loro limiti.

Apple resta defilata: al di là di qualche collaborazione tecnica, non ha annunciato un supporto sistematico né a C2PA né a watermark proprietari sui contenuti generati dagli iPhone.

Di fondo, c’è un paradosso economico: le aziende che guadagnano di più dall’AI sono le stesse che controllano i canali di distribuzione dell’informazione.

Google investe miliardi in modelli generativi e allo stesso tempo guadagna con la pubblicità in YouTube, dove una quota crescente di visualizzazioni arriva da contenuti automatici o semi-automatici. Negli ultimi mesi la piattaforma ha iniziato a rimuovere alcuni canali interamente basati su video generati in serie, ma solo dopo che avevano accumulato miliardi di visualizzazioni. Meta è in una situazione simile. Chi investe nell’AI e vi guadagna ha poco interesse a etichettarla riducendone il valore percepito e quindi la sua monetizzazione.

La trasparenza entra in competizione diretta con i ricavi. TikTok almeno comincia offrire controlli per ridurre la presenza di contenuti AI nel feed, sfruttando etichette c2pa e tag dichiarati dai creator. Ma anche qui il limite è che serve la volontà attiva dei creatori e degli utenti insieme perché il filtro funzioni.

Allora c’è speranza nelle norme? L’Unione Europea ha cercato di affrontare il problema con due strumenti principali: l’AI Act (regolamento UE 2024/1689) e il Digital Services Act (dsa).

L’AI Act, entrato in vigore nel 2024 con applicazione scaglionata nei prossimi anni, contiene all’articolo 50 obblighi specifici di trasparenza per i contenuti sintetici: chi distribuisce audio, video, immagini o testi generati o manipolati da AI che “assomigliano palesemente a persone, oggetti, luoghi, entità o eventi esistenti” deve informarne chiaramente gli utenti, salvo che ciò sia già evidente dal contesto.

Il dsa impone invece obblighi di valutazione e mitigazione dei rischi sistemici, come la disinformazione amplificata da contenuti sintetici, oltre a meccanismi di segnalazione e rimozione rapida di contenuti illeciti come i deepfake pornografici. Le prime indagini formali e le sanzioni contro X mostrano che la Commissione è pronta a usare anche questo strumento, ma la strada per un enforcement efficace sembra lunga.

Se n’è accorta anche la stessa Ue, che sta cercando di colmare il vuoto con un nuovo codice di condotta sulla marcatura dei contenuti AI, pensato proprio per aiutare piattaforme e sviluppatori a tradurre le norme in specifiche tecniche e interfacce utente.

Nel frattempo toccherà a noi imparare a fare la tara su ciò che vediamo online. Peccato: una conseguenza negativa, inevitabile, è che cominceremo a diffidare anche delle immagini reali.

Fonte: Il Sole 24 ORE