SynthID (sviluppato da Google DeepMind) è un sistema di watermarking invisibile basato su deep learning pensato per contenuti generati da AI.

Architettura e meccanismo di inserimento del watermark

Il sistema utilizza due reti neurali addestrate congiuntamente: una rete encoder che inserisce il watermark nell’immagine e una rete decoder (detector) che successivamente lo rileva. L’inserimento avviene direttamente durante la generazione dell’immagine (ad esempio nel modello di diffusione Imagen), non come semplice filtro post-produzione: il watermark viene aggiunto nel momento in cui il contenuto è creato. Ciò significa che ogni immagine AI prodotta da modelli supportati esce già con una firma digitale invisibile incorporata nei pixel.

Dal punto di vista matematico e algoritmico, SynthID adotta principi di steganografia digitale. La rete di watermarking apporta micro-modifiche ai pixel dell’immagine – ad esempio alterando leggermente i valori di colore o luminanza – in modo così sottile da non essere percepibile dall’occhio umano. Queste perturbazioni vengono distribuite nel contenuto sfruttando la rappresentazione latente dell’immagine appresa dalla rete. In pratica, l’algoritmo identifica regioni o componenti dell’immagine dove può nascondere il segnale senza effetti visibili, ad esempio intervenendo su componenti ad alta frequenza o canali di colore meno sensibili alla percezione umana. Tecniche classiche come trasformate nel dominio delle frequenze (ad es. DCT o wavelet) possono essere utilizzate dal modello per distribuire la firma in zone dello spettro poco rilevanti per la qualità visiva. Allo stesso tempo, il modello è addestrato a “allineare visualmente” il watermark al contenuto dell’immagine: in altre parole, le piccole variazioni introdotte vengono adattate alle caratteristiche visive locali (come texture, dettagli o ombreggiature) così da confondersi con l’immagine originale. Questo permette di preservare completamente la qualità percepita (nessun artefatto evidente) pur inserendo una firma latente e unica rilevabile algoritmicamente.

La rete di identificazione associata è una CNN addestrata a riconoscere il segnale nascosto. In fase di rilevamento, l’immagine viene analizzata alla ricerca di questo pattern digitale caratteristico. Il processo può essere visto come un’analisi statistica dei pixel: il detector cerca schemi sottili nei valori dell’immagine che sarebbero altamente improbabili in un contenuto naturale, ma che corrispondono invece alla firma artificiale introdotta da SynthID. In pratica il sistema effettua una correlazione con un pattern noto oppure utilizza filtri neurali specializzati per evidenziare le minime alterazioni inserite dall’encoder. A differenza di un watermark tradizionale, qui non c’è un logo visibile o un bit codice semplice da leggere: il detector restituisce piuttosto un punteggio di confidenza sul fatto che l’immagine contenga il watermark di SynthID. Google infatti definisce tre livelli di confidenza: ad esempio, un alto score porta all’etichetta “watermark digitale rilevato” (immagine quasi sicuramente generata dall’AI), uno score nullo indica “non rilevato” (probabilmente contenuto umano), mentre valori intermedi risultano in “watermark possibilmente rilevato” da interpretare con cautela[10]. In sintesi, l’algoritmo di detection non ricostruisce necessariamente un messaggio esplicito, ma verifica la presenza di un segnale nascosto confrontando statisticamente l’immagine con le impronte tipiche lasciate dal generatore AI.

Robustezza del watermark di SynthID alle modifiche delle immagini

Un aspetto chiave di SynthID è il bilanciamento tra invisibilità e robustezza del watermark. Il sistema è progettato per mantenere la firma riconoscibile anche dopo molte manipolazioni comuni delle immagini. Grazie all’uso di reti neurali e all’ottimizzazione congiunta, il watermark è impercettibile ma anche resistente rispetto a trasformazioni come ritagli, cambi di colori o compressioni lossy. Di seguito analizziamo come SynthID affronta le varie alterazioni possibili:

  • Ritaglio (crop): il watermark non è confinato in un singolo punto dell’immagine, bensì ridondante e diffuso su tutta la superficie. SynthID inserisce la firma in più zone dell’immagine (ad es. suddividendo virtualmente l’immagine in blocchi o pattern ripetuti) proprio per garantire che anche disponendo solo di una porzione dell’immagine originale la firma sia ancora presente. Questa strategia di embedding distribuito fa sì che se l’immagine AI viene ritagliata, le parti residue contengono ancora tracce del watermark che il detector può aggregare per riconoscerle.

  • Filtri, regolazioni di colore e sfocature: il watermark di SynthID è inserito in modo da non dipendere da specifici valori assoluti di colore o luminosità, ma da pattern più sottili (ad esempio lievi variazioni locali). Questo lo rende invariante rispetto a filtraggi e ritocchi globali. Prove interne mostrano che la firma rimane rilevabile dopo l’applicazione di filtri fotografici, cambiamenti di bilanciamento colore, variazioni di luminosità/contrasto e anche dopo leggera blur (sfocatura). In altri termini, operazioni come color grading o aggiunta di effetti non cancellano il segnale nascosto, perché quest’ultimo è intrecciato con le componenti intrinseche dell’immagine più che con il suo colore globale. Il detector di SynthID è addestrato su un dataset ampio con immagini modificate in vari modi, così da apprendere a riconoscere la firma attraverso trasformazioni visive moderate (es. filtri comuni) senza generare falsi negativi.

  • Compressione con perdita (es. JPEG): il watermark è pensato per sopravvivere alla compressione tipica dei formati come JPEG. L’encoder probabilmente incorpora la firma nelle componenti dell’immagine che non vengono completamente eliminate dalla quantizzazione o dalla riduzione di qualità. Ad esempio, può modulare leggermente coefficienti nei medi-bassi frequenze spaziali, che tendono a persistere anche quando l’immagine è compressa, oppure distribuire l’informazione in modo ridondante su molti pixel così che solo una parte venga degradata dalla compressione. Di fatto, Google conferma che il watermark rimane identificabile dopo vari salvataggi con compressione lossy comune. Anche con qualità JPEG ridotta o conversioni di formato, la probabilità di rilevare la firma resta alta, a meno di livelli di compressione estremi che distruggerebbero anche i dettagli visivi (e di conseguenza il pattern).

  • Ridimensionamento (resize/scaling): SynthID è progettato per resistere anche a cambi di risoluzione dell’immagine. Grazie alla natura multi-scala delle reti convoluzionali, il detector può riconoscere il pattern anche se l’immagine è stata leggermente rimpicciolita o ingrandita (entro limiti ragionevoli). Inoltre l’eventuale ri-sampling introduce alterazioni graduali, ma non elimina la correlazione statistica del watermark distribuito. Nel design del watermarking sono stati considerati interventi come resize e rotazione: le modifiche vengono inserite in modo da non dipendere da una singola scala o orientamento. Ad esempio, riducendo l’immagine alcune variazioni minime potrebbero attenuarsi, ma altre rimangono presenti in blocchi di pixel, e il detector addestrato su esempi ridimensionati sa ricondurle alla firma originale. Allo stesso modo, una piccola rotazione o trasformazione affine dell’immagine non azzera il pattern, perché quest’ultimo è replicato localmente in molte regioni.

  • Incorporazione dentro un’altra immagine (overlay/composito): anche se l’immagine generata dall’AI viene collocata come parte di un collage o sovrapposta ad altri contenuti, il watermark resta nei pixel originari di quell’immagine. SynthID infatti concepisce la firma come proprietà intrinseca dei pixel generati dal modello AI. Se tali pixel vengono inseriti in un nuovo contesto (ad esempio una foto più grande), il detector può comunque scansionare l’intera immagine e individuare la presenza del pattern caratteristico in quella regione. Il sistema di rilevamento non richiede di isolare perfettamente l’area: basta che una porzione significativa dell’immagine contenga il segnale perché venga segnalata la possibile presenza di contenuto AI. Inoltre, SynthID è in grado di rilevare watermark parziali: se solo una parte dell’immagine è stata generata dall’AI (e quindi watermarked) mentre il resto è originale, il detector può comunque indicare che “parte dell’immagine è probabilmente generata da AI”. In pratica, grazie alla diffusione su tutto il frame, la firma resiste anche quando l’immagine viene utilizzata come sub-elemento di un’altra – purché i pixel watermarked non vengano drasticamente alterati (ad esempio coperti integralmente o sottoposti a filtraggi distruttivi locali).

Oltre a questi casi, test interni suggeriscono che il watermark rimane rilevabile anche dopo screenshots o ri-acquisizioni digitali dell’immagine (ad esempio fotografando lo schermo), indice di una notevole robustezza del segnale inserito. Il metodo è stato pensato per sopportare trasformazioni tipiche della diffusione online: un’immagine generata potrebbe essere scaricata, ricondivisa sui social, modificata con filtri smartphone, ricompressa più volte, ecc. SynthID mira a far sì che la firma “sopravviva” a questa catena di alterazioni comuni. In effetti, nella documentazione si menziona esplicitamente che il watermark è progettato per resistere a operazioni come cropping, aggiunta di filtri, compressione lossy e persino elementi video come cambi di frame rate (per estensione al video). Una conferma ulteriore arriva dal fatto che vengono inserite informazioni in maniera ridondante: la firma digitale è replicata più volte attraverso i dati, creando un pattern statistico diffuso che il detector riconosce anche se una parte viene persa o alterata.

Va sottolineato che, pur essendo molto robusto, SynthID non è infallibile di fronte a manomissioni estreme. Modifiche intenzionali pesanti possono indebolire o distruggere il watermark. Ad esempio, filtri aggressivi (distorsioni di colore molto forti, cambi di contrasto estremi), ricampionamenti drastici, o ri-encoding con parametri estremi (es. compressione fortemente distruttiva, cambi radicali di profilo colore) possono degradare il segnale al punto da rendere difficile la rilevazione. Allo stesso modo, tecniche di attacco dedicate (come aggiunta di rumore avversario mirato a confondere il detector, o sottrazione deliberata del pattern noto) potrebbero in teoria rimuovere la firma se applicate con conoscenza del sistema. Tuttavia, tali manipolazioni tendono anche a danneggiare sensibilmente la qualità visiva o l’integrità dell’immagine. SynthID offre quindi una elevata resilienza contro modifiche ordinarie, pur riconoscendo che un avversario altamente motivato potrebbe trovare modi per eludere il watermark. In ambienti realistici (ritagli, ritocchi, compressioni social media, ecc.) la firma si è dimostrata affidabile e persistente secondo i test condotti da Google.

Conclusione

SynthID rappresenta un approccio avanzato di watermarking invisibile: inserisce una firma impercettibile nei pixel durante la generazione dell’immagine AI, usando tecniche di deep learning per massimizzare la qualità visiva e la robustezza. Il watermark è diffuso in tutto il contenuto e ridondante, così da poter essere riconosciuto dal detector anche dopo operazioni di cropping, resize, filtri o compressioni comuni. L’algoritmo di detection sfrutta pattern latenti e analisi statistiche per riconoscere la “firma digitale” anche quando l’immagine è stata alterata, fornendo un’indicazione probabilistica sull’origine AI del contenuto. Questo equilibrio tra invisibilità e resilienza fa di SynthID una soluzione pionieristica per tracciare la provenienza delle immagini AI senza comprometterne l’estetica.

Riferimenti

Aggiornato: