De belofte van anonimisering

Anonimisering wordt vaak gepresenteerd als een afdoende maatregel om te voorkomen dat gevoelige data wordt blootgesteld bij AI-analyse. De redenering: als namen, BSN-nummers en andere identificerende kenmerken worden verwijderd, verliest de data haar gevoelig karakter en kan zij veilig worden verwerkt via externe platformen.

Dit is een begrijpelijke redenering. Maar voor strafdossiers en juridische documentanalyse is zij onvoldoende.

Drie structurele beperkingen van anonimisering

1. Re-identificatierisico

Anonimisering elimineert identificeerbare gegevens — maar strafdossiers bevatten doorgaans zoveel contextinformatie (tijdlijnen, locaties, specifieke gebeurtenissen) dat re-identificatie met aanvullende bronnen realistisch mogelijk blijft. Dit is een erkend fenomeen in de datawetenschappelijke literatuur en wordt door de ENISA ook als risico benoemd in haar pseudonimiseringsrichtlijnen.

2. Juridische waarde van het origineel

In een strafrechtelijke context is de authenticiteit van het bronmateriaal essentieel. Wanneer analyse plaatsvindt op een bewerkte, geanonimiseerde kopie, rijst de vraag of de resultaten juridisch verbonden kunnen worden aan het originele bewijsmateriaal. Dit is geen theoretisch risico: het ondermijnt de forensische traceerbaarheid die in een strafprocedure vereist is.

3. Overdracht naar externe omgevingen blijft bestaan

Anonimisering reduceert het risico van data-exposure, maar elimineert het niet. Data — ook geanonimiseerde data — wordt nog steeds overgedragen aan en verwerkt door een externe partij. De verwerkingsomgeving, de logbestanden, de infrastructuur: die vallen buiten de controle van de advocaat.

De CSAD-aanpak: isolatie als architectuurprincipe

CyberSecurity AD kiest niet voor anonimisering als primaire beveiligingsmaatregel. In plaats daarvan is de beveiligingsstrategie gebaseerd op isolatie van de verwerkingsomgeving.

Dit betekent:

  • Dossierdata wordt nimmer overgedragen aan externe systemen of cloudomgevingen
  • De AI-modellen draaien lokaal binnen de afgeschermde infrastructuur van CSAD
  • Er is geen dataoverdracht die beheerst moet worden — de omgeving zelf voorkomt blootstelling structureel
  • Het originele bronmateriaal blijft intact; de analyse werkt op het origineel, niet op een bewerkte kopie

Implicaties voor forensische integriteit

Dit architectuurkeuze heeft directe implicaties voor forensische integriteit:

Authenticiteit: de analyse is uitgevoerd op het ongewijzigde originele document, niet op een bewerkte versie. Dit versterkt de juridische verdedigbaarheid van de analyseresultaten.

Herleidbaarheid: iedere analysestap is gekoppeld aan een specifieke inputversie en een gedocumenteerde modelversie. Er is geen bewerkingsstap die de keten doorbreekt.

Verifieerbaarheid: het auditspoor is integraal onderdeel van de output, niet een naderhand toegevoegde administratie.

Conclusie

Anonimisering is een nuttige techniek voor bepaalde toepassingen — maar als primaire beveiligingsstrategie voor forensische AI-analyse in strafrechtelijke context volstaat zij niet. De fundamentele kwetsbaarheden (re-identificatierisico, aantasting van authenticiteitsketen, persistente externe verwerking) worden niet geëlimineerd, alleen verminderd.

Isolatie van de verwerkingsomgeving lost deze problemen structureel op. Dat is de keuze achter CSAD.

P.W. Oldenburger
Oprichter, CyberSecurity AD
Over de auteur →