En hård nød at knække: Slettepolitikker og ustruktureret data

Slettepolitikkens største udfordring

Opbevarings- og slettepolitikker har vundet indpas og er i vid udstrækning håndhævet for struktureret data, dvs. den data, der typisk findes i databaser i tabulær form.

Man kan let lokalisere hvor ens databaser er og hvor i databaserne de personhenførbare data skal findes, helt ned på celleniveau. Det gør det forholdsvis ukompliceret at efterleve slettepolitikken.

Ustruktureret data, dvs. den data der findes i brødtekst og billeder, ofte i PDF og Word-dokumenter, er en helt anden størrelse. I en database er det på forhånd defineret hvad den skal indeholde; samme fordel har man ikke med et dokument. Her kan man ikke regne ud, hvad det indeholder og hvor de personhenførbare oplysninger står.

Det gør det svært at lokalisere dokumenter med personhenførbar information, men også hvad der skal slettes.

Data er det nye guld

Når man så har fundet de dokumenter, hvori den personhenførbare information skal slettes, så er første greb desværre ofte at slette hele dokumentet. Øv!

Det betyder at den vigtige viden går tabt for altid. Den kunne have været brug til sekundære formål, så som:

  • Analytics / Business Intelligence
  • Test data til softwareudvikling
  • Machine learning / AI
  • Registersammenkøring
  • Oplæring af nye medarbejdere
  • Vidensbase

Anonymisering er sletning

En ofte overset mulighed er dog, at man i stedet for sletning af hele dokumentet, blot anonymiserer det.

Faktisk så svarer anonymisering til sletning i GDPR-sammenhæng! 

Det vigtigste er at anonymiseringen er irreversibel, dvs. ikke kan genskabes. Man må f.eks. ikke beholde en kopi af originalen eller opbevare separate navnelister – i så fald har man kun lavet pseudonymisering.

Læs mere om dette her.

Et godt værktøj er nødvendigt

Det er jo let at påstå, at man “bare” kan anonymisere i stedet for at slette hele dokumentet. Det stiller jo nogle ret store tekniske krav.

Med Antes program AnteRedact, har vi netop gjort det nemt at anonymisere dokumenter. Det indeholder alle de værktøjer der er brug for, for at gøre det både hurtigt og sikkert at redigere og anonymisere PDF:

  • Automatisk genkendelse af persondata, endda på dansk
  • Alias-funktion
  • Find og erstat
  • OCR til scannede dokumenter
  • Lokalt program uden behov for databehandleraftale
 
Få et tilbud på AnteRedact her.

Theis Rasmussen

CEO & Co-Founder

Cand. jur.