DataMasking

Datamasking is snel,
veilig en representatief.

Snel een geanonimiseerde dataset creëren die representatief is voor de oorspronkelijke persoonsgegevens.
 De data zijn niet meer herleidbaar tot unieke personen, maar geven wel betrouwbare test- of analyseresultaten.

datamasking, data maskeren

Wat is datamasking?

Vrijwel elke organisatie doet er alles aan om persoonsgegevens te beveiligen tegen hackers en andere criminelen. De ‘voordeur’ is stevig op slot. Maar er is ook een achterdeur en die staat soms wijd open. Databases met persoonsgegevens worden gekopieerd voor analyse, of om er software mee te testen. Daar liggen de datalekken op de loer. Datamasking is een methode om productiedata te anonimiseren of te pseudonimiseren, zodat de data niet meer te herleiden is tot unieke natuurlijke personen. Tegelijkertijd blijft de representativiteit van de gegevens in stand.

De 5 principes van datamasking

Er mag dus geen manier zijn om de privacy gevoelige gegevens zichtbaar te maken.

Dat wil zeggen dat de data echt lijken op de productiebestanden en dus goed bruikbaar zijn voor ontwikkelings- en testdoeleinden. Bovendien moeten goed gemaskeerde data je in staat stellen om de trends die de brondata bevat nog steeds te analyseren.

Bijvoorbeeld: een rekeningnummer dat onherleidbaar is na maskering moet in alle voorkomende gevallen van dat nummer in een bepaalde periode de gelijke gemaskeerde waarde krijgen.

Je kunt bijvoorbeeld in een medisch dossier wel het patiënt-ID verwijderen, maar als aan de hand van een unieke, eenmalige gebruikte behandelcode, de patiënt toch weer kan worden achterhaald, dan moet je deze behandelcode ook maskeren.

Want ontwikkel- en testgegevens moeten steeds zo dicht mogelijk bij de alsmaar veranderende productiedata blijven. Alleen zo blijven je softwaretests echt realistisch. Ook data analyses worden herhaaldelijk uitgevoerd en vergen soms dagelijks een afslag van de actuele data. Een geautomatiseerd maskeringsproces is efficiënt, goedkoper en veel effectiever.


datamasking, pseudonimiseren

Pseudonimiseren

Als het wenselijk is om gegevens weer herleidbaar te kunnen maken, is pseudonimiseren een betere optie. Ook dat kan met datamasking. In dat geval worden alle namen vervangen door een vastgestelde naam volgens een bepaalde regel. Dit kan bijvoorbeeld nuttig zijn bij medische analyses, waarbij soms een arts gewaarschuwd moet worden over een individueel geval.


datamasking, anonimiseren

Anonimiseren

Met datamasking kun je zowel pseudonimiseren als anonimiseren. Anonimiseren gebeurt door persoonsgegevens door elkaar te husselen volgens regels die de gebruiker zelf ingeeft. Bijvoorbeeld door alle namen te verwisselen. Met regels worden bijvoorbeeld gezinnen bij elkaar gehouden, of blijven postcodes in stand voor een geografische analyse. Anonimiseren is onomkeerbaar.

Productspecificaties Datamasking

• Eenvoudig te implementeren
• Snel uit te rollen (gemiddeld 2 tot 6 weken)
• Lage operationele kosten
• Geanonimiseerde gegevens zijn onherleidbaar (in lijn met eisen vanuit de Wbp en de GDPR)
• Versnelt de development cyclus
• Sluit aan bij agile werken
• Voorkomt de noodzaak van aanhouden van risicokapitaal (zie ook business case)
• Voorkomt de impact van datalekken (boetes en reputatieschade)
• Geanonimiseerde gegevens zijn breed inzetbaar (Test, Analyse, Opleiding, Demo, Ondersteuning, Outsourcing etc.)

• Consistent anonimiseren over tijd zonder gebruikmaking van een ‘vertaaltabel’
• Consistent anonimiseren van een gehele keten
• Behoud van relevante relaties (indien gewenst)
• Geografische spreiding van relaties blijft intact (indien gewenst)
• Leeftijden blijven ongewijzigd (indien gewenst)
• Gegenereerde gegevens voldoen aan data specifieke regels (bijvoorbeeld de 11-proef)
• Datakwaliteit blijft ongewijzigd
• Geanonimiseerde data is eenvoudig te onderscheiden van productiegegevens

• Volledig database onafhankelijk
• Eenvoudig schaalbaar
• Hoge performance
• Cross platform
• Minimale beheersinspanning
• Eenvoudige integratie met CI
• Ondersteunt grote datasets
• Anonimiseren gebeurt volledig in-memory
• Mogelijkheid om eigen maskeerregels toe te voegen
• Standaard voorzien van ruim 10 mogelijkheden om gegevens te anonimiseren

Onze oplossing

 

De DataFactory is onze volledig geautomatiseerde oplossing om elk type database en elke applicatie snel en eenvoudig te maskeren. Deze gemaskeerde gegevens kunnen daarna veilig gebruikt worden buiten de productieomgeving.