Datageneratie

Synthetische testdata
op afroep.

Heeft u snel een grote hoeveelheid Synthetische testdata nodig – bijvoorbeeld voor een performance test? Wij kunnen op afroep een set testdata voor u genereren in elk gewenst volume. Alles wat we nodig hebben is een voorbeeldrecord.

Waarom datageneratie?

Soms is het wenselijk om (grote hoeveelheden) Synthetische testdata te hebben. Voor een performancetest bijvoorbeeld: daar is een grote verscheidenheid aan verschillende testgevallen voor nodig. Of denk aan een nieuw product, waarbij testgevallen nodig zijn die nog niet voorkomen in de productieomgeving. In die situaties moet je testdata genereren.

Wat is datageneratie?

Het genereren van synthetische data is iets anders dan het anonimiseren of pseudonimiseren van data. Datageneratie houdt in dat nieuwe, fictieve testgegevens worden aangemaakt. Die fictieve gegevens moeten in alle opzichten voldoen aan de eisen die u eraan stelt, zoals veldlengte, soort en onderlinge relaties.

Productspecificaties Datafactory

• Eenvoudig te implementeren
• Snel uit te rollen (gemiddeld 2 tot 6 weken)
• Lage operationele kosten
• Geanonimiseerde gegevens zijn onherleidbaar (in lijn met eisen vanuit de Wbp en de GDPR)
• Versnelt de development cyclus
• Sluit aan bij agile werken
• Voorkomt de noodzaak van aanhouden van risicokapitaal (zie ook business case)
• Voorkomt de impact van datalekken (boetes en reputatieschade)
• Geanonimiseerde gegevens zijn breed inzetbaar (Test, Analyse, Opleiding, Demo, Ondersteuning, Outsourcing etc.)

• Consistent anonimiseren over tijd zonder gebruikmaking van een ‘vertaaltabel’
• Consistent anonimiseren van een gehele keten
• Behoud van relevante relaties (indien gewenst)
• Geografische spreiding van relaties blijft intact (indien gewenst)
• Leeftijden blijven ongewijzigd (indien gewenst)
• Gegenereerde gegevens voldoen aan data specifieke regels (bijvoorbeeld de 11-proef)
• Datakwaliteit blijft ongewijzigd
• Geanonimiseerde data is eenvoudig te onderscheiden van productiegegevens

• Volledig database onafhankelijk
• Eenvoudig schaalbaar
• Hoge performance
• Cross platform
• Minimale beheersinspanning
• Eenvoudige integratie met CI
• Ondersteunt grote datasets
• Anonimiseren gebeurt volledig in-memory
• Mogelijkheid om eigen maskeerregels toe te voegen
• Standaard voorzien van ruim 10 mogelijkheden om gegevens te anonimiseren

Onze oplossing

EntrD heeft een oplossing ontwikkeld waarmee wij u op afroep kunnen
voorzien van een gegenereerde dataset. Deze dataset wordt specifiek voor u samengesteld en voldoet zowel qua lay-out als qua inhoud volledig aan uw wensen. Op basis van een door u aangeleverd voorbeeldrecord kunnen wij elk volume aan data voor u genereren. Dit kan snel: in de regel kost het niet meer dan een paar dagen. U ontvangt de gegenereerde testset elektronisch en kunt hem direct gebruiken in willekeurig welke testomgeving.