Data het nieuwe goud of een loden last?

Geplaatst door CorporatieMedia op
 

‘Data is het nieuwe goud’, een uitspraak uit een uitzending van Zembla over de waarde van data. Nieuwe technologie maakt het mogelijk om inzichten uit data te halen die voorheen onmogelijk waren. Denk aan predictive analytics en aan BI-toepassingen. Randvoorwaardelijk voor al deze zaken is de beschikbaarheid van bruikbare en betrouwbare data. 

Cruciaal is hierbij wel dat de data ook veilig gebruikt kan worden. Niet alleen vanwege privacywetgeving zoals de AVG, maar vooral om reputatieschade te voorkomen. Emerce heeft bijvoorbeeld onderzocht dat 50% van alle mensen online aankopen uitstelt als ze zich zorgen maken over hun privacy. Dit raakt dan vooral online retailers, maar voor andere sectoren geldt onverkort dat mensen hun privacy belangrijk vinden. 

Het maskeren van data is een veelgebruikte techniek waarmee data zo bewerkt wordt dat de privacy gewaarborgd blijft terwijl de data nog steeds bruikbaar is. Dit werkt uitstekend voor data die in een database opgeslagen zit. Maar hoe zit het dan met data in documenten en dossiers? Een vraag die alleen maar relevanter wordt als je weet dat volgens Gartner 80% van alle data in documenten zit. Dus als je je alleen richt op het maskeren van de data in een database, dan heb je maar 20% van het probleem opgelost… 

Het maskeren van documenten en dossiers is in het verleden echter een grote uitdaging gebleken omdat deze data ongestructureerd is. Met andere woorden, je weet van tevoren niet welke gegevens een document of dossier bevat en je weet ook niet waar ze staan. Dit is een fundamenteel verschil met data in een database. Aan de hand van het datamodel weet je daar welke gegevens opgeslagen worden en waar ze staan. Het consistent maskeren van die gegevens is dan nog steeds een grote uitdaging, maar dit is al langer mogelijk.

Maar het maskeren van documenten en dossiers gebeurde eigenlijk altijd nog handmatig. Denk maar eens aan een willekeurig dossier dat publiek gemaakt wordt na een WOB aanvraag. Die dossiers bevatten altijd met een zwarte viltstift onleesbaar gemaakte passages. Erg arbeidsintensief en erg foutgevoelig. En met de aanstaande invoering van de WOO wordt dit probleem alleen maar groter.

Als EntrD hebben we daarom 2 jaar geleden naast de DataFactory waarmee databases gemaskeerd kunnen worden, de FileFactory ontwikkeld. Met de FileFactory ondersteunen we organisaties bij het geautomatiseerd opschonen van alle documenten. In eerste instantie deden we dit alleen in projectvorm waarbij we grote aantallen aan historische documenten opschoonden, maar al snel werd de FileFactory breder ingezet. Immers, data opschonen is geen eenmalige exercitie. Elke dag komen 

Samenvattend, het maskeren van documenten en dossiers is tegenwoordig steeds beter mogelijk. Als je als organisatie zoekt naar gelijkheden om waarde uit je data te halen, immers data is het nieuwe goud, dan is veilig gebruik van data een groot aandachtspunt. Realiseer je dan dat 90% van alle gegevens in een document of in een dossier zit en zorg dat deze gegevens gemaskeerd worden zodat je ze veilig kunt gebruiken. Doordat de omvang van het aantal documenten exponentieel toeneemt, kun je dit niet langer negeren. Je zult dus actief moeten gaan zoeken naar manieren/ oplossingen die je ondersteunen om documenten op te schonen. Doe je dit niet, dan is data geen goud meer maar een loden last… 

Bron: EntrD, Foto: EntrD