Content is King

Content is King

In het Engels klinkt het zo makkelijk, ‘content is king’.

Of in goed Nederlands, ‘het gaat om de inhoud’. Maar hoe zit dat met de inhoud van documenten? Hoe zorg je ervoor dat de inhoud van een document de vervolgactie bepaalt? In deze blog willen we jullie meenemen naar een nieuwe manier waarbij het daadwerkelijk om de inhoud gaat.

Saas-oplossing

Een kleine 3 jaar geleden lanceerde EntrD de FileFactory, een in eigen beheer ontwikkelde SaaS-oplossing om in documenten ongewenste gegevens te zoeken en weg te halen. Veel corporaties worstelden namelijk met het feit dat ze in het verleden vaak documenten opgeslagen hadden waarin gegevens zaten die ze niet mochten verwerken. Maar het hele document weggooien voelt alsof je het kind met het badwater weg zou gooien. Een bijkomend probleem was bovendien dat niet bekend was wáár in die miljoenen documenten de ongewenste gegevens zaten. Met de FileFactory beschikten zij opeens over een oplossing om geautomatiseerd het hele archief te doorzoeken en op te schonen. In de praktijk bleek dit uitstekend te werken. Bij veel corporaties hebben we de FileFactory ingezet om ongewenste gegevens zoals BSN of kopie ID weg te halen uit documenten in het digitale archief.

Structureel inzetbaar

Vrij snel daarna kwam de vraag of de FileFactory ook structureel ingezet kon worden om alle binnenkomende documenten te gaan controleren. Hiermee werd het mogelijk om direct bij binnenkomst alle ongewenste gegevens te verwijderen en het archief schoon te houden. De FileFactory is hierop uitgebreid met een ‘agent’, die als een soort robot de locatie monitort waar de nieuwe documenten binnenkomen. Sindsdien gebruiken steeds meer corporaties de FileFactory structureel om hun digitale archief schoon te houden.

Classificeren inhoud e-mails

In dat proces kwam echter een nieuwe vraag op en die willen we hier met jullie delen: zou je op basis van de inhoud van binnenkomende e-mails en hun bijlages, een vervolgproces kunnen starten?

Met andere woorden, kun je een mailtje aan de hand van de inhoud ‘classificeren’ als zijnde een mailtje van type A en daarbij hoort bijvoorbeeld vervolgproces B.

Het achterliggende idee hierbij is dat de onderwerpregel van een mailtje vaak multi-interpretabel is. Dus simpelweg op basis van de onderwerpregel een keuze maken, is te beperkt en te foutgevoelig. Maar als je in plaats daarvan naar de gehele inhoud inclusief de inhoud van de bijlages zou kijken, dan kun je met een veel grotere zekerheid bepalen waar het mailtje over gaat. Vaak is dit nu iets wat door medewerkers gebeurt, dit is tijdrovend, foutgevoelig en kostbaar.

De basis van de FileFactory lijkt zich goed te lenen voor het automatiseren van dit proces. Immers, de FileFactory doorzoekt een document en kijkt daarbij naar de inhoud. Door van tevoren limitatief te bepalen wat combinaties van woorden zijn die horen bij een classificatie van type A (dit mailtje gaat over een huuropzegging bijvoorbeeld), zou de FileFactory in staat moeten zijn om mailtjes te classificeren. Hij zoekt dan naar de opgegeven combinatie van woorden en geeft het mailtje dan de bijbehorende classificatie.

De classificatie kan dan opgepakt worden door het ERP systeem om daarmee een vervolgproces te starten. Dus als een mailtje dat op basis van de inhoud blijkt te gaan om een huuropzegging, dan wordt automatisch het opzeggingsproces gestart.

Maar dat is de theorie, om te toetsen of dit ook in de praktijk zo werkt, gaan we de komende periode dit samen met een aantal partijen onderzoeken. We verwachten dat deze proef rond de zomer klaar is en dan weten we of het gelukt is. En als dit lukt, dan hebben woningcorporaties een nieuwe tool in handen om het werkproces efficiënter te maken zodat sociale woningbouw betaalbaar kan blijven!

‘Content is King’