Voor de Omgevingsdienst Haaglanden hebben we in samenwerking een pilot uitgevoerd voor het metadateren van documenten met behulp van AI. Dit heeft gelijd tot een applicatie die door de klant gebruikt is voor het analyseren van meer dan 500.000 documenten. De applicatie analyseert documenten, classificeert ze en haalt er een veelheid aan gegevens uit. Door slimme toepassing van kunstmatige intelligentie en machine learning doet de applicatie dat werk steeds slimmer en beter en kunnen de werknemers met andere taken aan de slag.
Compliancy
De applicatie helpt bij actieve openbaarmaking van overheidsinformatie volgens de Wet open overheid (Woo). Bestuursorganen moeten bepaalde categorieën informatie verplicht actief openbaar maken via het Platform Open Overheidsinformatie (PLOOI). Daarbij gelden twee belangrijke aandachtspunten: het document moet voorzien zijn van de bedoelde metadata én het document moet geanonimiseerd zijn, oftewel ontdaan zijn van gevoelige informatie. Enerzijds zoekt en vindt de applicatie de metadata in en over het document en anderzijds zoekt en behandelt de applicatie gevoelige informatie.
Basisfuncties
De applicatie voorziet in hoofdzaak in de volgende functies:
- Documenten laten typeren volgens het voor uw organisatie geldende document structuur plan of een andere classificatie;
- Documenten voorzien van aanvullende relevante contextuele metadata die ten tijde van het opstellen of ontvangen van het document nog niet beschikbaar of relevant waren;
Lerend karakter
De applicatie leert steeds bij. Dat gebeurt in twee stappen. Bij initiële installatie is een AI model getraind voor de geldende documenttypen en de bekende gegevens. Tijdens de gebruiksfase nemen de medewerkers het over en trainen het AI model tijdens het dagelijks gebruik. Zo verfijnen zij het resultaat en leert het AI model verder op het beter herkennen van documenttypen en vinden van de juiste metadata.
Werkwijze
Met de applicatie wordt een digitaal document herkent als een bepaald type.
- Via de webinterface waarbij de gebruiker één of een set van meerdere digitale documenten aanbiedt;
- Via de webservice waardoor integratie met andere systemen mogelijk is (voor bijvoorbeeld koppeling op binnenkomende digitale post of als slimme vervolgstap aan het einde van de scanstraat).
Vervolgens wordt op basis van het gevonden documenttype de relevante contextinformatie gezocht:
- Via de webinterface presenteren;
- Als metadata-file uiteraard mét verbinding met het oorspronkelijke document voor download beschikbaar stellen;
- Als response op een webservice-aanroep terugleveren.
Voorbeeld: van een document dat herkend is als van het documenttype ‘Milieuvergunning’ kunnen de metadata ‘bevoegd gezag’, ‘datum afgifte’ en ‘locatie-duiding’ en 'auteur' gevonden worden.