De eerste kennismaking met je net opgeleverde dataplatform, de dashboards, de grafieken en het gehele overzicht over alle digitale gegevens is magisch. Elke dag nieuwe dingen ontdekken in de data en collega’s verrassen met nieuwe analyses en inzichten die eerst niet mogelijk waren. Het blijft een mooie ontdekkingstocht in een wonderlijke, digitale omgeving.
Voorjaars-data-schoonmaak
Wat ik vervolgens in de praktijk zie, is dat het onderhoud aan de data uitgesteld en/of onderschat wordt. In de tijd waarin de ontwikkeling van digitalisering van de ruimte een duidelijke vlucht neemt en waarin de techniek vooruit snelt om dit mogelijk te maken, blijft het ook belangrijk om na te denken hoe je dit mooie systeem gaat onderhouden. Niet gefocust op de techniek, dat regelt de techniek grotendeels zelf wel. Nee, qua vulling van de onderliggende data.
Dataplatformen kenmerken zich nu eenmaal door een grote verscheidenheid aan databronnen die met elkaar nieuwe inzichten geven. Dat betekent ook dat de aangeleverde data of de databronnen zelf actueel moeten blijven, want niets is zo vervelend als bijvoorbeeld recente huisvestingscijfers te moeten combineren met bodemonderzoeksgegevens uit 2012, omdat die laatste niet meer zijn bijgewerkt sinds de initiële upload naar het platform.
Bij de stappen richting een dataplatform is in mijn ogen naast de techniek en inventarisatie van databronnen ook een doorkijk naar het onderhoud van de data essentieel. Dat vraagt een eigen proces dat met enige regelmaat kijkt naar alle databronnen. Een eenvoudig 7-staps-plan van Stephanie Shen geeft een paar basiscriteria en die ik heb uitgebreid met een blik op de toekomst:
- Is de data nog relevant en actueel? Zo niet, bewaar de data in een opslag en verwijder deze uit het actieve deel van het dataplatform.
- Is deze nog accuraat, samenhangend en compleet? Zo niet, bekijk de mogelijkheden om de laatste wijzigingen van de omgeving weer te vangen in de data.
- Is er al een beter alternatief? Zo ja, onderzoek de mogelijkheid om over te stappen naar dat alternatief.
- Zijn er nieuwe wensen vanuit wetgeving of beleid? Zo ja, onderzoek hoe die wensen ingevuld kunnen worden met bestaande data en/of nieuwe databronnen.
De techniek staat het ons toe om telkens eenvoudig nieuwe databronnen toe te voegen, oude te verwijderen, bestaande aan te passen en onderling met elkaar te verbinden. Dat komt technisch wel goed. Het is vervolgens de eigen verantwoordelijkheid en doorzettingsvermogen om de data vervolgens actueel, relevant en nuttig te houden. Daarmee blijft het dataplatform de plek om telkens weer verbaasd te worden door de data in een dashboard of grafiek.
Wanneer start jij met de Voorjaars-data-schoonmaak?
Reactie toevoegen