Wordt open data onder- of overgewaardeerd?
Open data speelt geen grote rol bij Business Intelligence (BI) of Data Analytics-implementaties en -programma’s binnen het bedrijfsleven. Waarom niet? Op het web zijn enorme hoeveelheden openbare datasets te vinden, beschikbaar gesteld door voornamelijk publieke organisaties.
Aan de hand van een casestudy proberen we antwoord te geven op de vraag: “Zien bedrijven de waarde van open data over het hoofd of wordt de waarde van open data juist overschat?” Het volgende gebeurt als geregistreerde voertuigen binnen Nederland in kaart worden gebracht.
De behoefte naar informatie
Ten opzichte van de standaard bedrijfsgegevens kan open data waardevolle inzichten bieden in externe factoren die het klantgedrag of de prestaties van je organisatie beïnvloeden. De afgelopen jaren hebben bedrijven tal van essentiële variabelen gevonden in openbare datasets die ze kunnen gebruiken in hun analysemodellen. Door open data op deze manier te gebruiken, kunnen ze verkoopaantallen beter voorspellen (bijv. welke invloed heeft het weer op het aantal klanten) of contextuele informatie opnemen in de dagelijkse bedrijfsrapportages.
Voor deze casestudy wilden we inzicht krijgen in hoe de autosector in Nederland zich de afgelopen tien jaar heeft ontwikkeld.
Open data versus bedrijfsgegevens
Nadat je bedrijf de informatiebehoefte met betrekking tot open data heeft gedefinieerd, kun je starten met het zoeken naar beschikbare bronnen met open data. Zicht hebben op beschikbare bronnen legt de basis voor de zoektocht naar open data. Doordat er zulke grote hoeveelheden openbare datasets beschikbaar zijn is het belangrijk om een duidelijke plan op te stellen om niet te blijven hangen in de onderzoeksfase.
Dit plan bevat een duidelijk strategie die beschrijft naar welke gegevens gezocht wordt, alsook welke databronnen onderzocht zullen worden. Spreek hierbij ook een einddatum van de onderzoeksfase af. Na de onderzoeksfase kunnen de verschillende bronnen en gegevens geanalyseerd worden om te kijken welke de meeste waarde kunnen toevoegen voor je bedrijf. Einddoel is bepalen welke open databronnen geïntegreerd zullen worden in de BI-omgeving.
Op het moment dat er één of meerdere open databronnen geïdentificeerd zijn begint het verzamelen en vervolgens integreren van de data in je bestaande BI-omgeving. Er is echter een belangrijk verschil tussen open data en data uit organisatiesystemen.
In tegenstelling tot de meeste bedrijfsgegevens ontbreekt het open data vaak aan structuur en consistentie. Het uitvoeren van een rigoureuze data kwaliteitscontrole is daarom geen overbodige luxe. Zeker op het moment dat de open data een vast onderdeel van je BI-omgeving wordt is het waardevol om te onderzoeken hoe de open data geautomatiseerd ontsloten kan worden in de BI-omgeving, als ook hoe de data gekoppeld kan worden aan het bestaande gegevenslandschap.
In sommige gevallen zijn de directe voordelen van analyses op basis van open data duidelijker vast te stellen dan in andere gevallen. De praktijk leert echter dat wanneer bedrijfsanalisten en datawetenschappers beschikking hebben tot open data, dit ten goede komt aan de kwaliteit van datagedreven inzichten.
Om de ontwikkeling van de Nederlandse autosector te kunnen kwantificeren, hebben we open data van de Rijksdienst Wegverkeer (RDW) gebruikt. Deze dataset bevat van elk geregistreerd voertuig in Nederland gegevens zoals kenteken, merk en kleur. Met behulp van een script kunnen de gegevens automatisch (opnieuw) worden gedownload, opgeschoond en opgeslagen in een database.
Voor het algemeen belang
Een ander interessant aspect van open data is dat deze gegevens kunnen worden gebruikt voor ‘het algemeen belang’. Zo analyseren we als onderdeel van ons State of the State-programma open data over diverse maatschappelijke thema’s in Nederland. Dankzij het gebruik van open data konden we diverse vragen die van groot belang zijn voor de maatschappij beantwoorden, zoals: “Welk aandeel van het elektriciteitsverbruik in Nederland kan worden opgewekt wanneer het potentieel van zonnepanelen optimaal wordt benut?” En: “Wat gebeurt er op sociaal-economisch gebied (werk en salaris) met mensen die genezen van kanker?” De resultaten van deze data-analyses hebben geleid tot enkele waardevolle maatschappelijke discussies en relevante inzichten voor beleidsmakers en organisaties.
Casestudy: geregistreerde voertuigen in Nederland
De mogelijkheden met open data zijn in feite eindeloos. Om dit te laten zien, hebben we een interactieve infographic gemaakt op basis van de open data van Rijksdienst Wegverkeer (RDW) met informatie over alle voertuigen in Nederland. Deze infographic geeft een beeld van de manier waarop de autosector in Nederland zich de afgelopen tien jaar heeft ontwikkeld wat betreft de verkoop van auto’s van zowel de grootste merken (onder andere Mercedes, Volkswagen) als van opkomende merken zoals Tesla.
Open data: onder- of overgewaardeerd?
Hoewel open data in eerste instantie een lastig concept lijkt, kan een organisatie enorm profiteren van de inzichten die met behulp van open data kunnen worden verkregen. Dankzij open data kun je nauwkeurigere voorspellingen doen en een organisatie creëren die zich laat sturen door inzichten. De casestudy laat zien wat mogelijk is met alleen open data. Wanneer je open data combineert met je bedrijfsgegevens is dit zakelijk gezien uiteraard nog interessanter.
Dit artikel is samen geschreven met Pouya Zarbanoui
Gerelateerd onderzoek
Wat verdien je nu in welke functie? En wat vinden online professionals eigenlijk belangrijk in hun werk?
Salarisonderzoek Online Professionals 2025
Bekijk onderzoeksrapport- 1: Salarissen
- 2: Secundaire arbeidsvoorwaarden
- 3: Werktevredenheid
Plaats een reactie
Uw e-mailadres wordt niet op de site getoond