2 Open data: de basis

2.1 Basisbegrippen

In dit eerste deel lichten we kort enkele basisbegrippen toe. Deze begrippen worden later nog verder uitgediept.

2.1.1 Data

In dit handboek slaat de term ‘data’ op gegevens die door, over of in de gemeentelijke organisatie gemeten, verzameld of gegenereerd worden.

Het kan gaan om allerhande GIS-data of data in verband met het openbaar domein. Denk aan locaties van scholen, afvalcontainers, speelpleinen, straatmeubilair, innames openbaar domein, musea en bezienswaardigheden, parking, openbare toiletten, wifi-locaties, een bomeninventaris enzovoort. Het kan ook gaan om gegevens in verband met de werking van de overheid. Voorbeelden hiervan zijn openingsuren, het dienstenaanbod, collegebesluiten, opleidingen, drukte aan de loketten of in de bibliotheken enzovoort. Ten derde zijn er ook statistische gegevens zoals demografische samenstelling of real-time gegevens die via camera’s, sensoren of ‘offline’ methoden gecapteerd worden. Dit kan gaan om passantentellingen, mobiliteitsstromen, gebruik van vervoersmodi enzovoort.

We maken een onderscheid naargelang wie de data verzamelt of de opdracht geeft tot verzamelen:

  1. 1. Gegevens verzameld door de overheid, geregeld volgens het Bestuursdecreet (2018) en diens definitie van ‘bestuursdocumenten’;
  2. 2. Gegevens verzameld in opdracht van de stad waarvan het eigenaarschap, het gebruik en de wijze van delen geregeld worden via concessies, lastenboeken, contracten etc.;
  3. 3. Gegevens verzameld door (private) partijen buiten de controle van de stad, waarvoor men op zoek gaat naar samenwerking.

Vooral bij de tweede categorie zijn er vandaag een aantal belangrijke uitdagingen die we in dit handboek behandelen.

2.1.2 Open Data

Voor ‘open data’ hanteren we de definitie van http://opendefinition.org: gegevens die vrij toegankelijk zijn en die gebruikt, verwerkt en gedeeld mogen worden door eenieder en voor elk doel.

Bepaalde types data zullen nooit open zijn, zoals persoonsgegevens of privacygevoelige data, of data waarvan de ontsluiting bestaande regelgeving zou overtreden (zie paragraaf 2.2.2).

2.1.3 Linked Open Data

Een van de principes van open data houdt in om data zo dicht mogelijk bij de bron (bijvoorbeeld op de website van de gemeente) en dus decentraal te publiceren. ‘Linked data’ is een krachtige technologie om dit mogelijk te maken en wel op een zeer schaalbare en kostenefficiënte manier. We spreken over ‘linked open data’ wanneer gepubliceerde open data ook gekoppeld worden aan andere data via het web1. Door dezelfde domeinmodellen en identificatoren (zie verder) te gebruiken kan je sneller verbanden zien tussen verschillende gegevens en kan je data in een bredere context plaatsen. Zo kan je bijvoorbeeld het gebruik van een fietsdeelsysteem in een stad eenvoudig koppelen aan het weerbericht, of het energiegebruik aan een officiële adressenlijst.

Linked open data publiceer je op basis van vijf ‘interoperabiliteitslagen’. Deze lagen worden omschreven aan de hand van minimale technische afspraken: juridisch, technisch, syntactisch, semantisch en querying. In hoofdstuk 4 gaan we dieper in op het concept van linked open data.

2.2 De filosofie achter open data

2.2.1 Waar komen open data vandaan?

“Hoe ver woon jij van de dichtstbijzijnde supermarkt die op zondag open is?”

Wat een eenvoudige vraag lijkt voor een mens, is een enorm moeilijke vraag voor een computer. Het is geen wiskundig probleem, maar eerder een uitdaging voor een ‘machine’ om te achterhalen welke gegevens (of ‘data’) ze kan gebruiken om de vraag op te lossen. De vereiste data zijn vaak niet publiek beschikbaar. Nochtans wil een winkel haar openingsuren maximaal verspreiden, wil de wegbeheerder aan iedereen laten weten waar de wegen liggen, wil een openbaarvervoersbedrijf bekendmaken dat er een tram stopt in de buurt van jouw supermarkt enzovoort. Wie doet wat in dit verhaal? Waarom zouden we het doen en op welke manier pakken we dit het best aan? Dat zijn de vragen waarop we een antwoord zoeken onder de noemer ‘open data’.
Het lijkt misschien vanzelfsprekend dat data die je als overheid openstelt voor het brede publiek, een grote economische meerwaarde kunnen hebben, bijna als een onuitputtelijke ruwe grondstof. Makkelijk herbruikbare data laten iedereen toe om nieuwe diensten te bouwen, innovatieve apps te maken, interessante visualisaties te creëren enzovoort. Deze nieuwe toepassingen kunnen commercieel van aard zijn, een publieke taak vervullen of beiden. Denk bijvoorbeeld aan een app waarmee je een digitaal toegangskaartje voor een evenement in je stad kunt kopen, of een website van de overheid die je op basis van luchtfoto’s inzicht geeft over de isolatie van je dak. Voornamelijk commerciële bedrijven erkennen steeds meer de waarde van data en proberen nieuwe businessmodellen uit te bouwen op basis van de verzameling, verwerking, verrijking en verkoop van data. Dit noemt men de ‘data economy’. Vaak kijkt men in eerste instantie naar de overheid als voornaamste betrokken partij: de verschillende overheden beschikken immers over een schat aan informatie over heel wat aspecten van ons leven. Het gaat dan om persoonsgegevens (deze zijn echter nooit het onderwerp van open data – zie verder), maar ook omgevingsinformatie: registers van adressen, gebouwen, nutsvoorzieningen, dienstverlening, straatmeubilair, mobiliteitsdata, weersinformatie enzovoort. Als een overheid deze informatie op een gestructureerde en gereguleerde manier kan delen met anderen, is de potentiële meerwaarde van deze data enorm.
Weliswaar vormt deze doelstelling een bijzonder complexe uitdaging. Hergebruik van een gratis beschikbare dataset brengt namelijk ook kosten met zich mee. Voor een eenmalige hackathon kan je tamelijk eenvoudig een prototype maken met een dataset, maar datasets duurzaam verbinden met interne systemen vraagt tijd en jarenlang onderhoud. Als je datasets publiceert aan een lage kwaliteit, kan een hergebruiker moeilijker zo’n duurzame koppeling opzetten. De onderhoudskosten vergroten, terwijl de meerwaarde voor de hergebruiker identiek blijft. Er duiken dus snel heel wat complexe vragen op, wanneer je als overheid open data wil publiceren. Dit boek wil een aantal kapstokken aanreiken voor lokale besturen om op een impactvolle en duurzame manier aan open data te beginnen.
Open data publiceren is vandaag nog steeds een moeilijke evenwichtsoefening tussen technologische, economische, organisatorische en maatschappelijke uitdagingen. Wanneer we deze balans toch gevonden hebben, is de return on investment aanzienlijk, gaande van economische meerwaarde, over enorme efficiëntiewinsten in de interne organisatie, tot meer transparantie en burgerparticipatie bij complexe maatschappelijke uitdagingen. Om dit mogelijk te maken moeten organisaties onderling de juiste minimale afspraken maken. Dit hoofdstuk geeft een overzicht van dergelijke goede afspraken.

2.2.2 Twee voorwaarden voor open data

Open data moeten aan twee voorwaarden voldoen: een juridische en een technische voorwaarde.
Data zijn in de striktste zin ‘open’ als er aan een simpele juridische voorwaarde voldaan is, namelijk de toekenning van een open licentie waarbij iedereen zonder uitzondering de data mag downloaden, bewerken2 en verspreiden, al dan niet onder dezelfde licentie en/of met bronvermelding3. Wanneer er geen licentie aan de dataset gekoppeld is, zijn er mogelijk eigendomsrechten gekoppeld aan de dataset (cfr. auteursrecht en de databankwet4).
De Vlaamse Overheid kiest bewust voor open data5. Wanneer een overheidsinstantie een dataset aanmaakt, dan moet ze die automatisch openstellen op het world wide web, tenzij er een goede reden bestaat om dit niet te doen. Dit principe wordt internationaal ‘open by default’ en ‘comply or explain’ genoemd: standaard zijn data publiek beschikbaar en anders moet er een goede reden zijn die toegelicht kan worden. Hierbij moet automatisch een open modellicentie inzake copyright (zie verder) op de dataset geplaatst worden.
Naast een open licentie is ook het technische formaat van de data belangrijk. We spreken over open data als gegevens in een ‘machine-leesbaar’ en open formaat beschikbaar zijn. ‘Machine-leesbaar’ betekent dat het om gestructureerde gegevens gaat, bijvoorbeeld een tabel met gegevens, in plaats van een rapport dat de gegevens tekstueel beschrijft. Een open formaat betekent dat je de gegevens met verschillende programma’s kunt lezen in plaats van één specifiek softwarepakket. Zo is een CSV-bestand een open formaat, maar een Microsoft Excel spreadsheet is dat niet.6

2.3 De visie en ambitie: Het Open Data Charter

2.3.1 Ontstaan van het Open Data Charter

Hoewel er een juridisch kader voor open data bestaat (zie verder), heerst er over het concept vaak verwarring. Men vreest dat er persoonsgegevens of andere gevoelige data gepubliceerd zullen worden, terwijl dit bij open data expliciet niet het geval is. Privacy wordt vaak aangehaald als reden om niet aan open data te doen, maar het gaat eerder om omgevingsdata en nooit om gegevens die het mogelijk maken om individuen te identificeren. Misschien zal er ooit zodanig veel omgevingsinformatie publiek beschikbaar zijn dat het mogelijk wordt om mensen te identificeren, maar dit is vooralsnog een hypothetische situatie. We komen hier later op terug. Daarnaast zijn de voordelen om open data te publiceren soms nog onvoldoende bekend.
Om aan deze en andere bezorgdheden tegemoet te komen, werd in het kader van het Smart Flanders-programma7 (2017-2019) het Open Data Charter8 opgesteld, in samenwerking met de dertien centrumsteden en de Vlaamse Gemeenschapscommissie in Brussel. Het Smart Flanders-programma wil centrumsteden en de VGC ondersteunen bij de uitwerking en implementering van een strategie over open data. Algauw werd duidelijk dat men eerst een set van gezamenlijke principes moest vastleggen, opdat de verschillende betrokken organisaties samen naar dezelfde ambities konden toewerken. De steden startten namelijk niet vanuit eenzelfde maturiteit inzake open data, en de doelstelling van het charter was wel om het ambitieniveau op dezelfde lijn te trekken.
Het charter werd uiteraard niet in een vacuüm opgesteld: er bestaan veel internationale voorbeelden, er is de Europese regelgeving en een aantal lokale besturen hadden al een (beperkte) visie op open data ontwikkeld, zoals Antwerpen en Gent. Bij de uitwerking van het charter werden deze voorbeelden meegenomen en werd er uiteraard rekening gehouden met het Decreet Hergebruik en andere bestaande kaders.
Vervolgens werden er in 2017 drie specifieke co-creatiesessies gehouden om het charter in nauwe samenwerking met de centrumsteden op te stellen. Er waren verschillende feedbackrondes en het charter werd uiteindelijk goedgekeurd door de Smart Flanders-stuurgroep van december 2017. Om het draagvlak te vergroten, werd aan de steden gevraagd om het charter intern te presenteren aan het management en/of beleid. Hiertoe werd op aanzet van één van de centrumsteden een presentatie gemaakt, die gedeeld werd met de andere steden. Het verhaal en belang van het charter moest immers goed geduid worden om geen verkeerde verwachtingen te scheppen. Na dit succesvolle initiatief werd het charter goedgekeurd door de gemeenteraad van elf steden en op het college van twee steden. Dit geeft het charter draagkracht, dankzij de co-creatieve aanpak en de manier waarop de vertegenwoordigers van de centrumsteden het project vastnamen en uitdroegen.
Precies door die gedragenheid via een bottom-up aanpak zag ook de Vlaamse Overheid het potentieel en de waarde van het Open Data Charter. Het Stuurorgaan Vlaams Informatie en ICT-beleid nam het charter aan in mei 2018. Hierdoor gelden de principes van het charter voor de verschillende entiteiten van de Vlaamse Overheid, en zit de visie op open data in heel Vlaanderen op dezelfde lijn.
Het Open Data Charter bevat twintig basisprincipes, die tegelijk de ambitie van de ondertekenende partijen bevatten. Het spreekt een ambitie uit die verder gaat dan de voorzichtige basisprincipes die veelal gehanteerd worden. Het charter gaat bijvoorbeeld ook over de redenen om open data te gebruiken, het belang van een goede interne organisatie, manieren om beter samen te werken met overheden en hergebruikers, en zelfs een aantal technische basisprincipes. In het volgende deel overlopen we de 20 principes van het charter.

2.3.2 De 20 principes van het Open Data Charter

De principes in het Open Data Charter luiden als volgt:

1. Open by default: data die door, in of over de lokale overheid gecapteerd worden, worden standaard als open data ter beschikking gesteld voor hergebruik.
2. Comply or explain: wanneer data niet opengesteld worden, dient er een beargumenteerde verklaring te worden gegeven waarom niet.
3. Only once: gegevens worden slechts één keer verzameld en zo dicht mogelijk bij de bron gepubliceerd (decentraal).
4. Data worden ontsloten in het kader van transparantie en het maximaal stimuleren van hergebruik, zowel niet-commercieel als commercieel.
5. Dialoog met alle partijen die data verzamelen wordt aangemoedigd en actief opgezet, op initiatief van het aanspreekpunt voor open data dat binnen de stad wordt aangeduid.
6. Er wordt ingezet op een goede interne datahygiëne met een databeheer- en datadocumentatiebeleid (via metadatering) als uitgangspunt.
7. Om domeinexpertise te bewaken wordt er op gemikt metadatering ‘zo dicht mogelijk’ bij de originele bron te laten gebeuren.
8. Om tot een goede metadatering en datahygiëne te komen wordt er actief ingezet op opleiding en kennisdeling omtrent open data.
9. Data worden maximaal gestructureerd en gepubliceerd volgens open en machine-leesbare formaten en standaarden.
10. Bij het aanmaken van nieuwe databronnen wordt ingezet op linked open data, zeker voor authentieke bronnen en datasets die veel gedeeld worden (ook tussen overheden).
11. De kwaliteit van de data die ontsloten worden is gelijk aan de kwaliteit die volstaat voor het interne gebruik van de gegevens (binnen de diensten van de stad).
12. Het web wordt gebruikt als primair publicatieplatform en er wordt een decentrale publicatie van data nagestreefd.
13. Er wordt geambieerd de vertraging tussen een meting in de echte wereld en de representatie in de data zo klein mogelijk te houden en relevante historiek ook als open data te publiceren.
14. Om datadeling te automatiseren wordt maximale aansluiting gezocht bij interne en externe initiatieven en wordt samenwerking over bestuurslagen heen actief nagestreefd.
15. Er wordt maximaal ingezet om data (via metadatering) automatisch door te laten stromen naar het Vlaams Open Data Portaal en zo naar het federaal, Europees en eventueel andere open dataportalen.
16. Er wordt gestreefd naar een beperkte set van licenties waaronder data gepubliceerd worden, die open, internationaal bruikbaar en machine-leesbaar zijn.
17. De dialoog met mogelijke hergebruikers van data wordt actief aangegaan.
18. De partijen die data publiceren streven duurzaamheid na en engageren zich om geopende data te onderhouden, minstens zo lang als deze voor intern gebruik beschikbaar moeten zijn.
19. Er wordt in aanbestedingen en bij heronderhandeling van bestaande concessies en overeenkomsten aandacht besteed aan regelingen omtrent open data en er wordt op ingezet om hierrond bewustwording te creëren binnen de relevante diensten.
20. De partijen die dit charter ondertekenen engageren zich ertoe de principes die erin vervat staan uit te dragen binnen hun eigen organisatie (en daarbuiten).

Doorheen dit handboek gaan we dieper in op deze principes. Voor meer achtergrondinformatie over deze principes en wat ze in de praktijk kunnen betekenen, verwijzen we naar het begeleidend document op de website van Smart Flanders.9

2.3.3 Het juridisch kader

We verwezen al eerder naar het juridisch kader dat in een aantal regelingen voor open data voorziet. Er bestaat namelijk een juridisch kader voor de publicatie van overheidsinformatie als open data. Het gaat om een Europese richtlijn, die haar oorsprong kent in 2003 als de “Public Sector Information (PSI) Directive” en die in 2019 vervangen werd door de “Open Data Richtlijn”.10 Deze richtlijn over het hergebruik van overheidsinformatie wil transparantie verhogen en eerlijke concurrentie creëren, om op Europese schaal toepassingen te kunnen bouwen met open overheidsinformatie. De richtlijn bepaalt dat bestuursdocumenten in het kader van een publieke opdracht van een overheidsinstantie maximaal open en machine-leesbare formaten moeten hanteren, een open licentie moeten hebben, en zo ter beschikking gesteld moeten worden voor hergebruik, zowel voor niet-commerciële als commerciële doeleinden. De Vlaamse Overheid heeft haar eigen modellicentie ontwikkeld die bepaald wie de rechten op de data behoudt en wat hergebruikers met de data kunnen doen11.
Overheidsorganisaties die onder het toepassingsgebied van de richtlijn vallen, kunnen ook een vergoeding vragen voor het openstellen van de data, maar deze moet beperkt blijven tot de marginale kosten voor de vermenigvuldiging, verstrekking en verspreiding van de bestuursdocumenten in kwestie. Dus ook over vergoedingen voor open data is een juridische grondslag voorhanden.
Bovenstaande kader duidt op de generieke interpretatie van ‘data’. Soms komt het voor dat er specifieke regelgeving is die bepaald wat lokale besturen kunnen of moeten doen rond specifieke data. Het bekendste voorbeeld is de Europese INSPIRE Richtlijn12 met betrekking rond geo-data en GIS-informatie.
Het juridisch kader over open data is niet overal even goed gekend. Het Open Data Charter herneemt een aantal principes uit dit kader in duidelijke taal. Om op een duurzame manier open data te gebruiken moeten de wetgeving en de onderliggende principes wel gekend zijn bij overheidsorganisaties. Zowel het charter als de wetgeving kunnen een hoop onduidelijkheden en twijfel wegnemen voor alle betrokken partijen. Zo bevat het vernieuwde Bestuursdecreet (2021) een verduidelijking over gegevensuitwisseling (bestuursdocumenten) in een interbestuurlijke context: het gebruik van bestuursdocumenten binnen de overheidsinstantie met andere doeleinden dan de publieke taak, en de uitwisseling tussen overheidsinstanties met het oog op de vervulling van hun publieke taak, worden niet als hergebruik aanzien.

2.3.4 Voorbeeldclausules

Zoals eerder besproken maken we een onderscheid naargelang wie de data verzamelt of wie de opdracht geeft tot verzamelen. Bij data van type 2 (gegevens verzameld in opdracht van de stad waarvan het eigenaarschap, het gebruik en de wijze van delen geregeld worden via concessies, lastenboeken, contracten,…) moet je goede afspraken maken met leveranciers over het eigenaarschap van de data.
In het Smart Flanders-programma kwam men tot de conclusie dat overheden te weinig, onduidelijke of sterk verschillende bepalingen over data opnemen in overeenkomsten met leveranciers. Daarom werd een document opgesteld met voorbeeldclausules die (lokale) overheden kunnen opnemen in bestekken, concessies, contracten en andere overeenkomsten met derde partijen. Dit document is beschikbaar op https://smart.flanders.be/open-data-beleid/voorbeeldclausules en mag door eenieder gebruikt worden, ter inspiratie of om rechtstreeks clausules uit over te nemen. Het document stelt een aantal algemene en technische bepalingen voor, samen met suggesties voor gunningscriteria waarmee je leveranciers kunt beoordelen op hun aanpak aangaande (open) data.
Zo zijn er bepalingen over het eigenaarschap en de toegang tot data, hoe een lokaal bestuur kan oplijsten over welke data het wil beschikken en welke het als open data wil publiceren, of hoe het de aangeleverde data door een externe partij kan laten keuren. Men kan peilen naar de ervaring van een leverancier met open data en gerelateerde open standaarden (zoals OSLO13), en indien van toepassing kan je een aantal technische aspecten opvragen over de implementatie van linked open data. Ook de manier waarop data beschreven worden (metadatering), de publicatie van de data op het Vlaams Open Data Portaal14, of de voorzieningen die een leverancier treft in het kader van de duurzaamheid van de voorgestelde oplossing, zijn beschikbaar in het draaiboek.
Met deze bepalingen streven we naar een meer uniforme aanpak van data bij aanbestedingen. Ten slotte verwijzen we ook naar de website van ITS België,15 waar je specifieke voorbeeldbepalingen met betrekking tot mobiliteitsdata kan terugvinden.
In hoofdstuk 3 bespreken we hoe je als lokaal bestuur start met open data, en werken we de belangrijkste begrippen en onderdelen van het opendataproces verder uit. Op de website van Smart Flanders kan je een uitgebreid document terugvinden met deze clausules.16


Blijf op de hoogte van onze laatste ontwikkelingen en volg ons op de verschillende social media kanalen.