Wat zijn Open Data?

Op deze pagina wordt een algemene introductie gegeven rond open data. Wat is de filosofie achter het concept, wat zijn de basisprincipes en hoe ziet het juridisch kader eruit?

De filosofie achter open data

“Hoe ver woon jij van de dichtstbijzijnde supermarkt die op zondag open is?”

Wat een eenvoudige vraag lijkt voor een mens, is een enorm moeilijke vraag voor een computer. Het is geen wiskundig probleem, maar eerder een uitdaging voor een ‘machine’ om te weten welke gegevens (of ‘data’) gebruikt kunnen worden om deze vraag op te lossen. Helaas zijn deze data vaak niet publiek beschikbaar. Nochtans wil een winkel zijn openingsuren zo maximaal mogelijk verspreiden, wil een overheid die de wegen beheert aan iedereen laten weten waar die wegen liggen, en wil een openbaarvervoersbedrijf bekendmaken dat er een tram is die stopt in de buurt van jouw supermarkt, enzovoort. Wie doet wat in dit verhaal? Waarom zouden we het doen en op welke manier pakken we dit het best aan? Dat zijn de vragen waar we onder de noemer ‘open data’ een antwoord op zoeken.

Het lijkt misschien vanzelfsprekend dat data die opengesteld worden voor het brede publiek een grote economische meerwaarde kunnen hebben, bijna als een onuitputtelijke ruwe grondstof. Makkelijk herbruikbare data laten iedereen toe om nieuwe diensten te bouwen, innovatieve apps te maken, interessante visualisaties te creëren enzovoort. Deze nieuwe toepassingen kunnen commercieel van aard zijn of een publieke taak vervullen (of een mix van beide): denk aan de ene kant aan een app die je makkelijk een digitaal toegangskaartje voor een evenement in je stad laat kopen, of een website van de overheid die je op basis van luchtfoto’s inzicht geeft over de isolatie van je dak. Voornamelijk commerciële bedrijven zien meer en meer de waarde van data in en proberen nieuwe businessmodellen uit te bouwen op basis van de verzameling, verwerking, verrijking en verkoop van data. Hier wordt ook naar verwezen met de term ‘data economy’.

Vaak wordt dan in eerste instantie gekeken naar de overheid als voornaamste betrokken partij: de verschillende overheden beschikken immers over een schat aan informatie, data, over heel wat aspecten van ons leven. Het gaat dan zowel om persoonsgegevens (nooit het onderwerp van open data – zie een volgende pagina) als om een hoop omgevingsinformatie: registers van adressen, gebouwen, nutsvoorzieningen, dienstverlening, straatmeubilair, mobiliteitsdata, weersinformatie en ga zo maar door. De potentiële meerwaarde van het delen van deze informatie met anderen, op een gestructureerde manier en volgens duidelijke afspraken, is enorm.

Maar het is ook een zeer complexe uitdaging om deze meerwaarde te realiseren. We moeten er bijvoorbeeld rekening mee houden dat het hergebruiken van een gratis beschikbare dataset ook kosten met zich meebrengt. Voor een eenmalige hackathon snel een prototype maken met een dataset is immers eenvoudig; datasets duurzaam verbinden met interne systemen vraagt echter tijd en onderhoud over de jaren. Als datasets worden gepubliceerd onder een lage kwaliteit wordt het des te moeilijker voor een hergebruiker om zo’n duurzame koppeling op te zetten. Zo worden de onderhoudskosten groter, terwijl de meerwaarde voor de hergebruiker identiek blijft. Het wordt dus al snel duidelijk dat er heel wat complexe vragen opduiken wanneer men als overheid open data wil publiceren. Deze pagina wil een aantal kapstokken aanreiken voor lokale besturen om op een impactvolle en duurzame manier aan open data te beginnen.

Open data impliceren vandaag nog steeds een moeilijke evenwichtsoefening tussen technologische, economische, organisatorische en maatschappelijke uitdagingen. Zodra we deze balans gevonden hebben is de belofte echter aanzienlijk: van economische meerwaarde, over enorme efficiëntiewinsten in de organisatie van de overheid tot meer transparantie en burgerparticipatie bij complexe maatschappelijke uitdagingen. Om dit mogelijk te maken en bijvoorbeeld automatisch op het web een antwoord te vinden op de bovenstaande vraag, moeten we er eerst in slagen om over organisaties heen de juiste minimale afspraken te maken. Deze pagina geeft een overzicht van een aantal dergelijke goede afspraken.

De basis: open licentie en open formaat

Data mogen in de striktste zin ‘open’ genoemd worden als er aan een simpele juridische voorwaarde voldaan is: er wordt een licentie toegekend waarbij iedereen zonder uitzondering de data mag downloaden, bewerken (op de eigen kopie) en verspreiden, al dan niet onder dezelfde licentie en/of met bronvermelding. Wanneer er geen licentie aan de dataset gekoppeld is, dan geldt volgens het auteursrecht en de databankwet dat er mogelijk eigendomsrechten gekoppeld zijn aan de dataset.

Bij ons kiest de Vlaamse Overheid bewust voor open data.(Zie deze link). Wanneer een dataset wordt aangemaakt door een overheidsinstantie, dan moet die automatisch opengesteld worden op het world wide web, tenzij er een goede reden bestaat om ze niet ter beschikking te stellen. Dit principe wordt internationaal ‘open by default’ en ‘comply or explain’ genoemd: standaard zijn data als open data beschikbaar en wanneer dat niet het geval is, moet er een goede reden voor zijn, die kan worden toegelicht. Hierbij moet automatisch een open modellicentie (zie ook het volgende deel) inzake copyright op de dataset geplaatst worden.

Naast een open licentie is een tweede belangrijk criterium om over open data te spreken het technische formaat waarin de data beschikbaar zijn. We spreken over open data als gegevens in een zogenoemd machineleesbaar en open formaat beschikbaar zijn. Machineleesbaar wil zeggen dat het om gestructureerde gegevens gaat (bijvoorbeeld een tabel met gegevens, in plaats van een rapport dat de gegevens tekstueel beschrijft) en een open formaat betekent dat de gegevens in een open bestandstype beschikbaar zijn (bijvoorbeeld in een CSV-bestand eerder dan een Microsoft Excel spreadsheet).

Uitgebreide principes rond open data

Hoewel er een juridisch kader rond open data aanwezig is (zie het volgende onderdeel), is er vaak verwarring rond het concept. Men gaat er snel van uit dat er persoonsgegevens of andere gevoelige informatie gepubliceerd zal worden, maar dit is bij open data expliciet niet het geval. Privacy wordt vaak aangehaald als reden om niet aan open data te doen, maar het gaat eerder om omgevingsdata en nooit om gegevens die het mogelijk maken individuen te identificeren. Het zou mogelijk zijn dat er op een bepaald moment zodanig veel omgevingsinformatie in de vorm van open data beschikbaar is dat het mogelijk wordt mensen te identificeren. Vooralsnog blijft dit een hypothetische situatie. Ook de drijfveren om open data te publiceren zijn soms zoek, wederom ondanks het bestaan van een vrij helder juridisch kader.

Om aan deze en andere bezorgdheden tegemoet te komen, werd in het kader van het Smart Flanders-programma (2017-2019) samen met de dertien centrumsteden en de Vlaamse Gemeenschapscommissie in Brussel het Open Data Charter opgesteld. Algauw werd duidelijk dat het eerst nodig was om een set van gezamenlijke principes vast te leggen, zodat de verschillende betrokken organisaties samen naar dezelfde ambities konden toewerken. De steden startten namelijk niet vanuit eenzelfde maturiteit rond open data, maar de doelstelling van het charter was wel om het ambitieniveau op dezelfde lijn te trekken.

Het Open Data Charter bevat twintig basisprincipes rond open data, die tegelijk de ambitie van de ondertekenende partijen bevatten. Door dit charter in de zomer van 2018 te bekrachtigen, spraken de centrumsteden en de hele Vlaamse Overheid een ambitie rond open data uit, die verder gaat dan de voorzichtige basisprincipes die veelal gehanteerd worden. Het charter gaat bijvoorbeeld ook over de redenen om open data te gebruiken, het belang van een goede interne organisatie, manieren om beter samen te werken met overheden en hergebruikers, en zelfs een aantal technische basisprincipes.

Aangezien de Vlaamse Overheid deze principes in mei 2018 heeft overgenomen voor haar eigen werking rond open data, zullen ze van toenemend belang worden in Vlaanderen. Ze worden hier meegegeven, omdat elke organisatie die met open data aan de slag wil (of moet) uitgenodigd wordt de ambitie in dit charter mee te onderschrijven, uit te dragen en verder in de praktijk te brengen. De principes in het Open Data Charter zijn hier terug te vinden.

Er werd reeds verschillende keren verwezen naar het juridisch kader dat in een aantal regelingen rond open data voorziet. De oorsprong van dit kader en hoe het vandaag door lokale besturen ingezet kan worden, is het onderwerp van het volgende deel.

Het juridisch kader

Er bestaat een degelijk juridisch kader voor het publiceren van overheidsinformatie als open data. Het gaat om een omzetting van een Europese richtlijn, oorspronkelijk uit 2003 en herzien in 2013, de zogenoemde Public Sector Information (PSI)-Richtlijn. Deze richtlijn regelt het hergebruik van overheidsinformatie met het oog op het verhogen van transparantie en het creëren van eerlijke concurrentie, om op Europese schaal toepassingen te kunnen bouwen met open overheidsinformatie.

Deze Europese richtlijn werd in 2007 voor het eerst omgezet in een Vlaams decreet, gevolgd door een herziening in 2015. Het Decreet Hergebruik van Overheidsinformatie schept een regelgevend kader voor het openstellen van overheidsdata. Het decreet bepaalt dat bestuursdocumenten die in het kader van de publieke opdracht van een overheidsinstantie ingezet worden zo veel mogelijk in open en machineleesbare formaten en onder een open licentie ter beschikking gesteld moeten worden voor hergebruik, zowel voor niet-commerciële als commerciële doeleinden.

Voor de definitie van bestuursdocumenten wordt verwezen naar het Decreet Openbaarheid van Bestuur uit 2004. Een bestuursdocument heeft een zeer brede definitie: het gaat om “de drager, in welke vorm ook, van informatie waarover een instantie beschikt” en slaat dus op alle overheidsinformatie, in gelijk welke vorm. Wanneer we het Decreet Hergebruik er dan bijnemen, gaat het om alle informatie waarover een overheidsinstantie in het kader van haar publieke taak beschikt. Het kan dus gaan over een heel scala aan gegevens, van informatie over de werking (bijvoorbeeld verslagen van vergaderingen) over omgevingsinformatie (bijvoorbeeld een lijst van hondentoiletten) tot realtime data die door sensoren gecapteerd worden (bijvoorbeeld passantentellingen tijdens evenementen of de bezetting van parkeergarages).

Uiteraard wordt in enkele uitzonderingen voorzien. Het decreet is niet van toepassing voor bestuursdocumenten die niet in het kader van de publieke opdracht van de instantie opgemaakt werden, noch voor bestuursdocumenten waarop een instantie niet de nodige rechten heeft om hergebruik toe te laten. Het decreet is ook niet van toepassing op bestuursdocumenten van de openbare omroep of van andere culturele instellingen dan bibliotheken, musea en archieven. Voor deze laatste drie types instanties geldt verder dat ze zelf kunnen beslissen of ze hergebruik toelaten van de documenten waar ze de nodige rechten op hebben. Alle andere overheidsinstanties, en dus ook lokale besturen, moeten hergebruik van bestuursdocumenten toelaten volgens de bepalingen van het decreet.

Lokale besturen die onder het toepassingsgebied van het Decreet Hergebruik vallen kunnen ook een vergoeding vragen voor het openstellen van de data, maar deze moet als regel beperkt blijven tot de marginale kosten die nodig zijn voor de vermenigvuldiging, verstrekking en verspreiding van de bestuursdocumenten in kwestie. Dus ook voor het betalen voor open data is een juridische grondslag voorhanden.

Het Decreet Hergebruik is niet overal even goed gekend. Het Open Data Charter dat in het voorgaande deel besproken werd zet een aantal van de principes die erin vervat liggen nog eens in duidelijke taal in de verf. Om op een duurzame manier open data te gebruiken is het echter wel van belang dat het decreet en de principes die erin vervat zitten bekend zijn bij de lokale besturen en andere overheidsorganisaties. Zowel het Charter als het decreet kunnen een hoop onduidelijkheden en twijfel wegnemen voor alle betrokken partijen.

Het is ten slotte belangrijk te vermelden dat het nieuwe Decreet Lokaal Bestuur ook een belangrijke impact zal hebben op de open data die door lokale besturen gepubliceerd worden. Het decreet dat het uitdovende Gemeentedecreet vervangt, zal een aantal open standaarden opleggen voor de bekendmaking van de aangestelde mandatarissen die zetelen in de gemeenteraad, het schepencollege en de OCMW-raad. Op die manier zal informatie uit onder andere de aanstellings- en ontslagbesluiten meteen als gestructureerde open data gepubliceerd worden.