Value for money met OV-data

Treinonderhoud

Om van A naar B te komen zijn veel mensen afhankelijk van het openbaar vervoer. Open data over het openbaar vervoer is een van de bekendste gebruiksdoeleinden van open data. Van apps als Railplanner, OV tot OV.Info. Allemaal toepassingen die reizen net iets eenvoudiger maken. Het gebeurt geregeld dat innovaties vanuit deze apps uiteindelijk hun weg vinden in de NS Reisplanner of de 9292 app. Maar wat kunnen we met Ov-data aangaande Accountability Hack? Daarvoor zoomen we in op de punctualiteit!

Een groot deel van het openbaar wordt betaald uit publieke middelen via concessies. Zo gaan de concessies voor regionaal openbaar vervoer via provincies of samenwerkingsverbanden van gemeenten (bijv. stadsregio’s). Voor een overzicht ga naar deze pagina met alle concessiegebieden in Nederland. De nationale overheid gaat echter over de concessie voor het hoofdrailnet in Nederland, deze is gegund aan de Nederlandse Spoorwegen.

Eisen bij de concessie

Voordat een concessie verleend gaat worden beslissen de concessieverlenende overheden wat zij graag terugzien bij een vervoersbedrijf. Dit kan zijn punctualiteit, frequentie, duurzaamheid of reiscomfort. Als het gaat om accountability dan kun je dus kijken naar geldstromen naar vervoersbedrijven. Wat betalen overheden voor openbaar vervoer? Deze gegevens zijn terug te vinden via Openspending-data, waar we eerder al over hebben geschreven. Via de post ‘vervoer’ kun je meer inzicht krijgen in de uitgaven aan onder andere openbaar vervoer. Dit blog gaan we echter in op de punctualiteit.

Punctualiteit

unnamedEen belangrijke prestatieindicator bij het openbaar vervoer is de punctualiteit. Rijden de treinen op tijd en zijn passagiers verzekerd van hun overstap en tijdige aankomst? Deze data wordt niet actief als open data ontsloten. Maar is beschikbaar via de prestatiepagina van ProRail.

Op deze pagina kun je per type spoorvervoer, hoofdrailnet, goederenvervoer en tot slot decentrale lijnen bekijken hoe de punctualiteit is. Ook kan er per lijn of per station naar de cijfers gekeken worden. De financiering van het hoofdrailnet gaat via het rijk en de decentrale lijnen dus via provincies of samenwerkingsverbanden als stadsregio’s. Ook de normen voor punctualiteit, de prestatieafspraken, zijn dus te bekijken. Elke dag komt er een update op deze site. Maar hoe kunnen we deze gegevens nu eenvoudig verwerken?

OpenOV

Gelukkig hebben de mensen van OpenOV ons leven iets eenvoudiger gemaakt. Zij scrapen namelijk elke dag de website van ProRail en stellen de gegevens beschikbaar in het JSON-bestandsformaat. Via de website van OpenOv is deze data te downloaden. Op deze manier kun je dus inzicht krijgen in de prestaties van vervoerders en bekijken welke lijnen of vervoerders het meeste vertraging hebben.

De volgende vraag is dan, waar dat aan ligt? Te weinig materieel, enkel-spoor, weersomstandigheden, uitgelopen werkzaamheden of zaken als stroomstoringen.

Prestaties van Veolia

Als voorbeeld zoomen we in op de prestaties van Veolia. Een treinvervoerder in het zuiden van het land, die twee lijnen exploiteert voor concessiehouder provincie Limburg. Het gaat om de Maaslijn tussen Nijmegen en Roermond en de Heuvellandlijn tussen Maastricht en Heerlen.

We bekijken dan het bestand Decentrale_Lijnen_(datum).json. In Chrome zijn .JSON bestanden met de gratis plugin JSONView eenvoudiger te bekijken. Als we kijken naar de Maaslijn krijgen we de volgende resultaten.

• punc_jaar: 0.9193606560488999,
• ptm_vervoerder: “Veolia Transport Ned bv”,
• ptm_traject: “Nijmegen – Roermond”,
• ptm_rijkarakteristiek: “ST”,
• punc_lastday: 0.5

Punc_jaar staat voor de punctualiteit op jaarbasis, ptm_vervoerder is de vervoersmaatschappij, ptm_traject uiteraard het treintraject, ptm_rijkarakteristiek gaat om het type trein zoals stoptrein, sprinter of intercity en tot slot de punc_lastday gaat om de punctualiteit van de laatste beschikbare dag.

Punctualiteit in beeld

Voor een eerste blik in deze open OV-data kijken we naar een kleine dataset, de punctualiteit op één dag, 23 augustus. Hiervoor gebruiken we de dataset reizigersvervoer_20160823.json. Hierin zijn twee datapunten gegeven, punc_lastday en punc_jaar die we hier in beeld willen brengen.

Door deze twee parameters van punctualiteit tegen elkaar af te zetten krijgen we, een eerste inzicht in hoe structureel of incidenteel slechte scores op punctualiteit zijn. Om iets meer van de nuance in de data weer te geven zijn de verschillende type verbindingen (Intercity, Sprinter, etc.) los van elkaar weergegeven in onderstaande scatterplot. De grotere cirkels in de zelfde kleuren geven het gemiddelde voor elk type aan. Hier is alle data in meegenomen, ondanks eventuele null-values.

punct

In deze visualisatie wordt al snel duidelijk dat punctualiteit sterk samenhangt met het type verbindingen: streekvervoer (ST) scoort bijzonder goed, terwijl onder verschillende internationale ritten de punctualiteit veel lager hangt. Daarnaast valt op dat de correlatie tussen punc_lastday en punc_jaar redelijk solide lijkt, wat er op wijst dat een enkele dag al een aardige steekproef is van een verbinding.

Meer inspiratie?

Kijk op de website van OpenOV voor meer data over het openbaar vervoer. Welke combinaties kun jij maken om prestaties van vervoersbedrijven in kaart te brengen? En welke informatie helpt concessieverlenende overheden om beter te kijken naar de prestaties van het openbaar vervoer in hun gebied? We zijn benieuwd naar de mogelijkheden.

Doe je mee?

Op 9 september 2016, aan de vooravond van Prinsjesdag vindt Accountability Hack plaats. Tijdens deze hackathon gaan we met open data geldstromen en prestaties van de overheid in kaart brengen. Doe je mee? Aanmelden kan hier.