Wikidata voor sporen

Ik zag op de NL pagina van Taginfo dat er honderden van dezelfde wikidata=* zijn voor sommige van onze treinsporen: Link
Deze tags staan nagenoeg allemaal op de lijnobjecten (ways) van de sporen. Vinden jullie het een idee om de Wikidata tag enkel op routerelaties als deze van A’dam naar R’dam te taggen? De Wikidata tags slaan namelijk op de volledige routes en niet per sé op losse stukjes spoor. Als ik me niet vergis hebben we dit op de snelwegen ook zo met de route=road relaties.

Lijkt me wel een stuk schoner. Wikidata-tags op wegen, paden, vaarwater, en spoor zijn lastig om goed te onderhouden.

Voordat we kunnen bepalen of wikidata-tags beter op ways of beter op routerelaties passen, moeten we eerst de vraag beantwoorden wat voor routerelaties we eigenlijk willen hebben op het spoor. Er zijn nu nog maar enkele van dergelijke relaties.

Bij verkeerswegen is er een duidelijk onderscheid tussen straat en route en is door bebording ook (verifieerbaar) duidelijk wat alle routes zijn; bij spoorwegen is mij dit vooralsnog erg onduidelijk. Zijn er hier spoorwegdeskundigen die daar ideeën voor hebben?

Hiervoor vind ik route=railway de best passende tag. Deze tag is globaal al ruim 12.000 keer gebruikt en de documentatie komt naar mijn idee goed overeen met wat een spoorlijn feitelijk is.
De A’dam - R’dam lijn geeft dit goed weer:

  • from Amsterdam Centraal

  • name Oude Lijn

  • operator ProRail

  • route railway

  • to Rotterdam Centraal

  • type route

  • wikidata Q801843

  • wikipedia nl:Spoorlijn Amsterdam - Rotterdam

De Wikipedia-pagina Lijst van spoorlijnen in Nederland geeft een goed overzicht van de spoorlijnen die we in NL hebben (en dus kunnen mappen). Ik pleit ervoor om hierbij de opgeheven sporen niet in OSM op te nemen, want die gegevens horen meer thuis in OpenHistoricalMap.

P.s. Officieel mogen we Wikipedia niet als bron voor OSM gebruiken, maar alle data kunnen we makkelijk verifiëren met luchtbeelden, de websites van NS & ProRail en bestaande OSM-data. Het gaat mij er hier vooral om dat we de OSM-data met tags aan Wikipedia/Wikidata kunnen linken en dat we de spoorlijnen elk als één relatie-object in OSM hebben.

Op zich vind ik het een goed idee, maar…

Het verschilt een beetje per land hoe duidelijk zoiets uit te maken is. In België zijn ze daar heel goed in, alle spoorlijnen hebben een nummer en dat wordt al een jaar of 130 zo bijgehouden (al zijn er nummers hergebruikt en wijzigt er nog wel eens wat). Ook in Frankrijk is er een duidelijk officieel nummer.

In Nederland is er geen officieel nummer voor lijnen, je hebt de aanleg- en aanlegwetsgeschiedenis. maar bronnen zijn er wat minder eenduidig over, soms wordt iets als één spoorlijn gezien en soms als meerdere delen. En bovendien hebben spoorlijnen soms meerdere namen en bijnamen.

Zo is er de Spoorlijn Els - Dordrecht, aangelegd als “Merwe- en Waalspoorweg”, wordt nu vaak “Betuwelijn” genoemd (niet te verwarren met de Betuweroute), terwijl het hoofddoel van de aanleg het verkrijgen van een tweede spoorverbinding tussen Amsterdam en Duitsland, via Amersfoort en Kesteren (ofwel met een treindienst die een deel van het traject gebruikte en daarna aftakte). De lijn wordt in 3 secties door 3 verschillende concessies beheerd en ook door 3 vervoerders gereden, het westelijke deel wordt ook wel “MerwedeLingelijn” genoemd - officieel de naam van de treindienst maar dat wordt wel eens door elkaar gehaald.
En dat is nog maar de situatie bij hoofdspoorlijnen. Bij (interlokale en lokale) tramlijnen is het nog veel onduidelijker, en dan heb je ook nog allerlei door hobbyisten verzonnen “lijnen” die nooit officieel een lijn geweest zijn.

Ik ben dus een beetje bang voor een kakefonie van rail relations, met heel veel alt_names. Er moet dus nogal goed afgebakend worden wat een lijn is.

Waarom niet?

Ik weet niet zoveel van spoorwegen, maar kwam eerder wel deze wettelijke regeling tegen waarin is bepaald welke trajecten tot het hoofdspoorwegennet behoren:

https://wetten.overheid.nl/BWBR0017794/2020-10-15#Bijlage1
de lijst gaat verder in de tweede bijlage:
https://wetten.overheid.nl/BWBR0017794/2020-10-15#Bijlage2

Misschien kan die lijst dienen als een vertrekpunt om een verzamelrelatie te maken voor het hoofdspoorwegennet, naar analogie van de relatie voor het hoofdwegennet https://www.openstreetmap.org/relation/13290323
(mooi werk trouwens die hoofdwegennetrelatie, dank @A67-A67 en @JeroenvanderGun daarvoor ! )

Die lijsten van het hoofdspoorwegennet bevatten wel dubbele nummers, maar dat is voor een unieke [ref] prima op te lossen met een prefix voor de bijlage en artikel
(bijvoorbeeld: de relatie voor sporen in Rotterdam; Eemhaven zou dan een vorm van [ref:bah=2b2] kunnen worden oid)

Een schematische kaart van het hoofdspoorwegennet dat hoort bij deze lijst is opgenomen in oa
https://zoek.officielebekendmakingen.nl/stcrt-2012-12258.html (even scrollen naar het spoordeel)

Vanuit die regeling is ook een gedetailleerde download beschikbaar die wellicht als visueel hulpmiddel kan dienen om de koppeling te maken tussen de lijst in de regeling en spoorlijnen in OSM:

http://www.geluidregisterspoor.nl/geluidregister.html

Ter info, en voor wat het waard is: op het forum hgbtf.net zijn er verschillende deelnemers die werken bij Infrabel, de beheerder en operator van de Belgische spoorinfrastructuur. Er zijn ook deelnemers uit NL, trouwens. Veel inside-informatie, dus. Voor een gedetailleerd overzicht van de Belgische spoorlijnen, inclusief historische achtergrond, kan men goed terecht op https://sites.google.com/view/belgischespoorlijnen/spoorlijnen. Het lijkt me dat er in Belgie twee soorten relaties gemapt worden: enerzijds de lijnnummers, anderszijds de diensten (IC-xx , S-yy, L-zz). Zie bv. https://www.openstreetmap.org/way/398856077

Er bestaat voor NL ook een Railwiki met veel info over spoor en materieel

Dat is juist. dat is dus het onderscheid tussen route=railway en route=train.
Het zal duidelijk zijn dat in veel gevallen beide routes overeenkomen.
De routerelatie van de intercity Amsterdam-Rotterdam (route=train) via de oude lijn is dan identiek met de route=railway van de oude lijn.

De route=railway zal bovendien de heengaande sporen én de teruggaande sporen moeten bevatten.
Omdat de routerelaties niet onderhouden worden zal er binnen een jaar sprake zijn van een warboel van Railway segmenten die niet meer op elkaar aansluiten.

Dat een route=railway mogelijk is betekent nog niet dat het wenselijk is.
Vraag je ook eens af wie de doelgroep is voor deze informatie.
En realiseer je ook dat zo’n routerelatie niet zichtbaar is op de standaardkaart.

Wat mij betreft is dat alleen al voldoende reden om geen route=railway op de kaart te zetten.

Het korte antwoord, voor zover ik dit onderwerp begrijp, is dat info van Wikipedia een CC BY-SA licentie gebruikt, waarbij we naast naamsvermelding ook de data onder dezelfde licentie beschikbaar moeten stellen. OSM kan hier met de ODbL-licentie niet aan voldoen.
Voor meer en betere informatie kun je je vragen richten aan Simon Poole. Die weet hier veel meer over.

Dankje, da’s zeer informatief. Mij dunkt dat de lijnen die zowel op Wikipedia als op deze pagina van Railwiki voorkomen zonder al te veel controverse als route=railway gemapt kunnen worden. Is er een mogelijkheid om in OSM naar Railwiki te linken?

Klaagde je ook zo toen de route=road relaties voor snelwegen gemapt werden?

Dat terzijde vraag ik me af in wat voor volgorde de segmenten gemapt moeten worden en of een volgorde hier van belang is. De relatie van de al gemapte Oude Lijn ziet er op OSM keurig aaneengesloten uit, maar als je kijkt naar de Utrecht-R’dam lijn wordt de situatie al een stuk moeilijker om op dezelfde manier te mappen.

Gebruikers volgen wanneer de data bestaat en bruikbaar geacht wordt. Zo gebruikt OSM Americana al de route=road relaties om de borden voor de snelwegen te renderen. Dank aan degenen die deze gemapt hebben.

Dit zou ik niet te hard roepen. Met de flex backend zou hier wel eens verandering in kunnen komen.

Ik heb relation=route wel eens geprobeerd te corrigeren, maar ik was deatijds niet gedocumenteerd. Moeten op-en afritten en verbindingswegen erbij? (wel als je uitgaat van de HM-paaltjes).

En verifieerbaarheid volgens borden? kuch (flauwe uitzondering bij de A-wegen, N-wegen zijn vaker slecht aangegeven)

Bij wegen is ervoor gekozen om alleen de hoofdrijbaan op te nemen in de routerelatie, niet de op- en afritten, verbindingswegen en parallelbanen. Dus als je naar de hectometerpaaltjes kijkt: geen suffix en de suffixen Re en Li. Via de hectometerpaaltjes en via open data kun je ook de verborgen N-wegen en wegen als de A38 vinden, dus verifieerbaarheid lijkt me geen probleem.

Bij spoorwegen zit dit wat lastiger. Ten eerste zijn er vaak geen duidelijke hoofd- en parallelbanen. Een viersporig traject heeft meerdere sporen per richting.

Ten tweede heeft Wikipedia hebben de spoorwegen verdeeld in trajecten hoe ze oorspronkelijk zijn aangelegd. Spoorwegen als de Staatslijn E (Breda-Maastricht met een omweg via Venlo), de Centraalspoorweg (Utrecht-Amersfoort-Zwolle-Kampen) en vooral de Betuwelijn (Dordrecht-Elst, niet de Betuweroute) zijn tegenwoordig lastig als één spoorlijn te zien. Dit zijn vooral historische aanduidingen.

Ik zie dat we wel al de baanvaknummers in de ref-tag hebben verwerkt bij spoorlijnen. Dat is een indeling die niet historisch is en nog gewoon gebruikt wordt. Misschien dat we route=railway-relaties beter daarop gebaseerd kunnen worden.

Het was even zoeken waar deze refs vandaan komen, het zijn Geocodes van ProRail, en deze geocodes lijken nogal arbitrair aan stukken spoorlijn gegeven te zijn.
Ik vind (via wikipedia en Het Utrechts Archief) een incomplete lijst met geocoderingen. Daaruit blijkt dat de lijnen op soms wel arbritaire grenzen geknipt zijn. Zo is Amsterdam-Utrecht 096 van Amsterdam (Muiderpoort) tot Duivendrecht, 80 van Bijlmer tot Loenen, 97* boven Breukelen, 98 van Breukelen tot Utrecht CS.
*97 staat daarbij niet op de lijst van Het Utrechts Archief, maar wel op de geocodekaart van Prorail dataloket zelf.

Ik vind de Geocode niet geschikt als bron voor wat één spoorlijn behelst.

We kunnen altijd nog onze eigen criteria maken en documenteren op basis van onze eigen meningen en inzichten, waarbij we Geocode, Railwiki en Wikipedia puur als hulpbronnnen of suggesties gebruiken.

Deze zouden we dan bijvoorbeeld achterwege kunnen laten, om vervolgens lijnen waar we meer logica in kunnen vinden zoals Utrecht-R’dam wel als route=railway te mappen. We kunnen in ieder geval beginnen bij een paar lijnen waar we makkelijk(er) een consensus over kunnen vormen.

Ik moet toegeven dat ik niet zou weten in wat voor volgorde de segmenten gemapt zouden moeten worden. Hebben we hier richtlijnen voor?

Geocodes zijn toegewezen aan een gebied, niet aan een spoorlijn. Een geocode kan dus meerdere lijnen bevatten, en een lijn kan in meerdere geocodes vallen.