Tile-Caches für Deutschland

Seit letzter Woche scheint es ein verschärftes Problem mit den Tile-Caches für Deutschland zu geben, teilweise scheinen Anfragen gar nicht mehr durchzukommen.

aus Tile-Usage #3:

@Nakaner da ich die Diskussion im IRC nicht verfolgt habe:

  • gibt es einen Grund für die erhöhte Last auf den Caches?
  • konqi ist schon vorher aufgefallen und wurde jetzt rausgenommen, gibt es noch weitere geplante Maßnahmen (z.B. gackelchen scheint noch Probleme zu haben)?

Aufgrund von…

Frage vom Leihen an die Profis:
Wie sieht denn der Wunsch Tile-Cache-Server aus?
Was für Bandbreite wird benötigt?
Gibt es vielleicht schon ein brauchbares Angebot?

Was kostet der Spaß?

Wäre gut wenn das mal jemand skizzieren könnte wie Hardware und (auch im Verhältnis) zur Bandbreite aussehen müßte

Schon eher ernüchternd, die Deutschen Tile-Server: https://hardware.openstreetmap.org/

Ich vermute das hier sind die Anforderungen an einen Cache:
https://wiki.openstreetmap.org/wiki/Servers/Tile_CDN#Tile_delivery_CDN_node

Die günstigsten “dedicated” bei Hetzner kosten 40 Euro im Monat, haben 1 GBit Anbindung (ohne Begrenzung!) und sind deutlich besser als das was wir haben.

Die bei Hetzner dürften ja vermutlich unter “Colocation” laufen…

Was kostet uns eigentlich das ganze im Monat?

Ich habe ein erstes spezielles Issue aufgemacht, da mir aufgefallen ist, dass der Server Kalessin seit ca. drei Wochen nicht mehr beschäftigt ist:
Kalessin idle? · Issue #437 · openstreetmap/operations

Die Cache-Server werden von den Sponsoren gestellt, die dürften die OSMF daher nichts kosten.

Die gesamten Infrastruktur-Kosten müsstest Du im Finanzbericht nachschlagen, vermutlich irgendwo auf http://osmfoundation.org.

Hallo,

Die für Deutschland (bislang) verwendeten Cache-Server sind, wie beschrieben, zu schwach für die Last. Vielleicht sind in den letzten Monaten auch noch mehr Nutzer aus Deutschland auf die OSMF-Tileserver gewechselt (wie datenschützend Deutsche ticken, wissen wir ja). Weil die Server zu schwach waren, bedient der luxemburgische Cache mittlerweile zusätzlich Deutschland (zusätzlich zu anderen Caches).

Colocation heißt, dass man Rack-Platz anmietet und Hardware im Eigentum des Kunden dort läuft. Was für uns geschickter ist, sind “dedicated Server”, also Server, die Hetzner gehören und deren Nutzung der Kunde anmietet. Hier sind eigentlich die EX- und AX-Reihe interessant.

Ich habe im IRC nachgefragt, ob die Hardware-Anforderungen im Wiki noch aktuell sind (bei so Wiki-Seite zu Admin-Kram muss man sehr vorsichtig sein; dass da etwas im Wiki steht, heißt nicht, dass die Admins das da mal reingeschrieben haben oder dort noch gepflegt wird). Die Antwort war:

Übersetzt: Naja, ich meine, je mehr desto besser, wenn es um RAM geht (und CPU solange, wie der I/O hinterherkommt) insbesondere für Regionen mit viel Traffic wie Deutschland.

Das klingt danach, als wäre ein Hetzner EX42 oder AX42 mit NVMe-SSDs (keine Festplatten) eine recht brauchbare Maschine.

Viele Grüße

Michael

D.h. wenn man sich einen dicken Rechner zusammenklickt (AX161, 256GiB RAM, 2x192TB NVME (daten), 2x240G SATA (system), zahlt man Netto 224€/Monat. Keine Ahnung, was wirklich benötigt wird, vielleicht kommt man auch mit 50€/Monat hin.
Privat würde ich mir das nicht leisten wollen, aber im Prinzip ist das nicht viel Geld. Muss doch möglich sein, Sponsoren für sowas zu finden?!

Meine Idee für ein weiteres Vorgehen wäre:

  1. herausfinden, was eigentlich das aktuelle Problem ist. Könnte ja gut sein, dass die deutlich angestiegene Überlastung mancher Caches z.B. einfach am Ausfall des Kalessin Servers liegt und dessen Reaktivierung erst mal schon Abhilfe schafft.
  2. die bestehenden Sponsoren fragen, ob sie nicht ihren Server upgraden wollen/können
  3. neue Sponsoren finden, z.B. per Spendenaufruf offiziell über den Fossgis (Blog/Tweet/Mail)

Ein Problem scheint auch die sehr unterschiedliche Kapazität der Server zu sein, da jeder im DNS Round-Robin die gleiche Last abkriegt, mit der die schwächeren dann Probleme haben:

https://github.com/openstreetmap/operations/issues/299#issuecomment-490058157

Das heißt, eine konkretere Vorgabe zur benötigten Hardware wäre schon hilfreich, um einheitliche Kapazitäten zu bekommen.

Vielleicht kann der Fossgis selbst einen oder mehrere Server anmieten und das Geld über (abzugfähige) Spenden wieder reinholen?

DNS Round-Robin funktioniert nicht unbedingt, wie man’s erwartet. Ich hatte mal unter Linux das Phänomen, dass der Resolver Adressen bevorzugt, die einen möglichst großen Präfix mit meiner eigenen teilen. K.a. ob das noch so ist.
Ansonsten könnte man stärkeren Servern mehrere IP-Adressen geben und so tricksen. Oder schauen, dass man das DNS-RR gewichten kann. Load Balancing ist eine Wissenschaft für sich selbst.

Das wäre auch noch meine Frage, ob man nicht auch den Konqi wieder under halber Last reaktivieren kann, indem man z.B. die anderen Server doppelt ins Round-Robin nimmt, hab selbst aber keine Ahnung davon.

@Michael: Sehe ich auch so. Und danke für das Nachfragen!

Connections through firewall, Spitzenwert:

                 1. Juli,     6. Juli

konqi: 34 k, xxx
keizer: 40 k, 75 k
katie: 30 k, 50 k
kalessin: nix, nix
gackelchen: 34 k, 36 k

  1. keizer und katie haben wohl den Ausfall von konqi kompensiert…?

  2. Die Hardware von keizer und katie ist soweit OK, liegt im unteren Bereich der „Spezifikation“.

  3. gackelchen und konqi passen von der Leistung her auch ins Bild

  4. kalessin läuft zwar, tut aber nix. Bis dahin war der Output vergleichbar mit katie, also auch OK.

Zusammengefaßt: Seit Mitte Juni bis heute ist die hälfte der Kapazität flöten gegangen.

Fragen:
Was ist mit kalessin? Wird das wieder?
Und konqi? Ist der einfach abgeraucht? Gibts da von EUserv vielleicht Ersatz?

Ich denke nicht, dass wir mit halb… weiter kommen.

Zu 2. katie und keizer stehen bei Hetzner. Die sollten wir wahrscheinlich nicht nochmals fragen… :wink:
Zu 3. Volle Zustimmung!

PS: Eine Aktueller EX/AX – Rechner von Hetzner (40 Euro im Monat) wäre wahrscheinlich schneller als alles was wir bisher haben (mehr RAM, mehr CPU und SSDs).

Kalessin ist nun dank FireFishy wieder im Betrieb. Damit dürfte die Lage wieder besser werden.

Wer trotzdem der überlasteten OSM Infrastruktur einen Gefallen tun will bzw. deren Schwankungen weniger ausgesetzt sein will: ich kann für interessante nicht-kommerzielle OSM-Community Projekte (z.B. brouter-web) oder rein private Hobby-Webseiten auch einen Tilezugang anbieten, bei dem die allerdings nicht ggf. minütlich aktualisiert werden wie bei osm.org. Letzteres ist aber auch nur für die Mapper-Tätigkeit wichtig, um Bearbeitungen am OSM Datenbestand zu überprüfen.
Schreibt mir dazu einfach eine Mail an osmap (at) osmap.info mit Infos zum Projekt/Webseite/App und ob Eure Zugriffe/Benutzer eher aus dem D-A-CH Raum oder weltweit kommen (für beides ist ein System bereit).

Ich dachte das wäre Absicht, aber der ist wohl nach einem Reboot nicht wieder aufgetaucht und der Provider hat noch nicht geantwortet [1]:

Kann es aktuell sein, das die Tile-Server momentan der massen schlecht liefern, so das man auch nach mind. 2 h über STRG F5 keine Aktualität der Grundkarte erreicht? Früher war das innerhalb 2 Min. möglich!
P.S. Kann das jemand bestätigen?
P.P.S: Immer noch keinen Kontakt zum Hauptserver nach 4h und damit keine Aktualität. Was ist passiert?

Kann ich bestätigen. Auch Änderungen, die ich vor 4 Tagen gemacht habe, sind bisher nicht in Carto enthalten. Zudem lieferte mir der Server seit ca. 20 Minuten nur noch folgendes:

Also grundsätzlich wäre ich bereit 40 EUR/Monat in den Ring zu schmeißen um einen Server zu sponsorn. An wen muss ich mich denn für die Spende wenden und wer übernimmt dann die Servereinrichtung/Wartung?

Gestern Abend gab es eine Pause bei der Aktualisierung der Rendering-Datenbank, keine Ahnung warum:

Live-Statistik Data import lag - Odin

Vielleicht war das die Ursache, das aktuelle Cache-Problem äußert sich eher in langsam ladenden oder grauen Tiles. Seit Kalessin wieder aktiv ist, scheint es gefühlt etwas besser zu sein aber noch nicht gut, Konqi ist immer noch nicht wieder da.

Was heißt “Kontakt zum Hauptserver”? Separates Problem?

Laut [1] kontaktiert man dazu zur Abstimmung die Operations Working Group per E-Mail an operations@osmfoundation.org:

So wie ich das verstehe, stellt bisher der Sponsor den Server (nicht das Geld), teilt also die Zugangsdaten mit und die Einrichtung erfolgt dann durch die Sysadmins (die haben Scripte dazu).

Ich will natürlich niemanden abhalten, aber meine persönliche Meinung wäre, dass Mapper nicht auch noch für die Server aufkommen sollten, sondern Firmen und andere Nutzer von OSM, die sonst nichts beitragen.

Ich bin wie gesagt bereit, die Betriebskosten von ca. 500 EUR/Jahr gegen Spendenquittung zu übernehmen, aber ich habe überhaupt keine Lust irgendwelche Verträge mit Serveranbietern zu schließen und dann die Zugangsdaten zu dem Servern an Dritte weiterzureichen - der Server soll auf mich laufen/registriert sein, ohne das ich kontrolliere was darauf läuft?! Never trust an admin :wink: Ich will weder kaufmännische noch technische Verantwortung für einen Server übernehmen.

Da müsste dann der FOSSGISS vielleicht mal in Deutschland Werbung bei einschlägigen Firmen/Institutionen machen. Warum gibt’s eigentlich keine Server an den Unis, die Geographie, GIS u.ä. als Studienfächer anbieten?