Infos zum Ausfall 03.-10.05.2015

    Hallo Scootertuner! Werde Teil einer der größten Scootertuning-Communities im Netz.
    Sei kostenlos dabei!

    • Infos zum Ausfall 03.-10.05.2015

      Moin moin jet-Force Tuner!

      Die meisten von euch werden es sicherlich mitbekommen haben, dass das gesamte Forum unerfreulicherweise vom 03.05. ~13Uhr bis zum 10.05. ~10Uhr nicht erreichbar gewesen ist.
      Diese Nichterreichbarkeit betraf sowohl das Forum über die Webseite, als auch die Nutzung über die Android und iOS App.

      Zunächst einmal ein großes Sorry für die Nichterreichbarkeit und vielen Dank für euer Verständnis!

      Was war passiert?
      Auf der Serverstruktur im Hintergrund läuft wie auf jedem Computer ein Betriebssystem, das regelmäßig mit Updates versorgt werden muss, um aktuellen Sicherheitsstandards zu entsprechen.
      Da die Sicherheit eurer Daten auf Jet-Force.eu größte Priorität hat, werden diese Updates regelmäßig und Zeitnah eingespielt.
      Nun war es am Sonntag Zeit für einen sog. "Releasewechsel", also einem Wechsel von einer älteren Betriebssystemversion auf eine neue (Vergleichbar mit einem Wechsel von Windows 7 auf Windows 8).
      Zwar funktionierte mit dem alten Betriebssystem alles problemlos, es wird jedoch in Kürze nicht mehr mit neuen Sicherheitsupdates versorgt, daher ist ein Upgrade auf die neue Version unausweichlich gewesen.

      Im Updateprozess hatte sich aber ein verheerender Bug eingeschlichen, in dessen Folge der eigentlich kurze Upgradeprozess das Dateisystem zerstört und die Festplatten unlesbar gemacht hat.

      Wieso hat das so lange gedauert?
      Zunächst habe ich versucht, das vorhandene Serversystem wieder ans Laufen zu bekommen und das Dateisystem zu reparieren. Das hat fast 2 Tage gedauert, bis sich herausgestellt hat, dass das System irreparabel beschädigt gewesen ist.
      Es blieb also nichts andere übrig, als ein neues Serversystem einzurichten und die - immer aktuell vorhandenen - Backups einzuspielen.
      Das neue Serversystem musste erst angemietet werden, dann installiert und eingerichtet werden. Schließlich musste die nötige Software teilweise kompiliert werden, was auf dem System leider sehr lange gedauert hat.

      Was wurde daraus gelernt?
      Die Serverinfrastruktur wird in den nächsten Wochen grundlegend verändert:
      Bisher gibt es ein Serversystem, auf dem Jet-Force.eu läuft sowie zwei unabhängige Speichersysteme auf denen Backups der Daten gesichert werden:


      Damit ist der Server jedoch ein Single Point of Failure (wie wir jetzt leider schmerzlich erfahren mussten :p), wenn er ausfällt, sind zwar die Daten auf den Backupspeichern nach wie vor gesichert, die Webseite(n) sind aber nicht mehr erreichbar.



      Um das auszuhebeln wird die Serverstruktur in den nächsten Wochen auf folgendes Layout umgestellt:

      Es wird 2 Loadbalancer geben (einen Loadbalancer1, der produktiv sämtliche Anfragen/Aufrufe bearbeitet, und einen Loadbalancer2 als Backup, der nur dafür da ist, zu übernehmen, wenn Loadbalancer1 ausfällt.).
      Die Loadbalancer nehmen alle anfragen/aufrufe der Webseite entgegen und leiten sie an Server1, Server2 oder Server3 weiter.
      Alle drei Server haben ein getrennt voneinander laufendes Betriebssystem, und teilen sich nur einen Datenbestand (der durch stetiges Synchronisieren konsistent gehalten wird).
      Fällt nun einer der 3 Server aus, können die beiden anderen Server on-the-fly weiter arbeiten und die Webseite ist auch weiterhin, während Server1 wieder instand gesetzt wird, erreichbar.
      Die 3 Server sind in unterschiedlichen Rechenzentren untergebracht, sodass auch der Ausfall eines gesamten Rechenzentrums überstanden werden kann.

      Davon getrennte Backups der Daten werden natürlich weiterhin gefahren.



      Der Aufbau dieses Systems wird einige Wochen dauern, aber ich hoffe man merkt, dass wir aus den Fehlern gelernt haben ;)

      Beste Grüße
      unrealSpeedy
    • Das Einrichten der neuen Serverinfrastruktur wird einige Wochen in Anspruch nehmen.
      In den nächsten Tagen kann es vereinzelt zu längeren Ladezeiten des Forums kommen, da auf dem jetzigen "Ersatzserver" einige Programme im Hintergrund kompiliert werden müssen.

      Sorry für die Umstände, das Forum wird aber durchgehend erreichbar sein.

      Beste Grüße
      unrealSpeedy
    x
  • Weitere Antworten auf Deine Frage:


  • Schließen

    Open Modal