Störung Gelöst
Priorität - Hoch Betreffend Server - HOS103-MEGASTORAGE

Es wurde eine Störung gemeldet.

Analyse & Behebung gestartet.

[Update]

Ursache (Kernelcrash) durch Techniker vor Ort behoben, Kernel ersetzt.

 

Störung Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Störung, Kernelcrash.
Problem behoben

TLS 1.2 für den Mailverkehr Gelöst
Priorität - Hoch Betreffend System - Alle

Auf Grund von Sicherheitsvorfällen ist für den ausgehenden Mailserver TLS 1.2 erforderlich.
TLS 1.2 ist das aktuelle Verschlüsselungsprotokoll für einen sicheren E-Mail Verkehr.
Ältere Versionen sind von Sicherheitslücken betroffen und machen den E-Mail Verkehr verwundbar.

Folgende verwundbaren Verschlüsselungsprotokolle sind nicht mehr zulässig:
- SSL 2
- SSL 3
- TLS 1
- TLS 1.1

Erhalten Sie eine Fehlermeldung beim Versand, so müssen Sie ihr E-Mail Programm und das Betriebssytem auf die aktuellste Version updaten.

Als kostenlose Alternative gibt es:
- Thunderbird, das kostenlose Mailprogramm von Mozilla (Hersteller des Firefox)
- Das Mailprogramm bei macOS (Sie benötigen mindestens die Betriebssytemversion Sierra)
- Das Webmail unter ihredomain.xyz/webmail

Alle bekannten grösseren E-Mailanbieter, z.B. Microsoft (Hotmail, Outlook, etc.) stellen den Support für die alten Protokolle ebenfalls in wenigen Tagen ein.
Für Windows 7 laden Sie sich bitte bei Problemen folgendes Programm herunter: https://support.microsoft.com/en-us/help/3140245/update-to-enable-tls-1-1-and-tls-1-2-as-a-default-secure-protocols-in 
Registry Schlüssel manuell erstellen bei Windows 7: https://www.youtube.com/watch?v=Ne6Qec7pfRU&index=5&list=PLCK9eTd2s0bm2TaCNDVz1uxc4oASkvuJh&t=3s 

Hintergrundinformationen finden Sie unter: https://www.msxfaq.de/signcrypt/tls.1.2.htm

Umstellung Telefoniesysteme Gelöst
Priorität - Hoch Betreffend System - Alle Abteilungen

Umstellung Telefoniesysteme

Umstellung auf separate Laufwerke für Backup Gelöst
Priorität - Mittel Betreffend System - Alle

Alle Server mit Bezeichnung "HOSXXX" werden mit separaten Festplatten ausgestattet, da es auf Grund der sehr schnellen Backupprozesse durch die SSD Technologie nun bereits mehrfach zu überfüllten SSD's gekommen ist.
Die Erweiterung sollte ohne Unterbrüche möglich sein und erfolgt über das Wochenende vom 2.9.2017 bis zum 3.9.2017

Umstellung auf SSD Gelöst
Priorität - Hoch Betreffend Server - HOS108

Server 108 wird auf SSD umgestellt.
Während der Umstellung steht das System nicht zur Verfügung.

Das System wurde erfolgreich auf SSD umgestellt.

Austausch Netzteile Gelöst
Priorität - Hoch Betreffend System - Diverse

Es findet ein Austausch von allen vorhandenen Netzteilen vom Typ Eurocase statt im Rechenzentrum.
Betroffen sind Managed Server und Root Server Kunden.
Dauer pro Server 5-10 Minuten (Reboot).

Technische Störung Gelöst
Priorität - Mittel Betreffend Server - HOS110

Es liegt eine Cyberattacke vor gegen einen noch unbekannten Kunden auf dem Cluster HOS110.
Unsere Techniker arbeiten an der Behebung. Der Netzverkehr wird aufgezeichnet.
Sämtliche Anfragen auf den Cluster werden nun von unser Firewall verzögert bearbeitet, ebenfalls hat unser Transit Provider auf Backbone Ebene Filterlisten aktiviert.

04/07 - Attacke scheint vorüber
05/07 - keine Vorkommnisse 
06/07 - keine Vorkommnisse 
07/07 - keine Vorkommnisse 
08/07 - erneutes Auftretten
09/07 - erneutes Auftretten
10/07 - Vorbereitung Splittung und Verteilung per 11/07/2017 vorbereitet.

Sollten Sie als Kunde Informationen zum Verursacher haben, sind wir (und die Polizei) dankbar für diese Info.

Hardware Defekt Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Es liegt ein technischer Defekt (Mainboard Controller defekt) bei HOS109 vor.
Ersatzteile (neues Mainboard) wurden beim Hersteller soeben bestellt, diese treffen am Samstag 15. April als Kuriersendung mit dem Flugzeug ab Wien um kurz vor 8 Uhr bei uns ein und werden anschliessend zwischen 9 und 12 Uhr am Samstag Vormittag eingebaut.
Den Unterbruch bitten wir zu entschuldigen.
Danke für Ihr Verständnis.

Technische Störung Gelöst
Priorität - Mittel Betreffend Server - HOS109

Störung nach Kernel Update, Kernel Panik.
Ein Techniker is vor Ort und behebt aktuell die Störung.

Technische Störung Gelöst
Priorität - Kritisch Betreffend Server - HOS107

Ursache wird analysiert
Kernel Panik liegt vor
Schaden am Kernel wird derzeit repariert (Stand 19:24)
Kernel neu installiert.
Ursache behoben.

Umzug Telefonanlage Gelöst
Priorität - Niedrig Betreffend Anderes - INFRA-WINTERTHUR

Da wir neue Büroräume beziehen, ist unsere Telefonanlage von 17:15 bis 22:30 offline, dies betrifft alle angebotenen telefonischen Dienste.
Kunden mit SLA Verträgen können sich direkt an die im SLA Vertrag angegebene Ersatz-Mobiltelefonnummer wenden im Notfall.

Patching Gelöst
Priorität - Mittel Betreffend System - Alle

Es werden auf allen Server Patchs&Updates installiert.
Alle Server starten während 5 Minuten neu.

Memory Upgrade HOS107 Gelöst
Priorität - Hoch Betreffend Server - HOS107

Wir erweitern kurzfristig das ECC Memory bei Cluster 107.

Upgrade abgeschlossen.

Memory Upgrade HOS109 Gelöst
Priorität - Hoch Betreffend Server - HOS109

Wir erweitern kurzfristig das ECC Memory bei Cluster 109.

Upgrade abgeschlossen.

FTP im passiven Modus auf Cluster 109 Gelöst
Priorität - Mittel Betreffend Server - HOS109

Der passive FTP Service führt zu einem Login Timeout.
Dienst wurde optimiert. Funktioniert wieder einwandfrei.

Störung Apache Gelöst
Priorität - Hoch Betreffend Server - HOS109

Wir konnten das Problem der letzten Tage bei diesem System auf den Apache Dienst eingrenzen.
Der Hersteller in den USA behebt heute das Problem.

Die Folge des Problems ist eine sehr hohe Serverlast, da ein Modul nicht korrekt arbeitet.

Es kann zu Ausfällen des Webservers (Apache Dienst) während den Arbeiten kommen.

Lastprobleme Gelöst
Priorität - Hoch Betreffend Server - HOS109

Die Firewall arbeitet nun in einem stärkeren Level.

Störung Server 109 Gelöst
Priorität - Niedrig Betreffend Server - HOS109

Es wurde vom Überwachungssystem eine Störung auf Cluster 109 festgestellt.
Unser Technischer Dienst ist bereits unterwegs in das Rechenzentrum und wird in 10 Minuten vor Ort sein.

Update 23.08.2016 17:55
Ursache vermutlich eine Kernel Panik.

Update 23.08.2016 19:39
Server ist online und wird überwacht.
Ursache wohl beim Dovecot Dienst.
Wir haben die Firewall bei diesem Server vorübergehend stärker eingestellt.


Server wird überwacht und Fall anschliessend geschlossen.

Freigabe Let's Encrypt SSL Gelöst
Priorität - Hoch Betreffend System - Alle Kunden, Alle Domains, Alle Server

Wir aktivieren in den nächsten 2 Stunden auf allen Servern die Let's Encrypt Technologie.
Die SSL Zertifikate werden automatisch für alle bei uns gehosteten Domains implementiert.

Damit ist jede Seite die bei UNAXUS® gehostet ist (und auch auf den Server zeigt) nun per SSL erreichbar.
Das System prüft jede Nacht ob eine neue Domain aufgeschaltet wurde und weist sofern diese aktiv ist, automatisch ein neues SSL Zertifikat zu.

z.B. https://www.ihredomain.com

SQL Lastprobleme Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Wir haben Lastprobleme auf Server 109 festgestellt.
Die Systemadministratoren installieren ein Modul um Missbrauch auf dem SQL Server zu verhindern.
Dies kann zu einem Unterbruch von einigen Minuten führen.

Wartungsarbeiten Router Gelöst
Priorität - Niedrig Betreffend Anderes - RZ4 (CH-8404-INTERNETGROUP)

Unser Lieferant (init7 AG) spielt Firmware Updates auf einem Router am Standort RZ4 ein.

Betroffene Dienste:

- Hostingcluster 101/107/108/109/110
- Server 3861/3904/4037/3742/4264
- Diverse Testsysteme

Es kommt zu einem Unterbruch für die Server an diesem Standort von ca.

Wartung Server 3742 / 4073 Gelöst
Priorität - Mittel Betreffend System - 3742 / 4073

Es finden kurzfristige Wartungsarbeiten auf folgenden Servern statt:
- 3742
- 4073

Updates diverse Gelöst
Priorität - Hoch Betreffend System - Managed & Hosting Server

Auf Grund neuer Patchs fanden kurzfristige Wartungsarbeiten statt.
Alle Kernel wurden aktualisiert.

Wartung Apache Gelöst
Priorität - Hoch Betreffend System - Hostingcluster, Managed Server

Es wurden Sicherheitspatches eingespielt um folgende PHP Bugs zu beheben:

CVE-2016-3074 – HIGH
PHP 5.5.35
Fixed bug in the GD library related to CVE-2016-3074

PHP 5.6.21
Fixed bug in the GD library related to CVE-2016-3074

Störung Lizenzserver Gelöst
Priorität - Hoch Betreffend System - Diverse Systeme

Wir haben eine Lizenzstörung auf Grund von gestohlenen Kreditkartendaten bei einem unserer Lieferanten und der dadurch ausgelösten Sperrung unserer Firmenkreditkarte bei unserer Bank UBS AG (die uns erst heute, 1 Woche später kontaktiert hat!).

------------------------------------------
Die Behebung erfolgt bis ca. 14 Uhr.
------------------------------------------

Wartung Netzwerk Gelöst
Priorität - Hoch Betreffend Anderes - Backbone

Es finden Wartungsarbeiten in der Nacht vom 17. Februar zum 18. Februar an der Backbone statt.
Auf Grund des Austauschs der Router steht unser Netzwerk während ca. 2h nicht zur Verfügung.

Neu OWASP (mod_security) bei allen Webseiten Gelöst
Priorität - Mittel Betreffend System - Alle

Wir haben neu mod_security mit den OWASP Regeln im Einsatz auf allen Hostingservern.
https://www.owasp.org/index.php/Main_Page

Sollten Sie ein Poblem bei Ihrem Script feststellen, so kann dies daran liegen, dass Ihr Script ältere Techniken einsetzt.
Sie können im cPanel für jede Webseite einzeln mod_security mit einem Klick deaktivieren.

Wartung SQL Gelöst
Priorität - Hoch Betreffend Server - HOS107

Wir verschieben die SQL Datenbanken auf eine neue Partition im Laufe der aktuellen Wartungsarbeiten in dieser Nacht (02:00 bis 03:00 Uhr).
SQL steht für ca. 1h nicht zur Verfügung.

Änderung IP Adresse Gelöst
Priorität - Hoch Betreffend Server - HOS108

Netzwechsel für hos108.unaxus.net

Neue IP Adresse ab 16.12.2015: 195.191.240.17

Sämtliche Kunden die über unsere Nameserver routen müssen nichts unternehmen.
Alle Einträge werden von uns angepasst.

Upgrade MySQL 5.6 Gelöst
Priorität - Hoch Betreffend System - HOS107 / HOS108 / HOS109 / HOS110

Upgrade auf MySQL 5.6 gemäss Ankündigung: http://myunaxus.com/cp/announcements.php?id=28

HOS107 - Abgeschlossen
HOS108 - Abgeschlossen
HOS109 - Abgeschlossen
HOS110 - Abgeschlossen

Lastprobleme (Softwarebug) Gelöst
Priorität - Hoch Betreffend Server - HOS109

Wir untersuchen derzeit die Ursache warum der Server nur langsam reagiert (betrifft nur Apache Webserver, restliche Dienste arbeiten normal)
Der Server wird dazu neu gestartet.

17.11.2015 13:04 Ursache behoben.
Alle Ladezeiten wurden auf dem Cluster optimiert (Ursache war ein Fehler im Virtualisierungssystem)

Upgrades / Updates Gelöst
Priorität - Hoch Betreffend System - Alle

Es finden auf Grund von dringenden Updates grössere Wartungsarbeiten an allen Systemen statt.

Ausbau Vollredundanz Gelöst
Priorität - Mittel Betreffend System - Root, Managed, Switching

Im Rahmen unserer Vollredundanz Strategie werden die noch nicht redundanten Systeme (mit nur einem Netzteil, darunter auch mehrere Switchs) in den kommenden Tagen an die neuen APC Transfer ATS angeschlossen.
Dadurch ist die gesamte Infrastruktur bezüglich Stromversorgung redundant ausgelegt.

Verwendet werden Geräte des Marktführers APC
Typ: APC Rack Automatic Transfer Switch AP7721

Für die Hauptcluster (Hosting) sind keine Anpassungen notwendig, diese sind bereits seit 9 Monaten redundant ausgelegt (2 Netzteile mit 2 verschiedenen Stromkreisen).

Die Zukunft kommt
Im weiteren bauen wir in den nächsten Monaten unser zukünftiges Netz auf und betreiben in Kürze ein eigenes AS (Autonomes System).

Maildienst Gelöst
Priorität - Niedrig Betreffend Server - HOS109

Auf dem System läuft derzeit ein Scan auf Grund einer gemeldeten mit cryptophp infizierten Webseite.
Wir suchen derzeit die verursachende Webseite und werden die schadhaften Inhalte entfernen.

Update 19:13
Ursache behoben (Kunde hat infiziertes Script hochgeladen).

Umzug stegro-cos-mpr-200.unaxus.net auf hos10 Gelöst
Priorität - Hoch Betreffend Server - STEGRO-COS-MPR-200

Umzug der Accounts von Server MPR 200 (stegro-cos-mpr-200.unaxus.net) auf das neue System (hos101.unaxus.net).
Es ist mit keinem Unterbruch während der Migration zu rechnen und auch mit keinen nachträglich erforderlichen Unterbrüchen.

Damit Sie Mails abrufen/versenden können müssen Sie ggf. nach dem Abschluss den Eintrag von stegro-cos-mpr-200.unaxus.net in Ihren Mail Einstellungen auf hos101.unaxus.net ändern.

Wir informieren alle Kunden nach dem Abschluss per E-Mail.

Umzug Kunden stegro-cos-pro-104 auf hos107 Gelöst
Priorität - Mittel Betreffend Server - HOS107

Umzug der Accounts von Server 104 (stegro-cos-pro-104.unaxus.net) auf das neue System (hos107.unaxus.net).
Es ist mit keinem Unterbruch während der Migration zu rechnen und auch mit keinen nachträglich erforderlichen Unterbrüchen.

Damit Sie Mails abrufen/versenden können müssen Sie ggf. nach dem Abschluss den Eintrag von stegro-cos-pro-104.unaxus.net in Ihren Mail Einstellungen auf hos107.unaxus.net ändern.

Wir informieren alle Kunden nach dem Abschluss per E-Mail.

Wartungsarbeiten Gelöst
Priorität - Hoch Betreffend System - Zürich / Falkenstein

Alle Systeme werden im Rahmen dringender Wartungsarbeiten neu gestartet.

Wartungsarbeiten Gelöst
Priorität - Kritisch Betreffend System - 101 / 108 / 109 / 110

Es finden Wartungsarbeiten statt.
Die entsprechenden Systeme stehen während jeweils ca. 5-10 Minuten nicht zur Verfügung.$

Status:
X1 -> OK
X2 -> OK
101 -> OK
108 -> OK
109 -> OK
110 -> OK

Umzug Kunden stegro-cos-pro-102 auf hos110 Gelöst
Priorität - Mittel Betreffend Server - HOS110

Wir werden am 21.12.2014 ab 14 Uhr mit dem Umzug der Accounts von Server 102 (stegro-cos-pro-102.unaxus.net) auf das neue System (hos110.unaxus.net) beginnen.
Es ist mit keinem Unterbruch während der Migration zu rechnen und auch mit keinen nachträglich erforderlichen Unterbrüchen.

Damit Sie Mails abrufen/versenden können müssen Sie ggf. nach dem Abschluss den Eintrag von stegro-cos-pro-102.unaxus.net in Ihren Mail Einstellungen auf hos110.unaxus.net ändern.

Wir informieren alle Kunden nach dem Abschluss per E-Mail.

Es wird hier regelmässig angegeben, welche Domains bereits umgezogen sind (Anfangsbuchstaben).

Status: Alle Accounts erfolgreich transferiert.

NEUE HOSTNAMEN ALLE HOSTING KUNDEN Gelöst
Priorität - Hoch Betreffend System - Alle

Wir ersetzen diverse Hosting Server nachdem diese das Alter von 3 Jahren erreicht haben.
Die Änderung erfolgt zwischen dem 1. und 31. Dezember 2014. Wir transferieren pro Tag mehrere hundert Accounts unterbruchsfrei.

Ggf. müssen Sie den Hostnamen ändern in Ihrem Mailprogramm und bei Webdisk sofern Sie verschlüsselte Dienste einsetzen.
Wenn Sie keine verschlüsselten Dienste nutzen, ändert sich für Sie nichts.


Der Hostname steht jeweils in der Adresszeile Ihres Browsers, wenn Sie im myunaxus.com auf Login cPanel klicken.
z.B. hos110.unaxus.net

Unterbruch vom 16-17.12.2014 Gelöst
Priorität - Mittel Betreffend System - 108/109/110

17.12.2014 23:45 Update | Alle Dienste wieder erreichbar, sollte Ihre Domain noch nicht erreichbar sein, so liegt dies am DNS Ihres Internetanbieters, dies sollte sich von selbst innert 2-4h je nach dem welchen Internetzugang Sie verwenden lösen. Sie können bei Fragen jederzeit unseren Kundendienst kontaktieren, dieser hilft Ihnen gerne weiter.

Für die Umtriebe bitten wir um Entschuldigung. Mit der langen Dauer des Prozesses haben weder wir noch das beauftragte Unternehmen gerechnet.
 

- KEINE WEITEREN UNTERBRÜCHE GEPLANT  -



######### FRÜHERE STATUSMITTEILUNGEN #########

Als Abschluss der Wartung muss das Dateisystem der Partitionen ungeplant verändert werden, dies ist bei zukünftigen Servern nicht mehr erforderlich.

Während dieser Zeit sind alle Dienste nicht verfügbar
bzw. Ordner werden leer angezeigt (das Verzeichnis mit allen Einstellungen/Daten/etc. ist gesperrt).

WIR EMPFEHLEN DRINGEND KEINE VERÄNDERUNGEN DURCHZUFÜHREN WÄHREND DIESER ZEIT!

16.12.2014 17:24 Update | Partitionierung noch in Bearbeitung
16.12.2014 21:22 Update | Server 108 abgeschlossen
16.12.2014 21:22 Update | Server 109 abgeschlossen
16.12.2014 21:22 Update | Server 110 noch in Bearbeitung
17.12.2014 09:09 Update | Nächster Status folgt
17.12.2014 09:19 Update | Server 110 noch in Bearbeitung (nächstes Update ca. 13 Uhr)
17.12.2014 10:14 Update | Da wir immer wieder gefragt wurden, was die Ursache ist, hier der genaue Report (natürlich ist unser Ziel das gleiche wie das unserer Kunden = möglichst wenig Ausfallzeiten):
### REPORT ###
Auf den Systemen wurde am 16.12.2014 um ca. 14 Uhr festgestellt, dass die Partition "/" bedingt durch eine grosse Anzahl an SQL Daten nicht ausreichend für den Dauerbetrieb sein wird. Wir haben deshalb ein externes Unternehmen (Linux Spezialisten) beauftragt die Partition /home (hier liegen die Kundendaten) zu verkleinern um 200 GB. Dieser Vorgang (Linuxbefehl resize2fs) dauert je nach Festplattenauslastung unterschiedlich lange. Deshalb wurde sofort mit den Arbeiten begonnen um min. 1 Nacht dazwischen zu haben, was jedoch bei einem Server nicht ausreichte. Aktuell läuft der Befehl noch auf dem Cluster hos110, ein Abbruch hätte eine hohe Wahrscheinlichkeit für Datenverluste zur Folge, deshalb warten wir derzeit noch ab. Selbstverständlich verfügen wir von allen Kunden über Datensicherungen für den Ernstfall.

Auf Anfrage wurde Geschäftskunden empfohlen ggf. einen Wechsel auf ein myBUSINESS Hosting in Betracht zu ziehen
Warum und was ist der Unterschied?
Auf einem Business Server hat es weniger Kunden / Server = weniger Dateien / Server -> Wartungsarbeiten gehen so von sich aus immer schneller.
### REPORT ###
17.12.2014 13:00 Update | Wir haben wie folgt entschieden. Der Prozess läuft weiterhin, ist aber noch nicht abgeschlossen. Wir warten nun noch maximal bis am 18.12.2014 um 04:00 Uhr. Sollte der Prozess abgeschlossen sein, sind alle Dienste sofort wieder verfügbar (dies kann jederzeit der Fall sein). Sollte aber der Prozess nicht abgeschlossen sein bis zu diesem Zeitpunkt, so schalten wir auf die alten Server um, welche den Stand vom 14.12.2014 - 17.12.2014 haben. Damit sind spätestens um 08:00 Uhr am 18.12.2014 sämtliche Dienste wieder verfügbar. Es kommt nach dem 18.12.2014 08:00 Uhr zu keinen weiteren Unterbrüchen.

Für die Umtriebe bitten wir um Entschuldigung. Mit der langen Dauer des Prozesses haben weder wir noch das beauftragte Unternehmen gerechnet.
17.12.2014 13:00 19:30 Update | Abbruch des Prozesses. Wir schalten unter Hochdruck die alten Server 102 und 104 ein, die Systeme mit Stand zwischen Sonntag und Dienstag sind innert 1h wieder verfügbar, ggf. dauert die Routingänderung je nach Zugangsprovider ca. 1-2h (ggf. PC neu starten)
17.12.2014 13:00 19:30 Update | Es wird in Kürze ein neuer Eintrag im Serverstatus erscheinen. Kunden von Server 102 werden auf das neue System 109 transferiert (unterbruchsfrei).
17.12.2014 13:00 22:18 Update | Wir haben noch Probleme mit der Rückladung der DNS Zonen (da alle Zonenfiles jetzt veraltet sind in den Computerclustern), wir arbeiten mit einem Expertenteam in Texas nun daran dies noch zu beheben, damit die betroffenen Domains wieder auf den Server zeigen.

Umstellungen / Unterbrüche Gelöst
Priorität - Kritisch Betreffend System - Diverse

Es laufen derzeit noch diverse Umstellungen auf die neuen Server.
Es kann ohne Ankündigung zu kurzzeitigen Unterbrüchen am 16.12.2014 (Nachmittags) kommen.

Wir rechnen mit einem Abschluss der Arbeiten bei den Privatkundenprodukten (myHOSTING, etc.) bis am 16.12.2014 um 18:00 Uhr

RACK WECHSEL / RACK CHANGE Gelöst
Priorität - Hoch Betreffend System - Root Server / Managed Server / Storage Server / HOS108

Es findet ein Wechsel des Racks statt für Systeme des Typs:
We change the rack for several systems like:

  • ROOTSERVER
  • MANAGED SERVER
  • HOS108 HOSTING SERVER
  • SWITCH's
  • STORAGE SERVER


Der Unterbruch beträgt bis zu 30 Minuten, alle Server werden heruntergefahren/neu gestartet
The outage could take up to 30 minutes, all Servers will be poweroff/rebooted

Störung Gelöst
Priorität - Kritisch Betreffend Server - HOS110

10/10/2014 17:41
Störung | Ursache wird analysiert

10/10/2014 18:11
System Serie 2012 (Ersatz mit redundantem System per Ende 2014 eingeplant)
Netzteil defekt | Ausgetauscht

10/10/2014 21:00
Störung Datenbank bedingt durch Ausfall

10/10/2014 23:00
Störung Datenbank eskaliert an externes Unternehmen

10/10/2014 11:00
Wir haben SQL in einem speziellen Modus gebootet, es kann weiterhin jederzeit zu Unterbrüchen kommen. Am Montag wird ein Datenbankexperte bedingt durch die Komplexität des Problems die Fehler beseitigen (gecrashtes INNODB -> http://de.wikipedia.org/wiki/InnoDB).

-> WIR EMPFEHLEN EINE DATENBANKSICHERUNG (SOFERN MÖGLICH) ZU ERSTELLEN IN PHPMYADMIN MIT DER EXPORT FUNKTION <-
-> WIR VERFÜGEN SOFERN NOTWENDIG ÜBER EINE SICHERUNG MIT EINEM ALTER VON MAX CA. 10 TAGEN <-

INNODB Datenbankstörung Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Protokoll Störung Cluster 100
-> Sie können ein Backup anfordern (siehe ganz unten), wenn Sie feststellen, dass Datenanken nicht korrekt arbeiten.

- 02.07.2014 - 
10:30 Eskalation an Spezialunternehmen
11:25 Filesystem Störung temporär gelöst (defekter Raid Controller oder alle Festplatten defekt)
12:30 Es liegt noch ein Datenbankproblem vor, wir arbeiten an der Behebung.
16:25 Wir haben den Fall mit hoher Priorität eskaliert an cPanel USA
16:35 cPanel USA hat mit der Analyse begonnen

- 03.07.2014 -
01:49 Es stehen keine innodb Datenbanken zur Verfügung
14:30 Analyse durch Spezialunternehmen abgeschlossen
16:00 ENTSCHEID | Aufgrund eines schweren Fehlers (Datenbankserver wie auch Hardware) welcher nicht zureichend behoben werden kann ohne den Verlust von Datenbanken bzw. mit einem enormen Aufwand verbunden ist, haben wir uns zum vorzeitigen Ersatz des Servers (inkl. Umzug ins neue Datencenter) entschieden. Die Hardware (Server) wird am Freitag bei uns eintreffen und der Server sofort in Betrieb genommen. Wir beginnen anschliessend über das Wochenende mit dem Umzug aller Kunden auf das neue System. Es besteht die Möglichkeit sofern nur geringe Daten vorliegen Kundenaccounts bereits vorzeitig mit Datensicherungen auf andere Systeme zurückzuladen (bitte kontaktieren Sie den Kundendienst mit dem Betreff "Datensicherungsanforderung System 100". Sollten Sie ggf. Datenverluste feststellen (Datenbanken), kontaktieren Sie ebenfalls den Kundendienst. Es bestehen für das System Wochen - und Monatssicherungen.

- 04.07.2014 -
14:00 innodb steht wieder zur Verfügung, jedoch sind nicht mehr alle innodb Daten vorhanden für einzelne Accounts.

Sie können ein Backup anfordern mit einem Ticket (Achtung: Backup nur anfordern wenn die Webseite nicht funktioniert):
Betreff: Datensicherungsanforderung System 100 (Tickets werden auch über das Wochenende verarbeitet, Achtung: dieser Vorgang führt zum zurücksetzen _aller Daten_ auf das letzte Backupdatum ca. 4-8 Tage vorher). 



System Update CVE-2014-7169 Gelöst
Priorität - Kritisch Betreffend System - Alle

Es erfolgt ein ausserordentliches Update zur Beseitigung der letzen Lücken.
Die Systeme starten nach dem Update neu.

Hintergrund: CVE-2014-7169
-> http://www.heise.de/security/meldung/Bash-Luecke-ShellShock-ist-noch-nicht-ausgestanden-2403607.html

Vorgehen bei einer Datenbankstörung Gelöst
Priorität - Mittel Betreffend Server - HOS109

Sollten Sie eine Datenbankstörung feststellen (Ursache innodb crash), so können Sie eine Datensicherung kostenlos bei unserem Support anfordern.

Verwenden Sie folgende Daten:

Als Betreff: Datensicherungsanforderung Server 100
Eintragen als Text: Domainname (Internetadresse) + Satz "Ich möchte, dass mein Account auf das letzte Backupdatum zurückgesetzt wird."

Update | OpenSSL Gelöst
Priorität - Kritisch Betreffend Anderes - US / DE / CH / AT / FR / NL

Security Update

Umstellung mehrer IP Adressen Gelöst
Priorität - Mittel Betreffend System - Diverse

Im Rahmen einer Systemerweiterung werden folgenden Serversystemen neue IP Adressen zugeteilt.
Die Umstellung ist geplant für Sonntag 6. April 2014 ab 16.00 Uhr

Die Umstellung erfolgt automatisch ohne Unterbruch, sofern Sie über unsere Nameserver ns1.unaxus.net und ns2.unaxus.net konnektiert sind (-> ist immer der Fall sofern Sie dies nicht manuell geändert haben oder andere DNS Server nutzen).

Ihre aktuelle IP Adresse können Sie z.B. via http://www.net.princeton.edu/traceroute.html testen (letzter Eintrag der Ausgabe)

CLUSTER = Aktuelle IP => Neue IP
PRO-100 = 176.9.19.43 => 176.9.239.239
PRO-102 = 88.198.67.227 => 78.47.250.230
PRO-104 = 176.9.90.165 => 176.9.230.180
MPR-200 = 176.9.90.164 => 176.9.169.190

Wartungsarbeiten Gelöst
Priorität - Kritisch Betreffend System - ALL

Es finden umfangreiche Wartungsarbeiten statt.
Es kann kurzfristig zu Verbindungsunterbrüchen kommen.

MySQL Upgrade auf 5.5 Gelöst
Priorität - Kritisch Betreffend System - Alle

Es findet derzeit auf allen Servern ein Upgrade auf MySQL 5.5 statt.
Während diesen Updates (ca. 5-15 min pro Server) kann es kurzfristig zu einem Internal Server Error kommen.

Störung Gelöst
Priorität - Kritisch Betreffend Server - HOS110

Störung, wir arbeiten an der Behebung.

Störung Mailserver 100 und 102 Gelöst
Priorität - Kritisch Betreffend System - 100 / 102

In Folge von zwei kompromittierten Accounts räumen wir derzeit die Mailqueue auf.

Störung Gelöst
Priorität - Kritisch Betreffend Server - HOS107

Es liegt eine technische Störung vor.

Die Ursache ist bekannt und die Behebung in Bearbeitung.
Ursache: Ausgehende DOS (Kundenaccount wird identifiziert)

Es können via Kundendienst keine ergänzenden Details übert Art und Dauer bekannt gegeben werden, danke für Ihr Verständnis.

Update PHP 5.4.19 Gelöst
Priorität - Mittel Betreffend System - Alle

Es findet ein Update diverser Dienste statt.

Es kann zu kurzfristigen Verbindungsunterbrüchen kommen.

UPDATE PHP 5.4.18 Gelöst
Priorität - Mittel Betreffend System - Alle

Wir updaten PHP auf Version 5.4.18

Upgrade PHP 5.4 Gelöst
Priorität - Hoch Betreffend System - Alle

Ab 31. März 2013 führen wir auf allen Systemen die aktuellste stabile Version von PHP 5.4 ein.
Wir bitten Sie ihre Scripte ggf. anzupassen und bis zu diesem Datum ggf. zu aktualisieren.

Beachten Sie bitte, dass diverse als "depreaced/veraltet" markierte Funktionen von PHP 5.3 bei PHP 5.4 komplett verschwinden (siehe php.net).

Hauptveränderung (spürbar):
- deutlich geringere Ladezeiten

Der Support von PHP 5.3.x endet bei uns offiziel am 30. März 2013.

Lokale Störung Büro UNAXUS Gelöst
Priorität - Mittel Betreffend Anderes - Büros von UNAXUS

In Folge einer Störung bei unserem Upstream Provider sind derzeit grosse Teile unserer Telefonleitungen und die Internetzugänge in unseren Büros gestört.
Die Server sind nicht betroffen.

Es kommt zu einem Unterbruch in der Bearbeitung der Supportfälle von ca. 1 Stunde.
Die Techniker beheben die Störung schnellstmöglich, wir sind ca. 15 Uhr wieder für Sie erreichbar.

Tickets mit hoher Priorität werden normal bearbeitet via Backupleitung.
Sollte die Störung länger dauern, werden wir komplett via Backupleitung routen, wir sind spätestens um 15 Uhr wieder komplett online.

Störung bei PHP Seiten Gelöst
Priorität - Niedrig Betreffend System - Alle Server

Nach einem Reboot der Server nach einem Update ist ein Problem aufgetaucht.
Betroffen sind Kunden mit CMS Systemen und PHP Scripten.

Update 15:26 Apache wurde neu kompiliert
Update 15:27 Logfiles werden geprüft
Update 15:39 Wir haben den Fall eskaliert an cPanel (US)
Update 17:04 cPanel arbeitet an der Behebung
Update 18:10 cPanel arbeitet an der Behebung
Update 18:41 Wir haben den Fall eskaliert an cloudlinux (US)
Update 19:34 Vorübergehend durch Deaktivierung eines für den Betrieb nicht unbedingt erfoderlichen Dienstes behoben, wir arbeiten weiter an der Ursachenbehebung
Update 20:06 Das Problem ist erneut aufgetretten -> es scheint sich um einen Bug zu handeln, die Techniker in den USA arbeiten unter Hochdruck daran.
Update 09:25 Es wird immer noch am Problem gearbeitet (PHP funktioniert via Kommandozeile, jedoch nicht via Apache).
Update 09:50 Eskalation an einen Experten in Deutschland
Update 10:48 Wir sind wieder online.

Technische Störung bei Paypal Gelöst
Priorität - Kritisch Betreffend Anderes - Paymentgateway

In Folge einer technischen Störung bei Paypal werden Zahlungen nicht automatisch als bezahlt markiert.
Paypal ist über die Störung informiert und arbeitet an der Behebung.

Die Zahlungen werden derzeit manuell gutgeschrieben, es kann deshalb ca. 1h dauern bis die Bestellung freigeschaltet wird.

Wartungsarbeiten Gelöst
Priorität - Mittel Betreffend Server - STEGRO-COS-MPR-200

Es werden umfangreiche Wartungsarbeiten durchgeführt.
Sollten Sie Fehlfunktionen feststellen, melden Sie sich bitte beim Kundendienst.

Prioritäres Update Gelöst
Priorität - Kritisch Betreffend System - Alle Server

Art: Alle Server wurden geupdated, es kam zu einem Unterbruch von ca. 10 Minuten pro Server
Anmerkung: Dieses Update wurde nicht angekündigt und bedingt durch die Einstufung "dringend" sofort eingespielt.


Technische Störung Gelöst
Priorität - Kritisch Betreffend Server - HOS110

Es liegt eine technische Störung vor.
Die Techniker im Rechenzentrum arbeiten an der Behebung.

Rückstellung auf PHP 5.3.19 Gelöst
Priorität - Hoch Betreffend System - Alle

Im Rahmen von Rückmeldungen mehrerer Shopbetreiber stellen wir alle Systeme bis Ende QT1 2013 bedingt durch z.T. fehlende Updates bei Scriptherstellern alle Server zurück auf PHP 5.3.19
Wir bitten entstandene Umtriebe zu entschuldigen.

Update Gelöst
Priorität - Mittel Betreffend System - All Servers

Upgrade to a higher PHP version. More website speed now!
Upgrade von PHP auf eine höhere Version. Schnellere Ladezeiten ab sofort!

Update Gelöst
Priorität - Hoch Betreffend System - All

# ENGLISH

Update installation (+new Kernel) on all servers.

Services interuption is possible.

All systems will be rebooted (5 minutes outage)

 

# DEUTSCH

Updateinstallation (+neuer Kernel) auf allen Servern

Dienstunterbrechnung ist möglich

Alle Systeme werden nach Abschluss neu gestartet (Unterbruch von 5 Minuten)

 

Temporärer Ordner Gelöst
Priorität - Hoch Betreffend Server - HOS110

Infolge eines Scripts mit Fehlfunktionen kam es zu einem Überlauf des temporären Ordners, unsere Techniker arbeiten an der Lokalisierung und Behebung.

Technisches Problem Gelöst
Priorität - Kritisch Betreffend Server - HOS107

Technische Störung, die Ursache wird analysiert.

Update Gelöst
Priorität - Kritisch Betreffend System - Alle

Es wird kurzfristig ein Update eingespielt welches wir als prioritär werten.

Es kann zu kurzfristigen Unterbrüchen (ca. 5-10 Minuten) kommen.

 

Erledigt:

[x] 100

[x] 102

[x] 104

[x] 200

Speicher /tmp Gelöst
Priorität - Mittel Betreffend Server - HOS109

Es bestand ein Überlauf durch ein fehlerhaftes Kundenscript im Ordner /tmp

Die Techniker haben die Ursache bereits gelöst.

Technisches Problem Gelöst
Priorität - Kritisch Betreffend Server - HOS107

Es liegt eine technische Störung vor.

Art: Apachestörung

Behebung: läuft

Infrastrukturumzug Gelöst
Priorität - Mittel Betreffend System - Alle Systeme

Wir stellen sämtliche Server um und betreuen in der Zukunft alle Systeme administrativ selbst (Einstellung Outsourcing gesamter Betrieb*), dieser Umzug erfolgt Unterbruchsfrei und hat das Ziel die Servicequalität und Verfügbarkeit deutlich zu verbessern. Erhalten Sie die Meldung "Page Suspended", kontaktieren Sie umgehend den Kundendienst, dieser Zustand tritt bei einem DNS Routing Problem auf und verhindert inkomplette Datenbestände.


Aktueller Status: Umzug abgeschlossen!

Server abgeschlossen:

Alle


31/01/2012 DNS Umstellung komplett abgeschlossen!


Spürbare Veränderung: Deutliche Geschwindigkeitssteigerung bei den Ladezeiten, insbesondere für Kunden in Deutschland


Serverkonfiguration neu:

Servicetagebuch:

06/01/2012 Server | stegro-cos-bck-264 (Cluster mit 21 TB Speicherplatz) ist online, es wurde ein Disaster Recovery der externen Server erstellt

17/01/2012 Wir haben prioritär mit der Inbetriebnahme der neuen Hostingserver begonnen

17/01/2012 Wir haben die neuen DNS Systeme installiert (aktiv im Standbybetrieb)

17/01/2012 Server | stegro-cos-nam-100 ist online

17/01/2012 Server | stegro-cos-nam-102 ist online

18/01/2012 Wir haben die ersten Hosting Systeme installiert (aktiv im Standbybetrieb)

18/01/2012 Server | stegro-cos-pro-100 ist online

18/01/2012 Server | stegro-cos-pro-102 ist online

18/01/2012 Server | stegro-cos-pro-104 ist im Installationsvorgang

18/01/2012 Server | stegro-cos-mpr-200 ist im Installationsvorgang

20/01/2012 Server | stegro-cos-pro-104 ist online

20/01/2012 Server | stegro-cos-mpr-200 ist online

22/01/2012 Umzug | Firmenwebseite UNAXUS - die Seite befindet sich jetzt auf einem der neuen produktiven Systeme, das Kundensystem ist nun deutlich schneller (Bugs die noch auftretten können ggf. durch fehlende Module, werden laufend gefixt, Ende der Arbeiten Montag Abend)

30/01/2012 Umzug | Die DNS Server sind umgezogen und werden neu an 2 physikalisch getrennten Orten (verschiedene Rechenzentren) betrieben

31/01/2012 Umzug | Die DNS Server wurden komplett neu geschrieben, der Umzug startet am 01/02/2012

01/02/2012 Umzug | Die DNS Server wurden bzgl. Konfiguration überholt

07/02/2012 Update | Alle Systeme wurden auf PHP 5.3.10 geupdatet und neu kompiliert.

09/02/2012 Inbetriebnahme | Neue Montoringlösung

21/02/2012 Anpassung | Es wurden div. Anpassungen vorgenommen, u.a. wurde Port 587 für den SMTP als Alternative konfiguriert.

21/02/2012 Inbetriebnahme | Neue Montoringlösung Inbetriebnahme abgeschlossen

23/02/2012 07/02/2012 Update | Alle Systeme wurden mit Exif und PDO (Sqlite3) erweitert und neu kompiliert.

 

*Es werden weiterhin Verträge mit 2 spezialisierten Unternehmen unterhalten um im Notfall schnell reagieren zu können, ebenfalls halten wir ein Kontingent an "Express-Unterstützung" durch cPanel Inc. neu vor.

 

 

Technische Störung DNS Gelöst
Priorität - Kritisch Betreffend System - Nameserver 2

Nach einem Hardwaretausch liegt ein Fehler vor.

Der Datencenterbetreiber ist über die Probleme informiert und wird diese beheben.

Störung Server 021 Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Es liegt eine Störung vor bei Server 021

Wir haben den Fall an cPanel eskaliert, ein Techniker ist bereits mit der Behebung beschäftigt.

Technisches Problem FTP Dienste Gelöst
Priorität - Kritisch Betreffend Anderes - UNAXUS Server 21, 23, 25

Es liegt ein durch ein automatisiertes Update verursachtes Fehlverhalten beim FTP Dienst vor (betrifft Server 21, 23, 25).

Äusserung des Problems: Login wird als ungültig ausgegeben.

Eine Behebung erfolgt umgehend, bitte haben Sie dafür Verständnis, dass wir keine erweiterte Auskunft geben können zumal dieser Server von einem externen Dienstleister administrativ betreut wird noch bis ca. Mitte März.

Sollten Sie Daten hochladen, bzw. verändern wollen, so können Sie dies über den Filemanager im Controlpanel uneingeschränkt tun.


[blocked]

Technisches Problem Gelöst
Priorität - Kritisch Betreffend Server - HOS107

Es liegt ein technisches Problem bei Server uxs-bsd-240-025 vor.

Der Pikett Dienst wurde aufgeboten.

Ladezeiten / E-Mail Gelöst
Priorität - Hoch Betreffend System - Alle Freebsd Server

Bedingt durch einen FREEBSD Bug sind die Ladezeiten derzeit trotz sehr geringer Auslastung sehr schlecht. Da leider dieses Problem zeitgleich mit Problemen bei unserem Provider aufgetretten ist, haben wir bis jetzt keine Reaktion erhalten obwohl wir für solche Fälle Reaktionszeitvereinbarungen unterhalten. Dies ist die Ursache für die lange Dauer. Aus Sicherheitsgründen ist dieser Server nicht via SSH erreichbar, sondern nur aus dem lokalen Netz - in diesem Fall ist jedoch der Zugriff durch externe Experten notwendig, unser Provider hat leider unsere Anfrage bisher nicht bearbeitet, wir hoffen das dies spätestens am Montag gemacht wird.

Anmerkung: Wir entschuldigen uns für die lange Dauer der Behebung, es dürfte noch bis am Montag andauern. Wir werden durch diesen Vorfall unsere Konsequenzen ziehen und frühzeitig sobald wie möglich alle Kunden in unser Datencenter umziehen. Unser Datencenter geht voraussichtlich am 1 Oktober ans Netz, ab Montag nächster Woche beginnen wir mit der Einrichtung einer Übergangs-Hostinginfrastruktur.


Update 26.09.2011 21:25

Die Techniker aus den USA sind nun am Problem direkt dran. Wir rechnen in Kürze mit einer Behebung (voraussichtlich über die kommende Nacht hinweg). Um in der Zukunft schneller zu reagieren haben wir entsprechend unsere Verträge erweitert und können neu innert 30 min externe Hilfe aus den USA (24/7) in Anspruch nehmen.

Update 27.09.2011 22:25

Die Techniker aus den USA arbeiten weiterhin am Problem, es gestaltet sich äusserst schwierig das Problem kurzfristig zu lösen.

Update 28.09.2011 11:21

In der vergangenen Nacht hatten die Techniker das Problem auf Server 21 gelöst, weitere Server sollten nun innert 12h folgen (aktuell ist bei unserem US-Technikpartner 4 Uhr Nachts), in 5 Stunden wird die Behebung fortgesetzt. Die Ursache ist nun definitiv gelöst.

Update 28.09.2011 23:38

Freebsd Techniker von cPanel konnten den Bug auf allen Servern beheben. Die Störung ist zu Ende.

Technisches Problem Gelöst
Priorität - Mittel Betreffend Server - HOS107

Technisches Problem, Ursache ist ein Disk/Adapter Problem / Server wieder erreichbar. Wir überwachen den Server laufend, eine genaue Analyse erfolgt am Montag.

18/09/2011 13:30 Erhöhte Last festegestellt, Neustart da Zugriff nicht möglich, Analyse läuft

18/09/2011 14:45 Serverlast normal, aktive Überwachung

19/09/2011 00:14 Ursache lokalisiert und behoben, Hintergrund war ein eher seltenes Fehlverhalten an einem Dienst für die Mailzustellung, wir haben den entsprechenden Kundenaccount geschlossen. Gleichzeitig wurden andere Kundenaccounts mit div. Fehlverhalten (i.d.R. Wordpress Memory falsch eingestellt) temporär blockiert, diese Accounts können nach der Behebung wieder freigegeben werden.

19/09/2011 15:55 Sperrung des Angreifers auf dem Switch, da Server4you zu langsam bzw. bisher überhaupt nicht reagiert / Neustart des Servers da Ports nicht mehr schliessbar (Dauer ca. 30 min).

19/09/2011 23:02 Leider bestehen immer noch Zugriffsprobleme. Da dieser Server durch die Firma GENOTEC AG in Basel betreut wird, warten wir weiterhin auf Behebung. Wir werden zur Stabilitätssicherung langfristig alle Accounts bei diesem Anbieter abziehen, auf unsere eigene Infrastruktur welche in wenigen Wochen ans Netz geht. Danke für Ihr Verständnis.

Technische Störung DNS Gelöst
Priorität - Kritisch Betreffend Anderes - Betrifft alle Kunden

Es liegt eine technische Störung vor, der für diesen Standort zuständige Pikett Dienst ist bereits informiert.

Wir halten Sie hier auf dem neusten Stand.

Fullbackup Serversysteme Basel Gelöst
Priorität - Mittel Betreffend System - ALLE

Seit heute morgen werden die regelmässig zur Langzeitarchvierung vorgesehenen Fullbackups aller Serversysteme (Genotec AG@IWB Basel) erstellt.

Es kann deshalb kurzfristig zu längeren Ladezeiten kommen.

Wir danken Ihnen für Ihr Verständnis.

Apache Dienst Gelöst
Priorität - Hoch Betreffend Server - HOS109

Es besteht ein technisches Problem beim Apache Webdienst des extern untergebrachten Server 21.

Wir haben die Techniker der Firma Genotec AG aufgeboten, welche die Behebung durchführen werden.
Das Problem ist Konfigurations-/Softwarebedingt und entsprechend komplex.

# Update 23.06.2011 09:54 - Alle Dienste sind verfügbar.

# Update 23.06.2011 13:54 - Der Apache muss im Verlauf des Nachmittags neu kompiliert werden. Das System steht deshalb temporär während rund 30 Minuten nicht zur Verfügung.

# Update 23.06.2011 17:01 - Das Problem ist sehr komplex und konnte von den Technikern nicht gelöst werden, deshalb wurde Hilfe beim cPanel Support in Houston (USA) angefordert. Die Behebung wird sich dadurch leider verzögern.

# Update 24.06.2011 10:38 - Die Ursache für die Problematik ist ein Bug bei PHP. Da diese Problematik nicht behoben werden kann (kein Bugfix) wird PHP zurückgestellt auf die Version 5.2.X. Nach der Umstellung sollte diese Problematik definitiv gelöst sein. Es kommt während der Deinstallation / Installation von PHP zu einem Unterbruch von ca. 30 min.

Technical Issue Gelöst
Priorität - Kritisch Betreffend Server - HOS109

20/06/2011 11:43 - Technische Störung

20/06/2011 13:15 - Ursache lokalisiert (Statistikscript eines Kunden), Störungsbehebung läuft

20/06/2011 13:30 - voraussichtliches Ende der Störung

 

Technical Issue Apache Gelöst
Priorität - Hoch Betreffend Server - HOS107

Technisches Problem Apache Server 25

Das Problem wurde behoben.

System Overload Gelöst
Priorität - Kritisch Betreffend Server - HOS107

Auf Server 25 gab es eine starke Last die zu einem Kernelüberlauf geführt hat. Dieser Überlauf scheint auf einen kompromittierten Kundenaccount zurückzuführen zu sein mit einem schadhaften Script. Wir haben diesen Kunden gesperrt.

Die Verfügbarkeit konnte wieder hergestellt werden.

Kernel Panic Gelöst
Priorität - Kritisch Betreffend Server - HOS107

Server 25 ist bedingt durch ein Kernel Panic (Server Crash) nicht verfügbar. Es wird an einer Lösung gearbeitet.

Update 13:53 | Es wird ein Background Systemcheck durchgeführt und eine Partition repariert. (Dauer min. 30 min)

Serversystem: Shared Hosting 25, Basel
Notice: Die Störung wurde an unseren Vertragspartner, die Genotec AG gemeldet, diese wird die Behebung durchführen.

Infrastruktur Basel Gelöst
Priorität - Kritisch Betreffend Anderes - Anbindung

11.03.2011 11:06:54

Der Angriff konnte soweit abschwächen das keine merkliche Einschränkung mehr besteht und die Netzauslastung hat sich soweit normalisiert.

11.03.2011 10:51:22

Teile des Angriffs konnten gefiltert respektive blockiert werden und dadurch ist eine gewisse Erreichbarkeit der Server wieder vorhanden. Es wird unter Hochdruck an einer abschliessenden Lösung des Problems gearbeitet.

Für die Umstände möchten wir uns entschuldigen.

11.03.2011 09:07:51

Seit heute Nacht erlebt unser Zugangsprovider einen Angriff auf Teile des Netzwerks in Basel. Es sind nicht alle Kunden davon betroffen. Die Techniker sind dabei die Angriffe entsprechend abzuwehren

Wartungsmassnahme Gelöst
Priorität - Kritisch Betreffend Server - HOS107

System 25 steht vorübergehend nicht zur Verfügung infolge von dringenden Wartungsmassnahmen am KVM durch einen Defekt am 10/02/2011 (Ersatzteil ist vom Hersteller eingetroffen). Gleichzeitig wird das System mit einer neuen Backuplösung erweitert.

 

Server ist seit 13:00 Uhr wieder am Netz, es wird aber noch ein Neustart in den nächsten 2h notwendig sein (Unterbruch 10 min).

Attacke Server 23 Gelöst
Priorität - Kritisch Betreffend Server - HOS110

Leider sind wir seit rund 1 Woche Ziel einer DDOS Attacke, dadurch war Server 23 einige Male nicht erreichbar.

Die Techniker haben verschiedene Massnahmen getroffen die Angriffe abzuwehren, leider ist es in der Regel nicht möglich den Angriff ganz abzuwehren.

Technische Störung Gelöst
Priorität - Kritisch Betreffend Server - HOS110

Die Ursache konnte behoben werden.

Technisches Problem Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Technisches Problem, Ursache ist eine Lastschwankung bei einem Kundenaccount.
Der Bereitschaftsdienst konnte die Ursache lösen.

Systemstörung Gelöst
Priorität - Kritisch Betreffend Server - HOS107

Technisches Problem / Hardware Defekt
Massnahmen zur Behebung sind eingeleitet.

Systemstörung Gelöst
Priorität - Mittel Betreffend Server - STEGRO-COS-MPR-200

Server M1 ist infolge technischer Probleme eingeschränkt erreichbar.

Ursache ist ein Angriff auf die Infrastruktur eines Kunden auf dem System (DDOS). Wir haben den Account entfernt, aktuell nimmt die Last ab.

Wir rechnen mit einem in Kürze normalen Betrieb.

Wartungsarbeiten Gelöst
Priorität - Mittel Betreffend System - Alle Systeme

Wir werden am Wochenende diverse nicht mehr verwendete Ressourcen freigeben auf allen Systemen, dadurch werden verschiedenste Dienste in kurzen Abständen neu gestartet.

Es ist zu erwarten, dass der FTP Dienst mehrfach die Verbindung beenden wird, sprich dieser Dienst je nach System unterschiedlich lange nicht genutzt werden kann während dem Vorgang.

Bei Fragen wenden Sie sich bitte an den Technischen Heldpesk.

Out of Service Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Als Folge eines Scriptfehlers bei einem unserer Kunden musste das System 21 neu gebootet werden.

Sämtliche Services wurden geprüft und der Server ist wieder am Netz.

Störung Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Rund 1h Downtime bedingt durch Überlastung.

--> Verursacher wurde gesperrt
--> System wurde neu gestartet

Technical Problem Gelöst
Priorität - Kritisch Betreffend Anderes - Infrastruktur Basel

Bedingt durch eine erneute Attacke gegen unsere Infrastruktur sind mehrere Systeme derzeit nicht erreichbar.

Wir arbeiten an der Behebung und werden in Kürze den betroffenen Dienst erweitert absichern.

Zustellprobleme Maildienste Gelöst
Priorität - Kritisch Betreffend Server - STEGRO-COS-MPR-200

Durch ein automatisches Releaseupdate sind nachfolgende Dienste derzeit nicht vollständig erreichbar. Die Behebung erfolgt umgehend.

Betroffene Dienste:
- exim
- imap
- pop
- spamd

BF Attacke Gelöst
Priorität - Kritisch Betreffend Anderes - Standort Basel

Bedingt durch eine Attacke auf mehrere unserer Server, stehen gewisse Dienste vorübergehend nicht zur Verfügung.
Wir arbeiten an der Behebung der Störung.

Einige Server werden nach und nach wieder hochgefahren.

Es handelt sich leider um ein Botnetz, die genaue Dauer kann aktuell nicht abgeschätzt werden.

Technische Störung Gelöst
Priorität - Kritisch Betreffend Server - STEGRO-COS-MPR-200

Technische Störung auf Business Server M1.

Behebung in Bearbeitung.

 

Update 11:25 Techniker im Rechenzentrum

Update 11:55 Störung behoben

Update 11:55 Level 3 Support - Outage Issue closed

Wartungsarbeiten (3-Level Support) Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Stand 30.08.2010 10:00

Bedingt durch Störungen in den vergangenen Tagen mit dem System 21 müssen wir die Hardware aktiv prüfen, dazu muss der Server für einige Minuten vom Netz getrennt werden um die Memory wechseln zu können. Der 2 Monate alte benutzte Ram wird dann im Analysesystem geprüft werden.

 

Stand 30.08.2010 14:00

Es wurden 12 GB neue Ram eingesetzt in den Server 21.

 

Stand 31.08.2010 10:20

Der Server ist in der Nacht vom 30.08.2010 auf den 31.08.2010 mehrmals gecrasht, die Techniker haben durch weitere Analysen festgestellt, dass ein massiver Schaden am Dateisystem (http://de.wikipedia.org/wiki/Dateisystem) der /home (Kundendaten) Partition besteht. Da bei einem solchen Schaden ein extremes Risiko eines totalen Datenverlust besteht, wurde entschlossen den Server vom Netz per sofort zu trennen und eine Reparatur des Filesystems zu starten. Die genaue Dauer dieses Vorgangs ist nicht abschätzbar, kann aber bis zu mehrere Stunden andauern.

 

Stand 31.08.2010 16:00

Der Server 21 ist seit 14 Uhr nach dem letzten Filesystem Check nun wieder am Netz (bisher keine weiteren Unterbrüche). Sofern weitere Probleme auftretten wird die Technik wie gewohnt sofort eingreifen (gemäss unseren max. 2h SLA Reaktionszeiten an 365 Tagen im Jahr zu 24h).

 

# Fall als gelöst markiert um 16.00

Systemstörung Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Technische Störung am Raid von Server 21.

 

=> Ursache am SQL Server gelöst

=> Vorbeugungsmassnahmen erfolgt

=> Problem vollständig behoben

Systemstörung Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Technisches Problem Server 21, Behebung im Gange.

Systemstörung Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Technisches Problem Raid Server 21, Behebung im Gange.

Systemstörung Gelöst
Priorität - Kritisch Betreffend Server - HOS109

Technisches Problem Raid Server 21, Behebung im Gange.