Linux ist Schuld an Schaltsekunde hinfällig: Cassandra Exec

2014-01-08  |  Comebuy News

Comebuy Verwandte Artikel: Apache Cassandra bereit für die EnterpriseLeap zweiten belastet Websysteme über WeekendHadoop, die Gipfel Welle Produkt EnhancementsICANN nimmt kostenlos Internet Zeitzone master ListHadoop bringt bringt Gipfel Welle von Produktverbesserungen

Eine Reihe von hochkarätigen Ausfälle, die letztes Wochenende stattfand kann zurückverfolgt werden, wie der Linux-Betriebssystemkern mißhandelt eine Schaltsekunde hinzugefügt, um die offizielle Zeit, Gebühren der CTO DataStax, ein Unternehmen, das die open-Source-Cassandra-Datenbank verwaltet.

"Erste Berichterstattung oft fingered, Java oder sogar Cassandra als der Schuldige... aber das eigentliche Problem war eine Art von Livelock in der Linux-System verantwortlich für Timer, ruft" schrieb DataStax CTO und Cassandra Schöpfer Jonathan Ellis, in einem Blog-Post.

Am Samstag Mitternacht Greenwich Mean Time (GMT) wurde eine zusätzliche Sekunde in die koordinierte Weltzeit (UTC), die offizielle Zeit verwendet, um Server über das Internet zu koordinieren hinzugefügt. Obwohl das Network Time Protocol (NTP), die am weitesten verbreitete Mechanismus, um die Uhrzeit über das Internet synchronisieren Schaltsekunden behandeln entwickelt wurde, ging eine Reihe von populären Internet-Services kurz offline, nachdem die zweite in ihren Servern, einschließlich der laufenden Reddit, LinkedIn und der Quantas Airline-Reservierungs-System eingefügt wurde.

ReddIt Ingenieure hatten zunächst vermutete, Cassandra, zusammen mit Java, Quelle für die Schaltsekunde Verwandte Ausfall am Samstag. War nicht das Problem mit einem dieser Technologien Ellis neutralisiert, sondern vielmehr mit dem zugrunde liegenden Betriebssystem. (Oracle, die Java verwaltet, sofort reagierte nicht auf Kommentar).

Ein Systemadministrator hätten zuerst bemerkt das Problem manifestiert sich als eine extrem hohe Systemlast oder sogar einen Systemabsturz, über die normale Verwaltung zu einer Anwendung wie Cassandra, die Java Virtual Machine, Hadoop oder MySQL zurückverfolgt werden konnte. Der eigentliche Schuldige, jedoch erwies sich als ein schwerer Pinpoint-Bug in der Weise Linux seine Uhren aktualisiert, wenn eine Schaltsekunde eingeführt wurde, sagte Ellis.

Viele hatte herausgefunden, dass Zurücksetzen der Anwendung nicht Wiederherstellen des Servers in den normalen Betriebszustand. Sie könnte jedoch das Problem zu beheben, durch Zurücksetzen der Systemuhr oder den Server neu starten.

Unabhängig von der Ursache, der Bug gestört Samstag abends von vielen einen System-Administrator. Die Zeit-Nüsse-Mailing-Liste berichtete ein Admin verbringen den Abend Hunderte Server neustarten.

Joab Jackson umfasst Unternehmenssoftware und allgemeine Technologie Eilmeldung für die IDG News Service. Folgen Sie Joab bei @Joab_Jackson auf Twitter. Joab die E-mail-Adresse ist Joab_Jackson@idg.com

« Back