Hadoop ist nicht genug für "big Data", sagt Facebook-Analytik-Chef

2013-12-30  |  Comebuy News

Die Hadoop-Programmierumgebung ist möglicherweise ein Synonym für die "big Data"-Bewegung, aber es ist nicht das einzige Werkzeug, das Unternehmen Erkenntnisse aus massiven Läden von unstrukturierten Informationen, nach Analyse-Chef Ken Rudin abgeleitet werden müssen.

Comebuy Verwandte Artikel: SAS erweitert den Analytics-Support für unstrukturierte DataBusinesses füllen Hadoop Fähigkeiten muss mit PartnersForrester: Push BI-Anbieter für Details über Hadoop IntegrationIT müssen auf Hadoop-Sicherheit-IssuesBeware BI-Anbieter-Hype über Hadoop vorbereiten

"Es gibt eine Menge von gängigen Vorstellungen über große Datenmengen, die in Frage gestellt werden, müssen" mit der ersten sein, die Sie einfach übernehmen, Hadoop und sind gut zu gehen, sagte Rudin Dienstag während einer Keynote auf der Strata + Hadoop World Konferenz in New York. "Das Problem ist, dass Hadoop eine Technologie ist, und große Datenmengen geht es nicht um Technik. Große Datenmengen geht um Unternehmensanforderungen."

"In Wirklichkeit große Daten aufzunehmen, Hadoop und relationalen [Datenbanken] und jede andere Technologie, die für die Aufgabe zur hand," fügte er hinzu.

Das Geschäftsmodell hängt von der Art und Weise, es die Ströme des Profils knirscht, und von der social-Media-Website generierte Aktivitätsdaten ist mehr als 1 Milliarde Benutzer um gezielte Werbung zu liefern. Aber "Hadoop nicht immer das beste Werkzeug für das was wir tun müssen," sagte Rudin.

Zum Beispiel macht es Sinn, breiten explorative Analyse eines Datensatzes im Hadoop zu tun, aber einem relationalen Datenspeicher ist besser für eine operative Analyse dessen, was er sagte war aufgedeckt.

Hadoop ist auch gut für den Blick auf das niedrigste Niveau der Details in einem Datensatz, sondern relationale Datenbanken nicht sinnvoller für die Speicherung von umgewandelt und aggregierte Daten, Rudin hinzugefügt.

"Unterm Strich ist, verwenden Sie die richtige Technologie für was immer Sie benötigen, es ist" sagte er.

Es gibt auch die Vermutung, dass der bloße Akt der großen Datenanalyse wertvolle Erkenntnisse liefert, sagte Rudin. "Das Problem mit brillanter Antworten auf Fragen, die niemand kümmert sich um kommt," sagte er. "Es ist immer noch eine Kunst um herauszufinden, was die richtigen Fragen sind."

konzentriert sich auf die Einstellung die richtigen Mitarbeiter zu führen ihre Analytics-Tätigkeit, die Menschen, die nicht nur Doktorate in der Statistik aber sind auch Geschäftssinn, sagte er.

"Wenn Sie [Kandidaten] interview, nicht nur zu konzentrieren"wie wir diese Metrik berechnen"," sagte Rudin. Stattdessen geben Sie ihnen eine Fallstudie und bitten sie zu, was wäre die wichtigsten Kennzahlen zu betrachten, fügte er hinzu.

Unternehmen sollten auch versuchen, "alle auf Analytics," Zug nach Rudin.

führt eine interne "Daten-Lager", ein zwei-Wochen-Programm, das Mitarbeiter über Analytics lehrt. Produktmanager, Designer, Ingenieure und sogar Finanzen Abteilung Arbeitnehmer teilnehmen, sagte Rudin. "Der Wert des Habens alle durchmachen ist, geben Sie alle eine gemeinsame Sprache der Daten können sie diskutieren, Probleme und Fragen mit," sagte er.

hat auch die Art und Weise erschüttert es Statistiker und Business Teams organisiert. Wenn Statistiker getrennt gehalten werden, sagte neigen sie dazu, "dort sitzen und warten Sie auf Anforderungen von Geschäftsbereichen und reagieren darauf," Anstatt proaktiv, er.

Aber wenn Statistiker, in die Geschäftsbereiche platziert werden "" finden Sie mehrere Gruppen, die redundant zu lösen versucht,"sagte er.

hat auf ein "embedded" Modell ausgewertet wobei Analysten, mit Business-Teams aber Bericht bis zu einer übergeordneten Gruppe von Analysten, die hilft platziert werden, doppelten Aufwand zu vermeiden.

« Back