Hier finden Kurs und Schulung statt
Open Source Schulung:

Apache Hadoop

Big Data Processing mit Apache Hadoop

Die Analyse umfangreicher Unternehmensdaten liefert Einblicke in oftmals verborgene Zusammenhänge. Dabei ergibt sich bereits aus der Vielfalt der erfassten Daten häufig bereits ein Problem, andererseits ist diese Vielfalt eine besondere Chance - vorausgesetzt man bewältigt die Datenflut effizient.

Werkzeuge und Methoden für systematische Datenanalysen (Datamining) existieren schon seit langem. Wenn es aber um unstrukturierte Inhalte wie z.B. Texte in Blogs oder auf Webseiten oder um Dokumente in einem verteilten CMS geht, stößt man schnell an deren Systemgrenzen. Datenbankserver sind in vielen Szenarien die optimale Lösung, aber deutliche Grenzen sind auch dort erkennbar sobald Skalierbarkeit und die zuverlässige Verarbeitung unstrukturierter Daten gefordert werden. Besonders die Skalierbarkeit auf Basis preiswerter Standardhardware und die flexiblen Integrationsmöglichkeiten in viele vorhandene IT-Systeme sind die Stärke des Cluster Systems Apache hadoop.

Unser Ziel ist es, Ihnen den Einstieg in des Thema Big-Data-Processing zu vereinfachen. Sie können sich die Tools auch selbst installieren oder eine vorkonfigurierte Distribution z.B. von Cloudera Inc. aus dem Internet laden.

Aber was kommt danach? Genau das stellen wir Ihnen in unserem Praxis-Seminar vor. Dabei gehen wir auf konkrete Anwendungsbeispiele ein und zeigen Ihnen, mit welchen Methoden diese effizient zu bearbeiten sind. Wir arbeiten anhand praxisnaher Beispiele heraus, welche Tools im Umfeld von hadoop welchen Nutzen haben, für welche Aufgabentypen diese verwendbar sind und wie Sie vorhandene Daten effizient in das System übertragen. Danach sind Sie in der Lage zu entscheiden, welche Ihrer Aufgaben mit dem MapReduce-Ansatz gelöst werden können und Sie starten selbst in ein neues interessantes Themengebiet: extrahieren Sie neue Informationen aus ihren vorhandenen Daten!

Preis

2 Tage, 900,00 € + 19% MwSt. = 1.071,00 €

Volle 8 Zeitstunden pro Tag, komplette Grundausstattung an Originalliteratur, freier Internetzugang überall, Leihnotebook, Vollpension, Getränke (besondere Weinsorten werden separat abgerechnet), Gebäck, selbstgebackene Kuchen, Sauna, Rahmenprogramm.

Zusatz- oder Minderleistungen auf Wunsch:

Aufpreis für Übernachtung im Zweibettzimmer (großes, komfortables Zimmer) 59,00 € + 7% MwSt. = 63,13 €pro Nacht
Aufpreis für Übernachtung in der Linuxhotel-WG 83,00 € + 7% MwSt. = 88,81 €pro Nacht
Aufpreis für Einzelzimmer (nach Verfügbarkeit, bitte rechtzeitig buchen) 129,00 € + 7% MwSt. = 138,03 €pro Nacht
Preisnachlaß bei Verzicht auf die Vollpension -29,41 € + 19% MwSt. = -35,00 €pro Tag
Preisnachlaß bei Verzicht auf das Rahmenprogramm -8,40 € + 19% MwSt. = -10,00 €pro Abend

Steuerliche Absetzbarkeit * Stornobedingungen

Termine

28.10 - 29.10.13 KW 44 Anmeldung Apache Hadoop
11.11 - 12.11.13 KW 46 Anmeldung Apache Hadoop
oder
nennen Sie uns Ihren Wunschtermin

Dozenten

Mirko Kämpf ist als Entwickler des Projekts Hadoop.TS und als Trainer ist im Big-Data Umfeld aktiv. Er führt in Zusammenarbeit mit der Cloudera University europaweit Hadoop-Entwickler-Trainings, das Hadoop-Administrator-Training als auch das HBase-Training durch. Er verfügt über die Zertifizierungen CCDH, CCAH und CCSHB.

Er studierte Physik an der Technischen Universität Chemnitz mit Vertiefung der Fächer Computerphysik und Softwaretechnologie. Dabei blickte er auf langjährige Erfahrungen in der Softwareentwicklung, besonders im Java-Umfeld und im Bereich verteilter Suchsysteme zurück.

Im Rahmen seiner Promotion an der Martin-Luther-Universität Halle-Wittenberg arbeitet er an den Themen: “Informationsfluss- und Zeitreihenanalyse" sowie an der Untersuchung "Komplexer Netzwerke”, wobei große Datenbestände und umfangreiche statistische Auswertungen den Einsatz eines Clustersystems wie Apache hadoop erfordern.

Einer seiner Arbeitsschwerpunkte ist die Analyse sozialer Netzwerke. In diesem Zusammenhang startete er das Projekt OpenSMM. Diese Website thematisiert künftig neben den relevanten Technologien auch die Folgen und Nebenwirkungen der Entwicklungen rund um das Social-Media-Monitoring. Gerade dieser Bereich führte in den vergangenen Jahren zur Realisierung von Softwarelösungen, die heute in Apache hadoop zusammengefasst sind.

Teilnahmevoraussetzungen

Grundlegende Kenntnisse in:

Falls Sie hier unsicher sind, beraten wir Sie gerne, per Mail oder telefonisch.

Kursinhalt

Einführung / Überblick / Beispiele

Komponenten der Apache hadoop Platform & Workflow

Effizient Arbeiten mit hadoop

Beispiele

  • Text-Analyse & Text-Statistik und "Inverse Index"
  • Datenvisualisierung: "Social-Heatmap"
  • Auswertung von Logdaten: Zeitreihenanalyse
  • Der Social-Graph: Analyse von Netzwerken
  • BI-Applications, hadoop-Distributionen und Entwicklungstools

    Nach Bedarf / auf Wunsch

    Zeitlicher Ablauf