seminar buchen

Seminar Cloudera Analyst

Seminar / Training Cloudera Analyst

Einführung
Hadoop Grundlagen

  • Gründe für Hadoop
  • Hadoop Übersicht
  • HDFS
  • MapReduce
  • Das Hadoop Ökosystem
  • Data Ingest mit den Hadoop Werkzeugen

 Einführung in Pig

  • Was ist Pig?
  • Pigs Funktionen
  • Anwendungsszenarien für Pig >
  • Interaktionen mit Pig

Einfache Datenanalyse mit Pig

  • Pig Latin Syntax
  • Daten laden
  • Einfache Datentypen
  • Felddefinitionen
  • Data Output
  • Betrachten des Schemas
  • Filtern und sortieren der Daten
  • Häufig genutzte Funktionen
  • Pig und ETL Verarbeitung

Komplexe Daten mit Pig verarbeiten

  • Storage Formate
  • Komplexe und verschachtelte Datentypen
  • Gruppieren
  • Funktionen für komplexe Daten
  • Aufzählen gruppierter Daten

Multi-Dataset Operationen mit Pig

  • Techniken für die Kombination von Data Sets
  • Verknüpfen von Daten in Pig
  • Set Operations
  • Teilen von Data Sets

Pig erweitern

  • Die Flexibilität durch Parameter erhöhen
  • Makros und Importe
  • UDFs
  • Contributed Functions
  • Verwenden anderer Sprachen mit die Analyse mit Pig
  • Pig mit Streaming und UDFs erweitern

Pig Fehlerbereinigung und Optimierung

  • Troubleshooting Pig
  • Logging
  • Hadoops Web UI
  • Debugging
  • Geschwindigkeitsübersicht
  • Ausführungspläne
  • Beschleunigen der Pig Aufträge

Einführung in Hive

  • Was ist Hive?
  • Hive Schema und Datenspeicherung
  • Vergleich von Hive mit traditionellen Datenbanken
  • Hive verglichen mit Pig
  • Hive Anwendungsfälle
  • Interaktion mit Hive

Relationale Daten mit Hive analysieren

  • Hive Datenbanken und Tabellen
  • HiveQL Syntax
  • Datentypen
  • Verbinden von Datensets
  • Wichtige Funktionen
  • Starten von Hive Abfragen mit Shell, Scripts und Hue

Hive Datenmanagement

  • Hive Datenformate
  • Anlegen und Anpassen von Datenbanken und Tabellen
  • Laden von Daten in Hive
  • Selbstverwaltete Tabellen
  • Abfragen mit Views vereinfachen
  • Speichern von Abfrageergebnissen
  • Zugriffsrechte steuern
  • Datenmanagement mit Hive

Textverarbeitung mit Hive

  • Übersicht
  • String Funktionen
  • Regular Expressions in Hive
  • Sentiment Analysis und N-Grams

Hive Optimierung

  • Abfragen beschleunigen
  • Jobausführung kontrollieren Plan
  • Partitioning
  • Bucketing
  • Indexing Data Extending Hive
  • SerDes
  • Datentransformationen mit Custom Scripts
  • Benutzerdefinierte Funktionen
  • Parameterübergabe bei Abfragen

Einführung in Impala

  • Was ist Impala?
  • Unterschiede zwischen Impala, Hive und Pig
  • Wie sich Impala von relationalen Datenbanken unterscheidet
  • Grenzen von Impala
  • Impala Shell

Analyse von Daten mit Impala

  • Syntax
  • Datentypen
  • Filtern, Sortieren und begrenzen des Ergebnisse
  • Verknüpfen und Sortieren des Ergebnis
  • Beschleunigen von Impala

Auswahl des richtigen Werkzeugs

  • Vergleich von MapReduce, Pig, Hive, Impala, und relationalen Datenbanken

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

  • Lars Demmel

    Telefon: + 43 (800) 562 711
    E-Mail:

  • Sebastian Löhr

    Telefon: + 43 (800) 562 711
    E-Mail:

Seminardetails

   
Dauer: 3 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr
Preis: Öffentlich und Webinar: € 1.797 zzgl. MwSt.
Inhaus: € 5.100 zzgl. MwSt.
Teilnehmeranzahl: max. 8 Teilnehmer
Voraussetzung: keine
Standorte: Bregenz, Graz, Innsbruck, Klagenfurt, Linz, Salzburg, Wien
Methoden: Vortrag, Demonstrationen, praktische Übungen am System
Seminararten: Öffentlich, Inhaus, Webinar
Durchführungsgarantie: ja, ab 2 Teilnehmern; Details
Sprache: Deutsch (Englisch ist bei Firmenseminaren ebenfalls möglich)
Seminarunterlage: Dokumentation auf CD oder Papier
Teilnahmezertifikat: ja, selbstverständlich
Verpflegung: Kalt- / Warmgetränke, Mittagessen im Restaurant - (bei öffentlichen Seminaren)
Support: 3 Anrufe im Seminarpreis enthalten
Barrierefreier Zugang: an den meisten Standorten verfügbar
  Weitere Informationen unter + 43 (800) 562 711

Seminartermine

Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.

Seminar Startdatum Enddatum Ort Dauer
Inhaus / Firmenseminar 2 Tage
Stream live 2 Tage
Innsbruck 2 Tage
Stream gespeichert 2 Tage
Klagenfurt 2 Tage
Bregenz 2 Tage
Linz 2 Tage
Salzburg 2 Tage
Graz 2 Tage
Wien 2 Tage
Graz 2 Tage
Wien 2 Tage
Inhaus / Firmenseminar 2 Tage
Stream live 2 Tage
Innsbruck 2 Tage
Stream gespeichert 2 Tage
Klagenfurt 2 Tage
Bregenz 2 Tage
Linz 2 Tage
Salzburg 2 Tage
Linz 2 Tage
Salzburg 2 Tage
Graz 2 Tage
Wien 2 Tage
Inhaus / Firmenseminar 2 Tage
Stream live 2 Tage
Innsbruck 2 Tage
Stream gespeichert 2 Tage
Klagenfurt 2 Tage
Bregenz 2 Tage
Klagenfurt 2 Tage
Bregenz 2 Tage
Linz 2 Tage
Salzburg 2 Tage
Graz 2 Tage
Wien 2 Tage
Inhaus / Firmenseminar 2 Tage
Stream live 2 Tage
Innsbruck 2 Tage
Stream gespeichert 2 Tage
© 2024 www.networkuniversity.at All rights reserved.  | Kontakt | Impressum | AGB | Nach oben