Maschinelles Lernen

Maschinelles Lernen mit R

Maschinelles Lernen ist in aller Munde und in jeder zweiten App. Es ermöglicht, Unterschiede und Gemeinsamkeiten in Datenmengen zu finden, Muster zu erkennen und nutzbar zu machen. Um von dem enormen Potential tatsächlich profitieren zu können, ist allerdings ein gutes Verständnis der eingesetzten Algorithmen unerlässlich.

In diesem Kurs lernen Sie an Hand vieler praktischer Beispiele die wichtigsten Algorithmen kennen und einzusetzen. Sie erhalten einen Überblick über das reichhaltige Angebot einschlägiger Bibliotheken im Umfeld der Datenanalyseplattform R.

R entwickelt sich zu einem de-facto-Standard im Bereich Statistik, Maschinelles Lernen und Data Science. Als flexibel erweiterbare High-Level-Umgebung nimmt R seinem Nutzer viele lästige Details ab. Dies lässt uns genug Zeit, auch konzeptionell zu verstehen, was wir da tun.

Trainer und Dozenten

Katharina Best hat langjährige Erfahrung im Bereich der statistischen Datenanalyse. Tatsächlich reichen ihre Erfahrungen weiter zurück als der aktuell so gerne bemühte Kampfbegriff Big Data. Seit mehr als gehört R zu ihren bevorzugten Werkzeugen, sowohl standalone als auch integriert in komplexe Umgebungen und Workflows.

Voraussetzungen

Grundkenntnisse in R wie Sie sie z.B. in unserer Schulung "R - statistische Analysen" erwerben können, werden vorausgesetzt. Sie sollten in der Lage sein,

  • Daten aus verschiedenen Quellen in R nutzen zu können,
  • beschreibende Statistiken der Daten zu erstellen,
  • eigene Funktionen zu schreiben.

Inhalt

Ideen des maschinellen Lernens

  • Einsatzgebiete & Fragestellungen
  • algorithmische Herangehensweise
  • Arbeiten mit Teildatensätzen

Supervised Learning: Klassifikation

  • Die guten ins Töpfchen, die schlechten ins Tröpfchen.
  • Welche Algorithmen können wir dafür nutzen?
  • Passen sie zur jeweiligen Fragestellung?

Supervised Learning: Regression

  • Viel hilft viel. Wie untersuchen wir gemeinsames Verhalten?
  • Welche Faktoren werden einbezogen? Wie können die Modelle miteinander verglichen werden?

Unsupervised Learning: Clustering und mehr

  • Wie gehen wir vor, wenn die Kategorien, in die einsortiert werden soll, noch gar nicht vorhanden sind?
  • Wie treffen wir Entscheidungen, ohne vorher aus Beispielen lernen zu können?

Dimensionsreduktion

Den Wald vor lauter Bäumen nicht sehen. Manchmal ist weniger mehr. In welchen Fällen und mit welchen Verfahren wird die Menge an Einflussfaktoren verkleinert?

Vorgehen in der Datenanalyse

  • Entwicklung von Modellen
  • Modelldiagnose und -selektion
  • Modelloptimierung

Kurszeiten

Wer möchte, reist bis 22 Uhr am Vortag an und nutzt den Abend bereits zum Fachsimpeln am Kamin oder im Park.

An den Kurstagen dann von 9-18 Uhr (mit 2 Kaffee- und 1 Mittagspause) etwa 60% Schulungen und 40% Übungen. Selbstverständlich arbeitet jeder Teilnehmer am von uns gestellten Notebook oft parallel zum Referenten mit.

Anschließend Abendessen und Angebote für Fachsimpeln, Ausflüge uvm. Wir schaffen eine Atmosphäre, in der Fachleute sich ungezwungen austauschen. Wer das nicht will, wird zu nichts gezwungen und findet auch jederzeit Ruhe.