Data-Mining mit Python – ein Praxis-Workshop: Online- oder Präsenz-Training

Dauer: 3 Tage
Zielgruppe:

Der Kurs richtet sich generell an alle, die Zugriff auf große Datenbestände haben und vor der Aufgabe stehen neues Wissen aus diesen Daten zu extrahieren. Diese Aufgabe kann natürlich mit kommerziellen Tools gelöst werden. Meist bieten diese nur eingeschränkten Einblick in die verwendeten Methoden, lassen sich nicht selbstständig anpassen und erweitern und sind zudem teuer. Teilnehmern mit grundlegenden Programmierkenntnissen vermittelt dieser Kurs die Implementierung einer kompletten Data Mining Prozesskette.

Schulung Data-Mining mit Python

Unter Data Mining versteht man den Prozess aus sehr großen Datenmengen die relevanten Informationen, das in den Daten verborgene Wissen oder auffällige Muster zu extrahieren. Dieser Prozess stellt die zentrale Komponente sämtlicher Big Data Anwendungen dar. KDD: „Knowledge Discovery in Databases“ bezeichnet die Gewinnung von Wissen aus bereits vorhandenen Daten. Es meint die Extraktion von Wissen, das im statistischen Sinne „gültig, bisher unbekannt und potentiell nützlich“ ist „zur Bestimmung bestimmter Regelmäßigkeiten, Gesetzmäßigkeiten und verborgener Zusammenhänge“ Quelle: Wikipedia

Die elementaren Schritte in diesem Prozess umfassen

  • den Datenzugriff,
  • die Datenauswahl und –Bereinigung,
  • die Transformation und Merkmalsextraktion,
  • die Modellbildung
  • die Visualisierung
  • die Interpretation

Dieses Seminar zeigt auf, welche Methoden für jeden dieser Prozessschritte eingesetzt werden und wie diese Methoden schnell und effizient in Python implementiert werden können.

Alle im Folgenden beschriebenen Methoden werden anhand gängiger Python Module, wie Numpy, Scipy, Pandas, Scikit-Learn, NLTK und Matplotlib vorgeführt.

Kursinhalte Schulung Data-Mining mit Python:

Datenzugriff

  • Zugriff auf Daten in Dateien
  • Zugriff auf Daten in Datenbanken
  • Zugriff auf Daten aus dem Internet – über APIs und direkt aus HTML-Seiten

Datenauswahl und Bereinigung

  • Filtermethoden
  • Umgang mit fehlerhaften und fehlenden Daten
  • Bereinigung
  • Bereinigung von HTML Seiten und Extraktion des Rohtext
  • Segmentierung von Text in die sprachlichen Einheiten.

Merkmalsauswahl und Transformation

  • Methoden der Merkmalsauswahl (Informationsgehalt, Entropie, Korrelationen, Wrapper, …)
  • Merkmalsextraktion und Dimensionsreduktionstechniken mit statistischen Verfahren wie PCA, LDA, t-SNE, multidimensionale Skalierung usw.
  • Merkmalsmodellierung für Zeitreihen-Daten
  • Merkmalsmodellierung für natürlich-sprachliche Dokumenten

Modellbildung

  • Clustering
  • Assoziationsanalyse
  • Outlier Detection
  • Maschinelles Lernen von Klassifikationsmodellen und Regressionsmodellen (Support Vector Maschinen, Neuronale Netze, Entscheidungsbäume, Random Forests,…)
  • Zeitreihenvorhersagen
  • Semantische Dokumentmodellierung/ Topic Extraction

Visualisierung

  • 2D- und 3D Visualisierung mit Matplotlib:
  • Einbindung der Plots in .pdf oder .html

Verwandt mit Data-Mining ist maschinelles Lernen. Beim Data-Mining liegt der Fokus auf dem Finden neuer Muster, beim maschinellen Lernen wird versucht bekannte Muster vom Computer automatisch in neuen Daten wiederzuerkennen. Eine Trennung ist hier jedoch nicht immer möglich. Verfahren aus dem maschinellen Lernen finden oft im Data-Mining Anwendung und umgekehrt.

Siehe auch Seminar: Python Statistische Analyse, Modellbildung und Maschinelle Lernmethoden

Ihre Vorteile bei PythonData Mining Schulungen durch edv-coaching.de:
  • projekt- und lehrerfahrene Trainer
  • maßgeschneiderte Inhalte und umfangreiche Unterlagen
  • Betreuung auch nach dem Training
  • bundesweite Trainings in Ihrem Hause oder als Online-Schulung
  • Training in Österreich und in der Schweiz
  • Durchführung in deutscher oder englischer Sprache.

Namhafte Unternehmen aus dem Bereichen Medizin, Kredit- und Versicherungswirtschaft, Automotive, Behörden, Pharma und Forschung schätzen das fundierte Knowhow und die Erfahrung unseres Trainerteams. Ein ausgewählter Kunde: Siemens Healthcare GmbH.python training siemens

Weitere Schulungen

Kurs Anfrage

Danke für Ihr Interesse an diesem Kurs. Sie erhalten in Kürze ein Angebot.

Gewählter Kurs: Data-Mining mit Python - ein Praxis-Workshop: Online- oder Präsenz-Training
Dauer: 3 Tage

Die mit * gekennzeichneten Felder sind Pflichtfelder.

Empfehlen Sie diesen Kurs
Kurs: Data-Mining mit Python – ein Praxis-Workshop: Online- oder Präsenz-Training

Die mit * gekennzeichneten Felder sind Pflichtfelder.