KIT | KIT-Bibliothek | Impressum | Datenschutz

Sherlock Pandas und Data Watson

Molinar, Gabriela; Stang, Marco

  • 00:00:00 Start
  • 00:00:04 Sherlock Pandas und Data Watson
  • 00:01:02 Deskriptive Methoden
  • 00:01:05 Describe-Funktion
  • 00:01:25 Minimum, Maximum, Mittelwert
  • 00:01:33 Quantil
  • 00:02:45 Graphische Methoden
  • 00:03:05 Boxplots: Interquartils-abstand, Whiskers, Ausreißer
  • 00:04:27 Kategorische Daten: Häufigkeit der Daten in Klassen
  • 00:05:15 Numerische Daten: Verteilung der numerischen Features, Schiefe der Verteilungs-funktionen
  • 00:06:33 Histogramme: Bins
  • 00:06:56 Dichte-diagramme: Pandas Funktion corr(), Korrelations-matrix
  • 00:07:42 Heatmap
  • 00:07:57 Scatterplot-Matrix
  • 00:08:36 Multicollinearity
  • 00:08:54 Korrelation, Kausalität, Scheinkausalität Kausalität Scheinkausalität Kausalität Scheinkausalität
  • 00:09:36 Zusammenfassung

Zugehörige Institution(en) am KIT Institut für Technik der Informationsverarbeitung (ITIV)
Zentrum für Mediales Lernen (ZML)
Publikationstyp Audio & Video
Publikationsdatum 19.10.2021
Erstellungsdatum 20.09.2021
Sprache Deutsch
DOI 10.5445/IR/1000139086
Identifikator KITopen-ID: 1000139086
Lizenz Creative Commons Namensnennung – Weitergabe unter gleichen Bedingungen 4.0 International
Bemerkung zur Veröffentlichung Dieses Video behandelt die Datenanalyse und Visualisierung mittels Pandas. Mit Hilfe von deskriptiven und graphischen Methoden sind wir in der Lage, den Datensatz besser zu verstehen. So können wir zum Beispiel die Art der Verteilung und mögliche Korrelationen zwischen Parametern im Datensatz erkennen. Das erlaubt es uns, die Daten gezielt für das Training unseres ML-Modells, durch Wahl eines geeigneten Skalierungsverfahrens, vorzubereiten.
Serie Angewandte Machine Learning Algorithmen (AMALEA)
Folge 4
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page