Angestrebte Lernergebnisse
Das Modul Data Analytics mit Python bietet einen umfassenden Überblick über Datenanalysemethoden und legt einen besonderen Fokus auf die praktische Anwendung. Im Rahmen des Moduls lernen Studierenden die leistungsstarke Programmiersprache Python. Zusätzlich lernen Studierende statistische Ergebnisse korrekt zu interpretieren und Ergebnissen kritisch zu hinterfragen.
Nach Abschluss des Moduls können Studierende:
1) Data-Analytics-Grundlagen sicher anwenden
- zentrale Konzepte und typische Fragestellungen im Data Analytics erklären und einordnen.
- die Bedeutung, Potenziale und Grenzen datenbasierter Entscheidungen kritisch diskutieren (inkl. Datenqualität, Bias, Interpretationsrisiken).
2) Python als Analyse-Tool kompetent nutzen
- Python in einer Analyseumgebung sicher einsetzen (Grundlagen bis „Intermediate“).
- Daten aus unterschiedlichen Quellen importieren und strukturiert weiterverarbeiten.
3) Daten aufbereiten, prüfen und verstehen (Wrangling & EDA)
- Daten mit pandas manipulieren, transformieren, filtern, aggregieren und zusammenführen (Joining/Merging).
- Daten systematisch bereinigen (fehlende Werte, Ausreißer, Inkonsistenzen) und die Folgen für Analysen beurteilen.
- Explorative Data Analysis (EDA) durchführen: Verteilungen, Muster, Gruppenunterschiede, Zusammenhänge.
4) Ergebnisse sichtbar machen und korrekt interpretieren
- passende Visualisierungen mit Matplotlib erstellen und zielgerichtet einsetzen.
- Summary Statistics und Visuals so interpretieren, dass daraus belastbare Aussagen entstehen – inklusive Unsicherheit und Einschränkungen.
5) Inferenz & Regression für empirische Arbeiten einsetzen
- Grundlagen von Inferenz, experimentellem Design und Korrelation erklären und typische Denkfehler vermeiden („Korrelation ≠ Kausalität“).
- Regressionsmodelle mit statsmodels aufsetzen (Einführung bis vertiefend) und Ergebnisse fachlich korrekt interpretieren.
- Analyseentscheidungen transparent dokumentieren und Resultate kritisch hinterfragen (Modellannahmen, Robustheit, Limitationen).
Insofern können Studierende am Ende eine vollständige, nachvollziehbare Analysepipeline in Python umsetzen, d.h. von Rohdaten bis zu interpretierbaren Ergebnissen.