Dieses Projekt enthält Materialien des Kurses Was, wie, warum? - Einführungskurs Kausale Inferenz von Dr. Julia Rohrer und Prof. Dr. Karsten Lübke.
Zum Studieren des Materials besuchen Sie am besten die ShinyApps der ursprünglichen Kursmaterialen, siehe unter Modulübersicht.
Der Kurs setzt sich zusammen aus Interviews mit Expert:innen aus unterschiedlichen Fachgebieten sowie interaktiven Tutorials. Alle Interviews auf einen Blick finden Sie unter https://wwweki.gitlab.io/interviews/. Die Interviews und Tutorials sind teilweise inhaltlich aufeinander abgestimmt, können aber auch problemlos in Isolation verwendet werden.
Dieser Kurs zum Einstieg in die Kausalinferenz wurde ursprünglich entwickelt als MOOC für den KI-Campus in Kooperation zwischen Karsten Lübke (FOM Hochschule) und Julia Rohrer (Projektleitung, Universität Leipzig).
Weitere Hintergrundinformationen in Abschnitten Weiterführende Links und Förderung.
Die hier enthaltenen Materialien sollen es Lehrkräften erleichtern, das Kursmaterial für den eigenen Unterricht anzupassen. Dabei werden zunächst keine inhaltlichen Änderungen angestrebt.
Dieses Projekt ist eine Kopie (ein Fork) von https://github.com/luebby/WWWEKI, mit folgenden (geplanten) Änderungen:
- (Einige) HTML-Texte werden in Markdown umgewandelt.
- (Einige) Diagramme werden in SVG umgewandelt.
- Die ursprünglichen R-Markdown-Dateien (die Grundlage der ShinyApps) werden zusätzlich als IPython-Notebooks konvertiert.
- Die Notebooks (mit Dateiendung
.ipynb) erlauben, die Ergebnisse des Codes in derselben Datei im Webbrowser darzustellen, und erleichtern ggf. die Verwendung einer anderen Programmiersprache als R. - Die R-Markdown-Dateien (mit Endung
.Rmd) sollen möglichst unverändert bleiben, für einfache Vergleichbarkeit der ursprünglichen Materialien. - Zwischen den Dateiformaten und kann dank Jupytext automatisch synchronisiert werden.
- Die Notebooks (mit Dateiendung
- Beispieldatensätze werden als lokale CSV-Dateien bereitgestellt.
Eine genauere Aufschlüsselung der Änderungen finden Sie in Datei CHANGELOG.md.
Mit Anaconda können Sie mit einem Befehl alle benötigten und optionalen Pakete in einer neuen virtuellen Umgebung installieren:
conda create --name meinKI -c conda-forge jupyter jupytext r-irkernel r-tidyverse r-mosaic r-learnr r-ggthemesUm das Material auf GitHub oder GitLab usw. zu betrachten wird nur ein Webbrowser benötigt.
Um die IPython-Notebooks (Dateien *.ipynb) auszuführen oder zu ändern, müssen Sie Jupyter (oder einen geeigneten Editor) installieren.
Sie müssen den R-Kernel für Jupyter installieren, um die R-Codezellen ausführen zu können.
Der Kurs stützt sich auf die R-Pakete tidyverse und mosaic, learnr, ggthemes, die ihrerseits zusätzliche Abhängigkeiten mit sich bringen.
Optional: Um das Material zwischen den Formaten R-Markdown und Jupyter-Notebook zu synchronisieren, wird Jupytext verwendet.
Optional: Um die Materialien in PDF-Handouts, Folien oder ein anderes Format zu konvertieren, können Sie Quarto installieren (das Pandoc enthält, einen leistungsstarken Konverter, den Sie auch ohne Quarto verwenden können).
Optional: Um Ihre Änderungen zu verfolgen und zu diesem Projekt beizutragen, benötigen Sie Git.
- An der Weggabelung: Einen Weg gehen - und einen nicht (Potential Outcome und Counterfactual)
- Interner Link auf Variante als R-Markdown und als IPython Notebook
- Externer Link auf ShinyApp
- Kurzes Video: Willkommen im Kurs
- Ein Pfeil zeigt die Richtung (Strukturelle kausale Modelle und Kausale Diagramme)
- Daten analysieren – mit welchem Ziel? (Datenanwendungen (Beschreibung, Vorhersage, Kausale Inferenz), Kausale Leiter (Assoziation, Intervention, Counterfactual))
- Es steht was zwischen uns (Kette)
- Von Störchen und Geburten (Gabel)
- Nett oder schön? – Warum nicht beides? (Umgedrehte Gabel)
- Warum Raumteilung keine gute Investition ist (Wiederholung Grundelemente Kausaler Diagramme, Unterschied (do(x) vs. X=x am Beispiel)
- Magie durch Zufall (Zufällige Stichprobe und zufällige Zuordnung im Rahmen eines Experiments und die Auswirkungen auf die Datenanwendungen (Beschreibung, Vorhersage, Kausale Inferenz) )
- Was wäre gewesen, wenn? (Counterfactual)
- Graphen zeichnen und lesen (Beispiel Gender-Pay-Gap)
- Schadet Rauchen bei Heranwachsenden? (Anwendungsbeispiel Kausale Inferenz in der Medizin.)
- Praktisches Daten hinterfragen (DAGs in der Anwendung, Ausblick)
- Eine englische Kursvariante ist verfügbar unter https://github.com/luebby/WWWEKI-EN.
- Für weitere Hintergründe zum Kurs siehe FOM forscht Wissenschaftsblog.
- Die begleitenden Interviews mit angesehenen Expert:innen aus unterschiedlichen Fachgebieten, die ihre kausalen Fragestellungen und Lösungsansätze vorstellen, finden Sie unter https://wwweki.gitlab.io/interviews/.
- Rohrer, J. M. (2018). Thinking clearly about correlations and causation: Graphical causal models for observational data. Advances in Methods and Practices in Psychological Science, 1(1), 27-42. https://doi.org/10.1177%2F2515245917745629
- Lübke, K., Gehrke, M., Horst, J., & Szepannek, G. (2020). Why we should teach causal inference: Examples in linear regression with simulated data. Journal of Statistics Education, 28(2), 133-139. https://doi.org/10.1080/10691898.2020.1752859
Bitte melden Sie inhaltliche Fehler, Unklarheiten und Verbesserungsvorschläge beim ursprünglichen Projekt, unter https://github.com/luebby/WWWEKI/issues.
Weitere Vereinfachungen der Materialien zwecks Wiederverwendung in eigenen Kursen können Sie gerne auch hier vorschlagen.
Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International Lizenz.
Das Vorhaben Was, wie, warum? Einstiegskurs Kausale Inferenz (WWWEKI) wurde mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 16DHBQP040 gefördert.
Die folgende Beschreibung wurde aus der Projektbeschreibung kopiert.
Im Rahmen der Kausalen Inferenz sind in den letzten Jahren sowohl in Wissenschaft als auch in der Praxis beachtliche Fortschritte erzielt worden.
Gleichzeitig wird das Thema Kausalität in vielen Forschungsfeldern entweder explizit ausgeklammert oder ignoriert. Dies führt zu vielfältigen Problemen in der Datenanalyse (z. B. werden Quellen von Bias oft ignoriert) und es kommt zu einem Mismatch zwischen der gewählten Methode und der Frage, die eigentlich beantwortet werden soll (z. B. werden rein prädiktive Methoden verwendet, um letztlich kausale Fragen zu beantworten). Das gilt auch für den Bereich der Künstlichen Intelligenz der von einem stärkeren Fokus auf Kausale Inferenz profitieren würde.
Schon länger wird gefordert, dass das Thema Kausale Inferenz eine zentrale Rolle in den Lehrplänen spielen sollte.
Englischsprachig gibt es diverse (erfolgreiche) MOOCs zum Thema Kausale Inferenz, z. B. von edX, Udemy oder coursera. Auch stehen diverse Bücher zu unterschiedlichen Anwendungsfeldern zum Einstieg zur Verfügung, so z. B. von Neal (2020): “Introduction to Causal Inference from a Machine Learning Perspective”, oder Peters, Janzing & Schölkopf (2017): “Elements of Causal Inference”. Nicht zuletzt aufgrund der Aktualität des Themas gibt es nach bestem Wissen der Antragsteller:innen jedoch kein vergleichbares deutschsprachiges Angebot. Diese Lücke soll der Kurs schließen.
Die ausgewählten Inhalte orientieren sich an Cummiskey & Lübke (2022):
- Elementare Grundlagen von Wahrscheinlichkeit und Statistik, insbesondere bedingte Wahrscheinlichkeiten und Unabhängigkeit
- Potential Outcome und Counterfactual
- Kausale Effekte und Verzerrungen (letztere auch bei rein deskriptiven Beschreibungen, z. B. Selection/Survivor Bias)
- Directed Acyclic Graphs als Mittel zur Beschreibung des datengenerierenden Prozesses
- Unterschiedliche Ebenen der Datenanwendung und ihre Voraussetzungen
Um den Kurs allgemein interessant zu gestalten, werden die Inhalte entlang von alltäglichen Beispielen motiviert und erklärt werden. Themenbezogene kurze Videos, aber auch Animationen, sollen den Lernprozess unterstützen. Im Rahmen des MOOCs werden dabei verschiedene offene und geschlossene Fragen inklusive Rückmeldung integriert.
- Lübke, K., Gehrke, M., Horst, J., & Szepannek, G. (2020). Why we should teach causal inference: Examples in linear regression with simulated data. Journal of Statistics Education, 28(2), 133-139.
- Rohrer, J. M. (2018). Thinking Clearly About Correlations and Causation: Graphical Causal Models for Observational Data. Advances in Methods and Practices in Psychological Science, 1(1), 27–42.
- Cummiskey, K., & Lübke, K. (2022). Causality in Data Science Education. Submitted.

