Datenerhebung
- Dezember 2022: Beginn Datenerhebung Berliner Zeitung
- Dezember 2022: Beginn Datenerhebung Neue Zeit
- Februar 2023: Beginn Datenerhebung Neues Deutschland
- August 2023: Abschluss Datenerhebung Berliner Zeitung
- August 2023: Abschluss Datenerhebung Neues Deutschland 2000 & 2010
- September 2023: Abschluss Datenerhebung Neue Zeit
Datenaufbereitung
- August 2023: Entwicklung und Test eines Workflows zum Data Clean Up
- November 2023 bis Januar 2024: Data Clean Up
- Februar 2024 Start Korrektur KI-Korrigierter Sätze der Leserbriefe
Annotation
- Mai 2023: Beginn induktiver Kategorienbildung
- September 2023: Test Annotation mittels generativer KI (+ menschlichen Intercoderagreement-Tests) –> Ergebnisse überraschend okay (im Vergleich zu untrainierten Codierer:innen). Allerdings wurde die KI Kodierung nicht besser, während die Intercoderreliabilität der Codierer:innen deutlich verbessert wurde und schließlich die Qualität der KI-Kodierungen übertraf. Entscheidung: keine KI-Kodierung im Projekt.
- Oktober 2023: Gruppeninterne Diskussion der gesammelten Kategorien. Identifizieren von Lücken im Kategoriensystem – Weitere Schleife der induktiven Kategorienbildung anhand 50 zufällig ausgewählter Leserbriefe
- November 2023: Überarbeitung des Codebuchs und weiterer Test an drei ausgewählten Datensätzen (BZ 1957, BZ 1971, BZ 1986)
- Dezember 2023: Erster Reliabilitätstest. Durchschnittlicher Fleiss Kappa = ,31.
- Januar 2024: Zweiter Reliabilitätstest. Durchschnittlicher Fleiss Kappa = ,73
- Februar 2024: Dritter Reliabilitätstest. Durchschnittlicher Fleiss Kappa = ,86
- März 2024: Beginn der Annotation