Projektchronik – Forschungsgruppe Pronomen

Datenerhebung

Datenaufbereitung

Annotation

Mai 2023: Beginn induktiver Kategorienbildung
September 2023: Test Annotation mittels generativer KI (+ menschlichen Intercoderagreement-Tests) –> Ergebnisse überraschend okay (im Vergleich zu untrainierten Codierer:innen). Allerdings wurde die KI Kodierung nicht besser, während die Intercoderreliabilität der Codierer:innen deutlich verbessert wurde und schließlich die Qualität der KI-Kodierungen übertraf. Entscheidung: keine KI-Kodierung im Projekt.
Oktober 2023: Gruppeninterne Diskussion der gesammelten Kategorien. Identifizieren von Lücken im Kategoriensystem – Weitere Schleife der induktiven Kategorienbildung anhand 50 zufällig ausgewählter Leserbriefe
November 2023: Überarbeitung des Codebuchs und weiterer Test an drei ausgewählten Datensätzen (BZ 1957, BZ 1971, BZ 1986)
Dezember 2023: Erster Reliabilitätstest. Durchschnittlicher Fleiss Kappa = ,31.
Januar 2024: Zweiter Reliabilitätstest. Durchschnittlicher Fleiss Kappa = ,73
Februar 2024: Dritter Reliabilitätstest. Durchschnittlicher Fleiss Kappa = ,86
März 2024: Beginn der Annotation
Oktober 2024: Abschluss Codebuch
April 2025: Abschluss der Annotationen Berliner Zeitung, Neues Deutschland & Neue Zeit
April 2026: Abschluss der Annotationen Neues Deutschland 2000 & 2010