Projektchronik

Datenerhebung

  • Dezember 2022: Beginn Datenerhebung Berliner Zeitung
  • Dezember 2022: Beginn Datenerhebung Neue Zeit
  • Februar 2023: Beginn Datenerhebung Neues Deutschland
  • August 2023: Abschluss Datenerhebung Berliner Zeitung
  • August 2023: Abschluss Datenerhebung Neues Deutschland 2000 & 2010
  • September 2023: Abschluss Datenerhebung Neue Zeit

Datenaufbereitung

  • August 2023: Entwicklung und Test eines Workflows zum Data Clean Up
  • November 2023 bis Januar 2024: Data Clean Up
  • Februar 2024 Start Korrektur KI-Korrigierter Sätze der Leserbriefe

Annotation

  • Mai 2023: Beginn induktiver Kategorienbildung
  • September 2023: Test Annotation mittels generativer KI (+ menschlichen Intercoderagreement-Tests) –> Ergebnisse überraschend okay (im Vergleich zu untrainierten Codierer:innen). Allerdings wurde die KI Kodierung nicht besser, während die Intercoderreliabilität der Codierer:innen deutlich verbessert wurde und schließlich die Qualität der KI-Kodierungen übertraf. Entscheidung: keine KI-Kodierung im Projekt.
  • Oktober 2023: Gruppeninterne Diskussion der gesammelten Kategorien. Identifizieren von Lücken im Kategoriensystem – Weitere Schleife der induktiven Kategorienbildung anhand 50 zufällig ausgewählter Leserbriefe
  • November 2023: Überarbeitung des Codebuchs und weiterer Test an drei ausgewählten Datensätzen (BZ 1957, BZ 1971, BZ 1986)
  • Dezember 2023: Erster Reliabilitätstest. Durchschnittlicher Fleiss Kappa = ,31.
  • Januar 2024: Zweiter Reliabilitätstest. Durchschnittlicher Fleiss Kappa = ,73
  • Februar 2024: Dritter Reliabilitätstest. Durchschnittlicher Fleiss Kappa = ,86
  • März 2024: Beginn der Annotation