Keyness
Keyness ist ein Mass dafür, welche Wörter signifikant häufiger in einem Korpus als in einem anderen vorkommen. Die Keyness ist eine der Kernanalysekategorien in der Korpuslinguistik. Keywords sind wichtig, wenn es darum geht Schlüsselkonzepte in Diskursen zu identifizieren bzw. typisches Vokabular herauszuarbeiten. Das bedeutet, dass wir zur Berechnung von Keywords immer sowohl ein Untersuchungskorpus (UK) wie auch ein Vergleichskorpus (VK) oder Referenzkorpus (RF) benötigen. Das Vergleichskorpus ist in der Regel grösser als das Untersuchungskorpus.
Keywords können über verschiedene statistische Masse berechnet werden. Je nach Mass wird dabei eine anderer Faktor priorisiert. Es ist daher wichtig, sich vor der Keywordberechnung mit den verschiedenen Massen auseinanderzusetzen und eine informierte Entscheidung zu treffen. Standardmässig wird häufig die sogenannte Log-Likelihood (LL) berechnet. Eine gute Übersicht über die Aussagefähigkeiten der verschiedenen statistischen Masse liefert beispielsweise Brezina (2018: 74).
Keywords berechnen
Mit folgendem Keyness-Skript können Sie die Keywords in Ihrem Korpus berechnen. Sie benötigen dafür die Frequenzlisten des Untersuchungskorpus und des Vergleichskorpus im Format token \t frequenz.
Keyness-Skript folgt.
Literatur
- Brezina, Vaclav (2018): Statistics in Corpus Linguistics. A Practical Guide. Cambridge: Cambridge University Press.
- Knuchel, Daniel (2024): ›HIVAIDS‹ in der Ära der Post-Infektiosität – Korpuspragmatische Analysen zur sprachlichen Konzeptualisierung einer Infektionskrankheit. Im Druck.