Skip to main content

Dispersion

Die Dispersion ist ein Mass zur Angabe der Streuung eines Wortes innerhalb eines Korpus. Dazu wird ein Korpus zunächst in Intervalle eingeteilt. Bei diesen Intervallen kann es sich um unterschiedliche Parameter handeln wie beispielsweise:

  • Zeit (Jahre, Dekaden, ...)
  • Medium (Zeitung, Belletristik, Magazin, ...)
  • Rubrik (bei Zeitungen)
  • Kapitel
  • Paragraphen
  • Texte

Die Dispersion sagt dann aus, wie verteilt sich ein bestimmtes Wort in einem Korpus befindet und ob es an bestimmten Stellen sehr verdichtet und an anderen Stellen dafür kaum oder gar nicht vorkommt.

Keyword- und Dispersionsanalysen werden idealerweise kombiniert angewendet, da erst durch die Streuung die Relevanz als Keyword für das Gesamtkorpus tatsächlich evaluiert werden kann. Kommt ein Wort zwar häufig vor und wird daher als Keyword kategorisiert, so ist nicht klar, ob es sehr verdichtet nur an einer Stelle im Korpus (beispielsweise in einem Jahr oder in einem Text) vorkommt, oder ob es tatsächlich über das gesamte Korpus hinweg relativ gleichmässig verteilt vertreten ist. Die Dispersionsanalyse kann diese Streuung dann aufzeigen.

Keywords berechnen

Mit folgendem Dispersions-Skript können Sie die Dispersion in Ihrem Korpus berechnen.

Dispersions-Skript folgt.

Literatur

  • Brezina, Vaclav (2018): Statistics in Corpus Linguistics. A Practical Guide. Cambridge: Cambridge University Press.
  • Knuchel, Daniel (2024): ›HIVAIDS‹ in der Ära der Post-Infektiosität – Korpuspragmatische Analysen zur sprachlichen Konzeptualisierung einer Infektionskrankheit. Im Druck.