Dashboard NaDiRa.Medien

Ob und wie die Medien über Rassismus berichten, macht einen Unterschied. Massenmedien haben in unserer Gesellschaft die wichtige Aufgabe, Konflikte sichtbar zu machen und Aufmerksamkeit auf die wichtigen Probleme zu lenken. Dabei ist nicht nur entscheidend, wie oft sie über Rassismus berichten - sondern auch, welche Aspekte des Themas dabei (nicht) sichtbar werden.
Im Rahmen des Nationalen Diskriminierungs- und Rassismusmonitors (NaDiRa) haben wir mit einer automatisierten Textanalyse empirisch untersucht, wie ausgewählte deutsche Leitmedien über Rassismus berichten. Welche Veränderungen und Kontinuitäten zeigen sich dabei im Zeitverlauf? Auf dieser Seite sind das Vorgehen der Forschungsgruppe und die Ergebnisse unserer Arbeit dokumentiert und interaktiv abrufbar.

1990 bis 2021
Untersuchungszeitraum
3
ausgewählte Zeitungen
42.034
Artikel
31.958.659
Worte
Projektteam
  • Prof. Dr. Andreas Blätte - Universität Duisburg-Essen & Interdisziplinäres Zentrum für Integrations- und Migrationsforschung (InZentIM)
  • Joscha Kükenshöner - Deutsches Zentrum für Integrations- und Migrationsforschung (DeZIM)
  • Dr. Sünje Paasch-Colberg - Deutsches Zentrum für Integrations- und Migrationsforschung (DeZIM)
  • Tom Runge - Deutsches Zentrum für Integrations- und Migrationsforschung (DeZIM)
Bei Fragen und Anregungen wenden Sie sich gerne jederzeit an: rassismusmonitoring(at)dezim-institut.de

Themenverlauf

Wie sichtbar ist das Thema Rassismus in den Medien? Welche Trends lassen sich im Laufe der Zeit erkennen? Was sind Schlüsselmomente der medialen Debatte? Um diese Fragen zu beantworten, haben wir Listen mit thematisch relevanten Schlagworten (sog. Diktionären oder Suchwortlisten) erstellt und anhand dieser die Berichterstattung der drei Zeitungen durchsucht.
Hier können Sie sich anzeigen lassen, wie viele Artikel Die Sichtbarkeit des Themas Rassismus in den Medien kann auf verschiedene Weise untersucht werden. Ein Indikator ist die absolute Anzahl der Artikel, in denen mindestens ein Schlagwort des ausgewählten Diktionärs genannt wird. Unsere Grafiken zeigen die absolute Anzahl der Artikel je ausgewählter Zeitung. mindestens eines der Schlagworte enthalten (Grafik 1) und wie häufig die Schlagworte Die Sichtbarkeit des Themas Rassismus in den Medien kann auf verschiedene Weise untersucht werden. Ein Indikator ist die Häufigkeit, mit der relevante Schlagworte insgesamt in der Berichterstattung vorkommen. Hiervon kann auf die Länge der Artikel und die „Dichte" der Auseinandersetzung mit dem Thema Rassismus in einem Artikel geschlossen werden. Unsere Grafiken zeigen, wie häufig die Schlagworte des ausgewählten Diktionärs in der Berichterstattung der ausgewählten Zeitung insgesamt genannt werden. von der Suchwortliste insgesamt in der Berichterstattung vorkommen (Grafik 2). Dabei können Sie zwischen den verschiedenen Diktionären Für unsere Analysen haben wir drei Diktionäre unterschieden:
  • Das inklusive Rassismus-Diktionär erfasst die Berichterstattung über Rassismus im weiteren Sinne. Es enthält neben Schlagworten wie „Rassismus“ und „rassistisch“ auch Verweise auf spezifische Rassismen und Betroffenengruppen sowie synonym oder ausweichend verwendete Begriffe wie „Fremdenfeindlichkeit“ oder „Ausländerhass“.
  • Das Teil-Diktionär Rassismus umfasst die Berichterstattung über Rassismus im engeren Sinne. Es enthält Begriffe wie „Rassismus“, „rassistisch“ und „Rassisten“.
  • Das Teil-Diktionär Fremdenfeindlichkeit umfasst Begriffe, die Rassismus nicht explizit benennen, sondern synonym oder ausweichend verwendet werden. Dazu gehören „Fremdenfeindlichkeit“, „ausländerfeindlich“ oder „Ausländerhass“.
  • (oder: Suchwortlisten), Aggregationsniveaus In der quantitativen Datenanalyse versteht man unter "Aggregation" die Zusammenfassung von Daten, die bestimmte Merkmale teilen, zu einem Kennwert auf einer höheren Stufe. In unseren Analysen haben wir z. B. die Artikel zum Thema Rassismus für verschiedene Zeiträume zusammengefasst: Monate, Quartale und Jahre. und Tageszeitungen Tipp: Hierfür können Sie in der Legende über der jeweiligen Grafik einzelne Zeitungen auswählen. wechseln, um die Unterschiede zu beobachten.
    Grafik 1: Anzahl der Artikel (mit mindestens einem Schlagwort-Treffer) Lese-BeispielErläuterung: Dargestellt ist die absolute Häufigkeit der Artikel, die mindestens ein Schlagwort des ausgewählten Diktionärs nennen, aufsummiert für die ausgewählte Aggregationsstufe (Monate, Quartale oder Jahre).
    Lesebeispiel: In allen drei Zeitungen ist ein Trend erkennbar, im Zeitverlauf häufiger über Rassismus zu berichten. So erschienen beispielsweise im Jahr 2020 insgesamt 1.026 Artikel in der taz, die mindestens ein Schlagwort des „inklusiven“ Rassismus-Diktionärs nennen, während es im Jahr 2003 z. B. nur 309 Artikel waren.
    Wenn Sie sich die Artikel-Anzahlen für das Teil-Diktionär Rassismus - also für die Rassismus-Berichterstattung im engeren Sinne - anzeigen lassen, sehen Sie, dass dieser Trend deutlicher ausfällt.
    Loading...
    Grafik 2: Anzahl der Schlagworte insgesamt Lese-BeispielErläuterung: Dargestellt ist die absolute Häufigkeit, mit der die Suchbegriffe des jeweils ausgewählten Diktionärs insgesamt in der Berichterstattung vorkommen, aufsummiert für die ausgewählte Aggregationsstufe (Monate, Quartale oder Jahre).
    Lesebeispiel: Relevante Schlagworte der Debatte über Rassismus kommen im Zeitverlauf zunehmend häufiger in der Berichterstattung aller drei Zeitungen vor. Im Jahr 2020 kommen in der Berichterstattung der taz insgesamt 2.885 relevante Schlagworte zu Rassismus vor, während es z. B. im Jahr 2011 insgesamt nur 822 Schlagworte sind.
    Loading...

    Signifikante Wörter

    Worum geht es, wenn die ausgewählten Medien über Rassismus berichten? Welche Aspekte des Themas stehen im Vordergrund? Was wird in der medialen Debatte eher selten aufgegriffen? Um zu untersuchen, wie die Zeitungen über Rassismus berichten, haben wir das charakteristische Vokabular (sog. Features oder signifikante Wörter) der Artikel über Rassismus bestimmt. Diese Artikel wurden mit Hilfe des inklusiven Rassismus-DiktionärsDas inklusive Rassismus-Diktionär erfasst die Berichterstattung über Rassismus im weiteren Sinne. Es enthält neben Schlagworten wie „Rassismus“ und „rassistisch“ auch Verweise auf spezifische Rassismen und Betroffenengruppen sowie synonym oder ausweichend verwendete Begriffe wie „Fremdenfeindlichkeit“ oder „Ausländerhass“. identifiziert - und thematisieren Rassismus in einem weiteren Sinne.
    Die Features zeigen, welche Wörter die Rassismus- Berichterstattung der untersuchten Zeitung besonders prägen. Grundlage dieser Analyse sind statistische Unterschiedstests Für unsere Analysen wurde für jede Zeitung mittels der Feature Extraction-Methode ein Chi-Quadrat-Test berechnet, der die Worte der Rassismus-Berichterstattung mit einem Referenz-Korpus (hier: der Berichterstattung über Migration/Integration derselben Zeitung) vergleicht. Dabei wird die Häufigkeit der Wörter in den Artikeln über Rassismus mit der Häufigkeit der Wörter im Referenz-Korpus (unter Berücksichtigung der Korpus-Größen) ausgezählt. Dies ist die sog. beobachtete Häufigkeit. Sie wird mit der Häufigkeit der Wörter verglichen, die zu erwarten wäre, wenn es zwischen den beiden Korpora keine Unterschiede bzgl. der Wort-Häufigkeit gäbe (sog. erwartete Häufigkeit bei Annahme einer Gleichverteilung). Von „signifikanten" Wörtern spricht man dann, wenn die beobachtete und die erwartete Wort-Häufigkeit sich stark unterscheidet und die Annahme der Gleichverteilung verworfen werden muss.
    Für die Grafiken fanden nur diejenigen Wörter weiter Berücksichtigung, die in der Rassismus-Berichterstattung mindestens fünfmal auftreten und einen Chi-Quadrat-Wert von mindestens 20 aufweisen. Außerdem wurden Wörter, die Teil des Rassismus-Diktionärs sind, ausgeschlossen.
    Die Berichterstattung über Migration und Integration wurde als Referenz-Korpus ausgewählt, da uns für dieses Thema aus allen drei Zeitungen die relevanten Artikel vollständig vorliegen. Für einen Vergleich mit der Rassismus-berichterstattung bietet es sich an, weil es eine gewisse inhaltliche Nähe zum Thema Rassismus aufweist und z. T. Bezüge zu denselben Akteuren und Gruppen herstellt. Unterschiede in den Wort-Häufigkeiten werden dadurch eher nicht überschätzt.
    , die diejenigen Wörter identifizieren, die in der Rassismus-Berichterstattung im Vergleich zur Berichterstattung über ein anderes Thema signifikant häufiger vorkommen. Grundlage der Analyse sind dabei die Wortstämme, damit verschiedene grammatikalische Flektionen eines Wortes (z. B. rechtsextreme und rechtsextremen) nicht als unterschiedliche Wörter, sondern zusammengefasst gezählt werden.
    Hier können Sie sich anzeigen lassen, welche Wörter die Rassismus-Berichterstattung einer Zeitung besonders prägen und dabei nach der Wortart filtern. Die Häufigkeiten und Ränge der Wörter beziehen sich dabei auf den gesamten Untersuchungszeitraum (SZ & FAZ: 1992-2021, taz: 1994-2021).
    Grafik 3: Liste der signifikanten Wörter Lese-BeispielErläuterung: Die Liste zeigt die signifikanten Wörter, die die Rassismus-Berichterstattung der ausgewählten Zeitung besonders prägen, absteigend nach ihrem Signifikanzwert sortiert.
    Lesebeispiel: In Artikeln der FAZ, die mindestens ein Schlagwort des „inklusiven“ Rassismus-Diktionärs nennen, kommen die Worte „NPD“ und „AfD“ überzufällig häufiger vor als in Artikeln derselben Zeitung, die Migration oder Integration thematisieren.
    Loading...
    Grafik 4: Rang-Vergleich der signifikanten Wörter Lese-BeispielErläuterung: Die Tabelle zeigt die signifikanten Wörter der Rassismus-Berichterstattung der ausgewählten Zeitung, absteigend nach ihrem Signifikanz-Rang geordnet. Für jedes Wort ist außerdem ausgewiesen, welchen Signifikanz-Rang es in der Rassismus-Berichterstattung der beiden anderen Zeitung aufweist.
    Lesebeispiel: Das Wort „Skinhead“ rangiert auf Rang 13 der signifikanten Wörter der Rassismus-Berichterstattung der FAZ (im Vergleich der FAZ-Artikel über Migration/Integration). In der taz ist das gleiche Wort mit Rang 96 deutlich weiter unten in der Liste der signifikanten Worte.
    Loading...

    Tabelle 1: Signifikante Wörter (Features) der Rassismus-Berichterstattung

    Loading...

    Wortumfeld-Analysen

    Eine weitere Annäherung an den Deutungskontext der Rassismus-Berichterstattung ist die Analyse des direkten Wortumfelds (sog. Kookkurrenz-Analysen) von expliziten Rassismus-Bennungen in den Zeitungen. Mit Hilfe dieser Analysen lässt sich bestimmen, welche Wörter vor oder nach dem Suchbegriff im Artikel (hier: „Rassismus“) statistisch überzufällig häufig vorkommen. Diese Wörter prägen den semantischen Gehalt des Suchbegriffes. Grundlage der Wortumfeld-Analyse ist ein statistischer Unterschiedstest Die Kookkurrenz-Analyse nutzt einen Log-Likelihood-Test, der prüft, welche Wörter im Umfeld eines Suchbegriffs (hier: „Rassismus“) signifikant häufiger vorkommen als im Rest des Korpus. In unserer Analyse haben wir mit einem Suchbereich von 10 Worten vor und 10 Worten nach dem Suchbegriff (hier: „Rassismus") gearbeitet. Für die Grafiken werden nur diejenigen Wörter berücksichtigt, die mindestens fünfmal vorkommen und einen Log-Likelihood-Wert von mindestens 10.83 aufweisen..
    Unsere vorherige Analyse des Themenverlaufs zeigt, dass die untersuchten Zeitungen dem Thema Rassismus ab den Jahren 2010/2011 zunehmend mehr Aufmerksamkeit widmen. An diesem Befund haben wir uns orientiert und das signifikante Wortumfeld von „Rassismus“-Nennungen vor dem Jahr 2010 und nach dem Jahr 2010 miteinander verglichen.
    Hier können Sie sich anzeigen lassen, welche Wörter den semantischen Gehalt des Rassismus-Begriffes in den beiden Phasen prägen und dabei nach verschiedenen Wortarten filtern.
    Grafik 5: Signifikante Wörter im Wortumfeld von „Rassismus“ in der Berichterstattung vor 2010 (links) und nach 2010 (rechts) Lese-BeispielErläuterung: Die beiden Grafiken zeigen die signifikanten Wörter im Umfeld des Begriffs „Rassismus“ in der Berichterstattung der ausgewählten Zeitung, absteigend sortiert nach dem Rang ihrer Signifikanz. Links ist das signifikante Wortumfeld in der Berichterstattung vor 2010 abgebildet, rechts ist das signifikante Wortumfeld in der Berichterstattung nach 2010 abgebildet.
    Lesebeispiel: In der FAZ kommt das Wort „Polizeigewalt“ im Umfeld des Wortes Rassismus im Zeitraum nach 2010 überzufällig häufig vor. Im Zeitraum vor 2010 wurde „Polizeigewalt“ dagegen nicht als ein signifikantes Wort im Umfeld von „Rassismus“ identifiziert.
    Wenn Sie die SZ und die Wortart „Adjektive“ auswählen sehen Sie: In der SZ gehört das Adjektiv „antimuslimisch“ im Zeitraum nach 2010 zum signifikanten Wortumfeld von „Rassismus“. In den Artikeln, die vor 2010 in der Zeitung erschienen, taucht „antimuslimisch“ dagegen noch nicht als ein signifikantes Wort auf.
    Loading...
    Loading...

    Tabelle 2: Signifikante Wörter im Wortumfeld des Suchbegriffs Rassismus (vor 2010)

    Loading...

    Tabelle 3: Signifikante Wörter im Wortumfeld des Suchbegriffs Rassismus (nach 2010)

    Loading...

    Daten & Methoden

    Dieses Dashboard dokumentiert die Ergebnisse einer Medienanalyse des Nationalen Diskriminierungs- und Rassismusmonitors (NaDiRa) am DeZIM. Das Ziel der Analyse ist, die Thematisierung von Rassismus in ausgewählten deutschen Leitmedien im Längsschnitt nachzuzeichnen und zu untersuchen, wie sich die mediale Sichtbarkeit und die thematische Kontextualisierung von Rassismus über die Zeit verändert haben. Basis der Analysen ist eine längsschnittliche Textsammlung (sog. Korpus Der Begriff Korpus bezeichnet eine Sammlung von Texten oder Medieninhalten, die für die Untersuchung von Fragestellungen z. B. in der Linguistik oder Medienwissenschaft verwendet wird. Diese Texte können beispielsweise Nachrichtenartikel, Blogbeiträge, Social-Media-Posts oder andere Arten von textlichen Inhalten sein. Das Korpus wird nach bestimmten Kriterien zusammengestellt, die je nach Ziel der Analyse variieren können. Es dient als Datenquelle, um Trends, Muster oder Themen in der Medienberichterstattung zu identifizieren und zu untersuchen. ), das für automatisierte Textanalysen aufbereitet wurde und die Rassismus-Berichterstattung ausgewählter deutscher Tageszeitungen im Zeitraum von Januar 1990 bis Dezember 2021 umfasst.
    Die Korpuserstellung erfolgte in enger Kooperation mit dem InZentIM und baut auf dem „MigPress”-Korpus auf (Blätte, Schmitz-Vardar & Leonhardt, 2020; siehe auch http://www.migpress.de/), das für die NaDiRa-Medienanalysen erweitert wurde. Für die Erstellung und Auswertung der Korpora haben wir mit den R-Paketen cwbtools (Blätte 2022) und polmineR (Blätte 2020) gearbeitet.
    Um das Segment der diskursprägenden Leitmedien breit abzubilden, haben wir mit der links-liberalen Süddeutschen Zeitung und der konservativ-liberalen Frankfurter Allgemeinen Zeitung zwei nationale Qualitätszeitungen mit unterschiedlicher politischer Grundausrichtung ausgewählt. Als dritte Zeitung wurde die links-alternative taz ausgewählt, da sie im deutschen Mediensystem als ein alternativer Agenda-Setter gilt, der progressiven Themen, Standpunkten und Akteuren breitere gesellschaftliche Sichtbarkeit verleihen kann. Um unsere Analysen auf die nachrichtliche Berichterstattung und Meinungsstücke zu begrenzen (und beispielsweise Besprechungen von Filmen oder Büchern auszuschließen), wurden für jede Zeitung bestimmte Ressorts ausgewählt (siehe unten). Dabei wurde versucht, die unterschiedlich breiten Ressort-Zuschneidungen der Zeitungen zu berücksichtigen und für die drei Quellen eine möglichst vergleichbare Auswahlgrundlage zu schaffen.
    Als Untersuchungszeitraum wurde die Zeit zwischen dem 01.01.1990 und dem 31.12.2021 festgelegt, um den Diskurs seit der deutschen Wiedervereinigung nachzeichnen zu können und neben Phasen mit besonders aufmerksamkeitserregenden, relevanten Ereignissen für die Rassismus-Debatte als Phasen ohne derartige Ereignisse abzubilden. In der Aufbereitung der von den Zeitungsverlagen bereitgestellten Artikel fielen fehlerhafte Ressort-Zuweisungen der taz-Artikel in den Jahren 1990-1993 sowie Dubletten im Datenmaterial der Süddeutschen Zeitung auf. Obwohl die meisten Dubletten identifiziert und für die inhaltlichen Analysen vom Korpus ausgeschlossen werden konnten, kann nicht ausgeschlossen werden, dass der SZ-Korpus in den Jahren 1990 und 1991 noch fehlerhafte Doppelungen enthält. Um die Ergebnisse nicht zu verzerren, wurden die entsprechenden Artikel der SZ und der taz in unseren Analysen nicht berücksichtigt; der Untersuchungszeitraum beginnt demnach für die FAZ mit dem 01.01.1990, für die SZ mit dem 01.01.1992 und für die taz mit dem 01.04.1994.
    Ausgewählte Ressorts nach Zeitungstitel
    Zeitung Ressorts
    Frankfurter Allgemeine Zeitung Politik
    Gesellschaft, Leben
    Wirtschaft
    Süddeutsche Zeitung Politik, Nachrichten, Themen des Tages
    Gesellschaft
    Meinungsseite
    Die Seite Drei
    taz Politik, Seite 1, Aktuelles, Tagesthema, Ausland, Inland
    Gesellschaft
    Wirtschaft und Umwelt
    Meinung und Diskussion
    Hintergrund, Reportage, Schwerpunkt
    Um die ausgewählten Zeitungen systematisch nach Artikeln zu durchsuchen, die Rassismus (in einem weiteren Sinne) thematisieren, wurde in einem mehrstufigen Verfahren ein sog. „inklusives” Rassismus-Diktionär entwickelt und validiert. Diese Schlagwort-Liste umfasst neben Begriffen wie „Rassismus” und „rassistisch*” auch Verweise auf spezifische Rassismen und Betroffenengruppen (z. B. [iI]slamophob.*, [aA]nti-?zigan.*, [aA]nti-?islamisch.*). Der mehrdeutige Begriff „Diskriminierung“, der auch Phänomene außerhalb des Themenkomplexes Rassismus bezeichnen kann, wurde nur in Kombination mit der nachgestellten Nennung einer rassifizierten Gruppe (z. B. [dD]iskrim.* []{0,2} [mM][uo]sl[ei]m.*) berücksichtigt, um falsch-positive Treffer zu minimieren. Um Begriffsverschiebungen im Zeitverlauf und die Zögerlichkeit in der expliziten Benennung von Rassismus zu berücksichtigen, wurden zudem synonym oder ausweichend genutzte Begriffe wie „[fF]remdenfeind.*“ oder „[aA]usländerfeind.*“ in die Liste aufgenommen. In allen drei Korpora generierten Variationen der Suchbegriffe Rassismus und rassistisch sowie fremdenfeindlich und ausländerfeindlich mit deutlichem Abstand die meisten Treffer.
    Für einige Analysen haben wir anstelle des inklusiven Diktionärs mit verschiedenen Teil-Diktionären gearbeitet - zum Beispiel, um die explizite Thematisierung von Rassismus (Teil-Diktionär Rassismus) oder das Vorkommen sog. Ausweichbegriffe (Teil-Diktionär Fremdenfeindlichkeit) zu untersuchen. Unten sind die Suchbegriffe der verschiedenen Diktionäre vollständig aufgelistet.
    Hinweis: Die folgende Tabelle enthält z. T. rassistische, verletzende Bezeichnungen, die wir hier ausnahmsweise ausgeschrieben haben, um unser Vorgehen in der Datenerhebung möglichst nachvollziehbar darzustellen. Da diese Begriffe in der Medienberichterstattung genutzt wurden und noch werden, ist es methodisch notwendig und im Sinne valider Forschung, sie für die Suchwortliste zu berücksichtigen und die Berichterstattung über Rassismus (im weiteren Sinne) möglichst vollständig zu erfassen.
    Suchbegriffe
    Inklusiver “Rassismus-Diktionär” Teil-Diktionär “Rassismus” Teil-Diktionär “Fremdenfeindlichkeit” Teil-Diktionär “Spezifische Rassismen”
    .*[rR]assisti.*
    .*[rR]assism.*
    Rassist
    Rassisten
    rR]assendiskr.*
    [rR]assenideolog.*
    [rR]acism.*
    .*[rR]assisti.*
    .*[rR]assism.*
    Rassist
    Rassisten
    rR]assendiskr.* [rR]assenideolog.* [rR]acism.*
    Ff]remdenfeind.*
    [Xx]enophob.*
    gegen Fremde
    gegen Ausländ.*
    Fremdenhass.*
    [Aa]usländerfeind.*
    [mM]inderheiten-?[fF]eind.*
    Ausländerhass.*
    ([Ii]mm|[Mm])igrantenfeind.*
    '"[dD]iskrim.*" []{0,2} Ausländer.*
    [dD]iskrim.* []{0,2} Fremde.*
    [dD]iskrim.* []{0,2} Asylant.*
    [dD]iskrim.* []{0,2} Flüchtling.*
    [dD]iskrim.* []{0,2} Geflüchtete.*
    [Ff]remdenfeind.*
    [Xx]enophob.*
    gegen Fremde
    gegen Ausländ.*
    Fremdenhass.*
    [Aa]usländerfeind.*
    [mM]inderheiten-?[fF]eind.*
    Ausländerhass.*
    ([Ii]mm|[Mm])igrantenfeind.*
    '"[dD]iskrim.*" []{0,2} Ausländer.*
    [dD]iskrim.* []{0,2} Fremde.*
    [dD]iskrim.* []{0,2} Asylant.*
    [dD]iskrim.* []{0,2} Flüchtling.*
    [dD]iskrim.* []{0,2} Geflüchtete.*
    [iI]sla(m|mo)phob.*
    [Aa]nti-?zigan.*
    [Aa]nti-?chine.*
    [Aa]nti-?asiat.*
    Islamhass.*
    [mM][uo]sl[ei]mfeind.*
    [mM][uo]sl[ei]mhass.*
    Feindbild.* Islam
    [aA]nti-?islamisch.*
    [dD]iskrim.* []{0,2} [mM][uo]sl[ei]m.*
    [dD]iskrim.* []{0,2} Rom.*
    [aA]nti-?[rR]oma.*
    [dD]iskrim.* []{0,2} Sinti.*
    [dD]iskrim.* []{0,2} [zZ]igeuner.*
    [Ss]inophob.*
    [dD]iskrim.* []{0,2} [aA]siat.*
    [dD]iskrim.* []{0,2} [sS]chwarz.*
    [dD]iskrim.* []{0,2} [aA]fro.*
    [dD]iskrim. []{0,2} [BP|BiP|P][oO]C.
    [dD]iskrim.* []{0,2} of Col[o|ou]r
    [iI]slamfeind.*
    [iI]sla(m|mo)phob.*
    [Aa]nti-?zigan.*
    [Aa]nti-?chine.*
    [Aa]nti-?asiat.*
    Islamhass.*
    [mM][uo]sl[ei]mfeind.*
    [mM][uo]sl[ei]mhass.*
    Feindbild.* Islam
    [aA]nti-?islamisch.*
    [dD]iskrim.* []{0,2} [mM][uo]sl[ei]m.*
    [dD]iskrim.* []{0,2} Rom.*
    [aA]nti-?[rR]oma.*
    [dD]iskrim.* []{0,2} Sinti.*
    [dD]iskrim.* []{0,2} [zZ]igeuner.*
    [Ss]inophob.*
    [dD]iskrim.* []{0,2} [aA]siat.*
    [dD]iskrim.* []{0,2} [sS]chwarz.*
    [dD]iskrim.* []{0,2} [aA]fro.*
    [dD]iskrim. []{0,2} [BP|BiP|P][oO]C.
    [dD]iskrim.* []{0,2} of Col[o|ou]r
    [Vv]olksverhetz.*
    Alle Artikel, die im Untersuchungszeitraum in einer der ausgewählten Zeitungen veröffentlicht wurden und mindestens ein Schlagwort des inklusiven Diktionärs enthalten, sind als Volltext im Korpus enthalten und bilden die sog. „Rassismus-Partition”. Die Rassismus-Partition umfasst insgesamt 42.034 Artikel mit knapp 32 Millionen Token (Worten).
    Umfang der Rassismus-Partition
    SZ FAZ TAZ Gesamt
    Anzahl Artikel 12.880
    (30,64%)
    11.978
    (28,50%)
    17.176
    (40,86%)
    42.034
    (100%)
    Anzahl Token 9.296.180
    (29,09%)
    10.881.980
    (34.05%)
    11.780.499
    (40,86%)
    31.958.659
    (100%)
    Mithilfe bewährter Modelle des Natural Language Processing und eines teilüberwachten Machine Learning-Algorithmus (Watanabe 2018) wurden die ausgewählten Artikel um linguistische Annotationen ergänzt. So stehen neben den Worten selbst auch eine Wortarterkennung (sog. part-of-speech-Tagging), Wortstämme (Lemmata) sowie eine Named-Entity-Erkennung zur Verfügung, die es ermöglichen, in der Analyse nur bestimmte Wortformen zu nutzen oder die Ergebnisse nach Wortformen zu filtern. Für diese Annotationsschritte wurden bewährte Modelle der Stanford NLP Group genutzt. Die angereicherten Daten wurden unter Rückgriff auf die Corpus Workbench (CWB) (Evert und Hardie 2011) als Korpora indiziert und gespeichert. Die CWB beinhaltet den Corpus Query Processor (CQP), der komplexe Suchanfragen über große Korpora ermöglicht, die reguläre Ausdrücke und linguistische Annotationsschichten jenseits der Wortform enthalten können.
    Um innerhalb der Rassismus-Partition diejenigen Artikel zu identifizieren, deren primärer Fokus auf Ereignissen, Themen und Akteuren in Deutschland liegt (sog. Deutschland-Berichterstattung) und die Thematisierung von Rassismus in Deutschland zu untersuchen, haben wir das R-Paket newsmap (Watanabe 2017) genutzt und ein Modell zur automatisierten Klassifizierung des geografischen Fokus aufgesetzt. newsmap ist ein teilüberwachter Machine Learning-Algorithmus zur automatisierten Klassifizierung von Länderbezügen in Nachrichtentexten(vgl. https://github.com/koheiw/newsmap). Für etwa die Hälfte der Artikel jedes Zeitungstitels hat newsmap einen Deutschland-Fokus identifiziert. Zur Validierung des newsmap-Modells haben wir die automatische Klassifikation mit einer manuellen Codierung verglichen. Hierfür wurde eine geschichtete, zufällige Stichprobe von insgesamt n=200 Artikeln aus jedem der drei Korpora gezogen. Die prozentuale Übereinstimmung der manuellen mit der automatischen Klassifizierung fällt für das Gesamt-Testsample der drei Zeitungen unterschiedlich aus: Während die Übereinstimmung für das Sample der FAZ und der taz mit etwa 82 bzw. 80 Prozent zufriedenstellend ausfällt, stimmen die beiden Klassifizierungen der SZ-Artikel mit 73 Prozent etwas seltener überein. Wird das Testsample allerdings auf diejenigen Artikel eingeschränkt, für die newsmap einen Deutschland-Fokus zugewiesen hat, stimmen die Codierungen für alle drei Zeitungen sehr stark überein: Zwischen 97 und 99 Prozent der Artikel, die laut newsmap einen Deutschland-Fokus haben, werden auch von einer menschlichen Leserin als Artikel über Deutschland klassifiziert.
    Ergebnisse der newsmap-Validierung
    Zeitung Testsample gesamt Testsample Deutschland
    Süddeutsche Zeitung 73% (n=200) 97% (n=100)
    FAZ 82% (n=200) 97% (n=100)
    taz 80% (n=200) 99% (n=100)
    Um Muster in der Rassismus-Berichterstattung für den gesamten Zeitverlauf zu untersuchen, wurden die Korpora mithilfe verschiedener Verfahren der automatisierten Textanalyse systematisch ausgewertet.
    • Diktionärsbasierte Häufigkeiten: Die oben beschriebenen Diktionäre wurden genutzt, um die Relevanz (oder: Salienz) des Themas Rassismus in der Berichterstattung zu untersuchen und Artikelhäufigkeiten sowie die Anzahl von Schlagwort-Treffern auszuzählen.
    • Feature Extraction: Dieses Verfahren nutzt statistische Unterschiedstests, um überzufällig häufig auftretende Worte in einem Teil-Korpus im Vergleich zu einem Referenzkorpus zu identifizieren und somit die charakteristischen, „tragenden” Begriffe eines bestimmten Diskursstranges zu bestimmen (Manning und Schütze 1999, S. 151–189; Baker 2006, S. 121–149). Im Rahmen unserer Analysen wurde für jede Zeitung mittels der Feature Extraction-Methode ein Chi-Quadrat-Test berechnet, der einen Vergleich der Rassismus-Partition mit der MigPress-Partition anstellte. Dabei wurde die Häufigkeit der Worte in der Rassismus-Partition mit der Häufigkeit der Worte in der MigPress-Partition (unter Berücksichtigung der Korpus-Größen) ausgezählt. Diese sog. beobachtete Häufigkeit wird mit der Häufigkeit der Worte verglichen, die zu erwarten wäre, wenn es zwischen den Partitionen keine Unterschiede bzgl. der Wort-Häufigkeit gäbe (sog. erwartete Häufigkeit bei Annahme einer Gleichverteilung). Von „signifikanten" oder überzufällig häufigen Worten spricht man dann, wenn die beobachtete und die erwartete Wort-Häufigkeit sich stark unterscheidet und die Annahme der Gleichverteilung verworfen werden muss. Für die Tabellen und Grafiken fanden nur diejenigen Worte weiter Berücksichtigung, die in der Rassismus-Partition mindestens fünfmal auftreten, einen Chi-Quadrat-Wert von mindestens 20 aufweisen und die nicht bereits Teil des Rassismus-Diktionärs sind.
    • Kookkurrenzen: Zudem haben wir Wortumfeldanalysen durchgeführt, die sich ebenfalls einen statistischen Unterschiedstest (log-likelihood) zunutze machen und prüfen, welche Worte innerhalb eines vorher spezifizierten Rahmens (oder Suchbereichs) um einen Suchbegriff signifikant häufiger vorkommen als außerhalb des Rahmens und damit den semantischen Gehalt des Suchbegriffes prägen (Baker 2006, S. 121–149; Manning und Schütze 1999, S. 151–189).In unserer Analyse haben wir mit einem Suchbereich von 10 Worten vor und 10 Worten nach dem Suchbegriff (hier: "Rassismus") gearbeitet. Für die Tabellen und Grafiken wurden nur diejenigen Worte weiter berücksichtigt, die mindestens fünfmal vorkommen und einen Log-Likelihood-Wert von mindestens 10.83 aufweisen. Die Analyse basiert dabei auf einzelnen Worten und nicht (wie im Fall der Features) auf den Grundformen der Worte (sog. Lemmata). Der Grund dafür ist, dass die automatisierte Lemmatisierung Wortneuschöpfungen nicht immer richtig erkennt und diese für die Analyse dann nicht zur Verfügung stehen. In unserem Fall trifft dies z. B. auf das Wort "antimuslimisch" und seine verschiedenen Flektionen zu. Dieses Wort kommt im Wortumfeld von "Rassismus" zunehmend signifikant vor - dieser Befund zeigt sich aber nicht mehr, wenn die in Analysen mit den lemmatisierten Worten durchgeführt wird. Deshalb haben wir uns im Fall der Kookkurrenz-Analyse für die Arbeit mit einzelnen Worten entschieden, auch wenn die verschiedenen grammatikalischen Wortformen in der statistischen Analyse dadurch nicht zusammengefasst, sondern einzeln gezählt werden (und in den Tabellen und Grafiken einzeln aufgelistet sind).
    • Konkordanzen (keyword in context): Zur Validierung von Kookkurrenzen haben wir uns für ausgewählte Begriffe die zugehörigen Textstellen ausgeben lassen und diese in mehreren Lese-Gängen qualitativ auf Stimmigkeit mit unserer Interpretation des textstatistischen Befundes geprüft.
    Baker, Paul (2006): Using corpora in discourse analysis. London: Continuum (Continuum discourse series).
    Blätte, Andreas (2020). polmineR: Verbs and Nouns for Corpus Analysis. R package version v0.8.2. http://doi.org/10.5281/zenodo.4042093
    Blätte, Andreas (2022). cwbtools: Tools to create, modify and manage CWB Corpora. R package version 0.3.5. https://CRAN.R-project.org/package=cwbtools
    Blätte, Andreas; Schmitz-Vardar, Merve; Leonhardt; Christoph (2020): MigPress. Ein Korpus migrations- und integrationspolitischen Presseberichterstattung von SZ und FAZ. Version: 2020.07.08
    Evert, Stefan und Andrew Hardie (2011): Twenty-first century Corpus Workbench: Updating a query architecture for the new millennium. Proceedings of the Corpus Linguistics 2011 conference, University of Birmingham, UK.
    Manning, Christopher D.; Schütze, Hinrich (1999): Foundations of statistical natural language processing. Cambridge, Massachusetts, London: The MIT Press.
    Watanabe, Kohei (2018): Newsmap. A semi-supervised approach to geographical news classification. In: Digital Journalism 6 (3), S. 294–309. DOI: 10.1080/21670811.2017.1293487

    Impressum

    Angaben gemäß § 5 TMG

    Deutsches Zentrum für Integrations- und Migrationsforschung DeZIM e.V.
    Mauerstrasse 76
    10117 Berlin

    Tel: +49 (0) 30 - 804 928 93

    Mail: info@dezim-institut.de


    Vertreten durch:
    Naika Foroutan
    Frank Kalter


    Registereintrag:
    Eintragung im Vereinsregister
    Registergericht: Amtsgericht Berlin-Charlottenburg
    Registernummer: VR 36110 B


    Umsatzsteuer-Identifikationsnummer:
    DE326668539


    Verantwortlich für den Inhalt nach § 55 Abs. 2 RStV:
    Naika Foroutan / Frank Kalter
    Mauerstrasse 76
    10117 Berlin



    Haftungsausschluss:

    Haftung für Inhalte
    Die Inhalte unserer Seiten wurden mit größter Sorgfalt erstellt. Für die Richtigkeit, Vollständigkeit und Aktualität der Inhalte können wir jedoch keine Gewähr übernehmen. Als Diensteanbieter sind wir gemäß § 7 Abs.1 TMG für eigene Inhalte auf diesen Seiten nach den allgemeinen Gesetzen verantwortlich. Nach §§ 8 bis 10 TMG sind wir als Diensteanbieter jedoch nicht verpflichtet, übermittelte oder gespeicherte fremde Informationen zu überwachen oder nach Umständen zu forschen, die auf eine rechtswidrige Tätigkeit hinweisen. Verpflichtungen zur Entfernung oder Sperrung der Nutzung von Informationen nach den allgemeinen Gesetzen bleiben hiervon unberührt. Eine diesbezügliche Haftung ist jedoch erst ab dem Zeitpunkt der Kenntnis einer konkreten Rechtsverletzung möglich. Bei Bekanntwerden von entsprechenden Rechtsverletzungen werden wir diese Inhalte umgehend entfernen.

    Haftung für Links
    Unser Angebot enthält Links zu externen Webseiten Dritter, auf deren Inhalte wir keinen Einfluss haben. Deshalb können wir für diese fremden Inhalte auch keine Gewähr übernehmen. Für die Inhalte der verlinkten Seiten ist stets der jeweilige Anbieter oder Betreiber der Seiten verantwortlich. Die verlinkten Seiten wurden zum Zeitpunkt der Verlinkung auf mögliche Rechtsverstöße überprüft. Rechtswidrige Inhalte waren zum Zeitpunkt der Verlinkung nicht erkennbar. Eine permanente inhaltliche Kontrolle der verlinkten Seiten ist jedoch ohne konkrete Anhaltspunkte einer Rechtsverletzung nicht zumutbar. Bei Bekanntwerden von Rechtsverletzungen werden wir derartige Links umgehend entfernen.

    Urheberrecht
    Die durch die Seitenbetreiber erstellten Inhalte und Werke auf diesen Seiten unterliegen dem deutschen Urheberrecht. Die Vervielfältigung, Bearbeitung, Verbreitung und jede Art der Verwertung außerhalb der Grenzen des Urheberrechtes bedürfen der schriftlichen Zustimmung des jeweiligen Autors bzw. Erstellers. Downloads und Kopien dieser Seite sind nur für den privaten, nicht kommerziellen Gebrauch gestattet. Soweit die Inhalte auf dieser Seite nicht vom Betreiber erstellt wurden, werden die Urheberrechte Dritter beachtet. Insbesondere werden Inhalte Dritter als solche gekennzeichnet. Sollten Sie trotzdem auf eine Urheberrechtsverletzung aufmerksam werden, bitten wir um einen entsprechenden Hinweis. Bei Bekanntwerden von Rechtsverletzungen werden wir derartige Inhalte umgehend entfernen.