Spiegel Mining: Big Data Analyse von 70.000 Online Artikeln

Die Kritik an den sogenannten “Mainstream-Medien” hat 2016 weiter zugenommen. Von “A wie Aluhut-Rebell” bis “Z wie Zyniker”, alle hetzen sie gegen die “globale Medien-Elite”. Hasskommentare bestimmen und überfordern die Medienwelt, weshalb ein Blick hinter die Kulissen genau jener längst überfällig war.

Was also erfährt man, wenn man zwischen den Zeilen liest? Diese und andere Fragen versucht der Informatiker und Datenanalyst David Kriesel zu beantworten.

Kriesel hat zum ersten Mal beim 31c3 (dem alljährlichen Kongress des Chaos Computer Clubs) vor zwei Jahren mit seinem Vortrag: Traue keinem Scan für Furore gesorgt.

Nun hat er sich der Big Data Thematik angenommen und am Beispiel von Spiegel Online mal genauer angesehen. Mit seinem diesjährigen Vortrag hat er beim 33c3 alle Erwartungen weit übertroffen.

Der Titel der Präsentation: Spiegel Mining. Seit 2014 analysiert er Spiegel Online Artikel, zum Zeitpunkt der Präsentation waren das 70.000. Anhand der gewonnenen Rohdaten war es ihm möglich, verschiedenste Zusammenhänge herzustellen und diese eindrucksvoll zu visualisieren.

Alle Bilder: www.dkriesel.com

1) Was ist Spiegel Mining?

mining

Mithilfe selbstgeschriebener Software lädt Kriesel in regelmäßigen Abständen automatisch die Webseite von Spiegel Online herunter, archiviert und analysiert diese dann nach relevanten Gesichtspunkten wie Erscheinungsdatum, Autor, Rubrik und Schlagwörter. So war es ihm möglich, folgende Zusammenhänge darzustellen:

2) Rubriken

Die drei Hauptrubriken von Spiegel Online sind: Politik, Panorama und Sport. Die folgenden Grafiken zeigen, welche Kategorien dadurch ins Hintertreffen geraten. (Links steht der Name des Ressorts und die Anzahl der veröffentlichten Artikel).

mining

mining

Hier erkennt man eindeutig, wie sich der Fokus in nur zwei Jahren geändert, bzw. verschoben hat, was natürlich völlig legitim sei, wie Kriesel auch mehrmals betont:

Kriesel: “Und bevor das jetzt hier falsch ankommt, ich sage das ohne jede Wertung im Sinne von gut oder schlecht, das ist ja eine valide Strategie für ein Medium. Ich beschreibe einfach nur gemessene Daten.”

weiters sagt er:

Kriesel: “Es is keineswegs der Zweck der Veranstaltung, substanzlos in Richtung Spiegel Online zu haten. Denn, wer hatet, wird nicht ernst genommen.”

3) Textlänge

Nachfolgend erhält man einen, wenn auch nicht ganz so überraschenden Überblick zum Thema Textlänge. Und da sag nochmal einer, Kultur wäre tot…

mining

4) Selbstgeschrieben oder nicht?

Die folgende Grafik beschreibt die Originalität eines Artikels. Spiegel Online unterscheidet zwischen zwei Arten von Signatur:

mining

Während Artikel, die mit einem Kürzel als Signatur erscheinen, meistens kopierte Pressemitteilungen sind, sieht man, dass selbstgeschriebene Artikel deutlich länger sind (ein Autor will ja zeigen, was er kann), hauptsächlich liegt das aber natürlich daran, dass er pro Wort, Zeichen oder Zeile bezahlt wird. Je nach Medium gibt es hier Unterschiede.

mining

5) Kommentierbarkeit

Anhand von folgendem Beispiel lässt sich eine ganz klare Trendwende im Bereich “User-Kommentare” erkennen. Man versucht hier durch die Deaktivierung der Kommentar-Sektion Hasskommentare zu verhindern.

mining

Dass der “Online-Hass” Jahr für Jahr zunimmt, lässt sich am besten anhand der vergangenen Terroranschläge in Frankreich visualisieren:

mining

Hier wird sichtbar, dass Artikel vor den Anschlägen vom November 2015 überwiegend kommentierbar waren (blau), nach den Anschlägen überwiegend nicht mehr (rot):

mining

In einem direkten Vergleich sieht man, dass zum Thema Russland so gut wie alles kommentierbar ist:

mining

oder wie Kriesel treffend selbst formuliert: “Wie man sieht, Russen-Bashing ist ok.”

Ob nun eine komplette Deaktivierung, welche somit natürlich auch konstruktive Kritik unterbindet, die einzige Lösung im Umgang mit Hasskommentaren ist, kann man für sich selbst entscheiden.

Die vollständige Präsentation findet ihr auf seiner Website.

If you like this article, you can support this project via:
  • Author

    Chris
    Founder Infinite Sense, Tech and Philosophy enthusiast. Always looking for common sense and a better future. / Email: mail@infinitesense.org

    Comment / Reply

    Be the first to comment on "Spiegel Mining: Big Data Analyse von 70.000 Online Artikeln"

    Your email address will not be published.


    *