Startseite » Von Open Data bis Crowdsourcing: Diese Quellen nutzen Datenjournalisten

Von Open Data bis Crowdsourcing: Diese Quellen nutzen Datenjournalisten

von | 28.September 2017 | Allgemein

Datenjournalisten müssten eigentlich in Goldgräberstimmung sein. Nie zuvor hat die Menschheit eine derartige Menge an Daten generiert. Allein vergangenes Jahr lag die weltweit produzierte Datenmenge bei 16 Zettabyte, so das Ergebnis einer Studie des Festplattenherstellers Seagate und des IT-Marktforschungsunternehmens IDC. Das ist eine Zahl mit 21 Nullen. Um auf diesen Datenberg zu kommen, müsste man sich alle Serien und Filme bei Netflix in etwa 50 Millionen Mal anschauen.

Die riesige Menge an Daten sagt jedoch nichts über das journalistische Potenzial aus. Der Großteil der Daten ist gar nicht öffentlich. Und so stellt sich die Frage: Wie sollen sich Journalisten in dem übrigen Datenmeer orientieren? Um die relevanten Informationen zu finden, ist es auf jeden Fall hilfreich, die bedeutsamsten Quellen zu kennen. So kann man sich schon zu Beginn der Recherche Gedanken darüber machen, wer die benötigten Daten hat. Aus folgenden Quellen speisen sich datenjournalistischen Projekte:

1. Open Data – Daten von staatlichen Stellen

Über jede Menge öffentlich relevante Daten verfügt naturgemäß der Staat. Diese Informationen sind heute besser zugänglich als früher. Die Behörden öffnen sich langsam. Open Government und Open Data sind die Schlagworte dazu. Erste Anlaufstellen können das Statistische Bundesamt sowie die jeweiligen statistischen Landesämter sein. Städte – hier zum Beispiel Leipzig – betreiben ebenfalls entsprechende Portale. Journalistische Knüller lassen sich zwar mit diesen Daten kaum landen – immerhin sind die Informationen für jeden zugänglich und die Ämter betreiben eine eigene Öffentlichkeitsarbeit. Gleichwohl gibt es einige gelungene Beispiele für den datenjournalistischen Einsatz.

Mit verschiedenen Daten der Senatsverwaltung sowie des Kraftfahrzeugbundesamtes und der Verkehrsbetriebe hat etwa der Tagesspiegel die Berliner Stadtfläche in seine Einzelteile zerlegt. Das Interaktiv-Team der Berliner Morgenpost, das kürzlich mit einen „Data Journalism Award“ ausgezeichnet wurde, hat das Umfeld aller 250 Bus-, U-Bahn- und S-Bahn-Linien untersucht. Nutzer können unter „So tickt Berlin an Deiner Linie “ nachschauen, wie hoch die Mieten in der Nähe ihrer Haltestelle sind oder wie die Nachbarn gewählt haben. Die Schwäbische Zeitung wertete die Polizeistatistik aus, um zu zeigen, wo es in der Region am häufigsten zu Verkehrsunfällen kommt.

2. Spezielle Datenveröffentlichungen von Organisationen, Verbänden und anderen Institutionen

Die zahllosen Verbände und Nichtregierungsorganisationen in Deutschland sowie viele große Unternehmen veröffentlichen ebenfalls Daten zu Themen aller Art. Manchmal wissen die entsprechenden Institutionen gar nicht, dass ihre Daten für die Öffentlichkeit interessant sind. Hier können Datenjournalisten einige Schätze heben.

Dies kann auch dadurch gelingen, die Daten unter einem neuen Aspekt auszuwerten. So analysierte das Schweizer Fernsehen (SRF) beispielsweise vor kurzem öffentlich zugängliche Flugradar-Daten, um zu zeigen, wie die Regierung Drohnen zur Grenzüberwachung einsetzt.

Ein interessantes Beispiel aus der Sportberichterstattung stammt ebenfalls aus der Schweiz. Der Tagesanzeiger wertete zahlreiche Daten des Fachinformationsdienstes transfermarkt.ch aus, um herauszufinden, wo Schweizer Fußballtalente landen, und welcher Fußballclub die erfolgreichste Jugendarbeit betreibt.

Mit Daten eines Forschungsinstituts, das auf den Immobilienmarkt spezialisiert ist, erstellte die Wochenzeitung Die Zeit erst im Juli eine viel beachtete Analyse zur Entwicklung der Mietpreise in Deutschland. Die Leser können sich dort die Entwicklung des Wohnungsmarktes aller Städte und Landkreise ansehen.

3. Informationsfreiheitsgesetze – Daten befreien

Nicht-öffentliche amtliche Informationen können Journalisten auf Bundesebene und auch in einigen Bundesländern durch Anfragen nach Informationsfreiheitsgesetzen erhalten. Diese Form der Datenrecherche ist sicherlich etwas aufwendiger, aber dafür erhalten Journalisten auf diesem Weg exklusive Daten. Die Website „Frag den Staat“ bietet Informationen zum Thema und veröffentlicht außerdem Daten, die von Bürgern „befreit“ wurden.

Ein Anwendungsbeispiel findet sich hier ebenfalls bei der Zeit. Die Zeitung forderte bei der Berliner Senatsverwaltung erfolgreich Einsicht in Akten zur Aufsicht über Kindertagesstätten. Dies mündete in einem Artikel mit der Überschrift „Hauptsache, die Eltern erfahren von nichts“, in dem das Versagen der Aufsichtsbehörden dokumentiert wird.

4. Crowdsourcing – die Macht der Community

Enorme Chancen für den Datenjournalismus bietet das Social Web. Journalisten können ihre Leser und Nutzer bei der Recherche relevanter Daten um Hilfe bitten. Die Potenziale liegen in diesem Bereich noch brach, aber es gibt bereits Ansätze.

Schon mehrfach hat beispielsweise das Rechercheprojekt Correctiv seine Community um Unterstützung gebeten. Das Portal richtete hierfür eigens einen sogenannten Crowdnewsroom ein. Das jüngste Projekt hat den Unterrichtsausfall an Dortmunder Schulen ins Visier genommen. Anlass für die Recherche war die große Diskrepanz zwischen den amtlichen Verlautbarungen hierzu und der Wahrnehmung der Schüler und Eltern. Über den Zeitraum von einem Monat sammelte Correctiv Angaben von Nutzern zum Unterrichtsausfall. Das Ergebnis: Offenbar fallen Dortmund doppelt so viele Schulstunden aus wie von der Verwaltung behauptet.

Ein etwas anders gelagertes Beispiel findet sich erneut bei Zeit-Online. Nutzer des Nachrichtenportals werden seit einiger Zeit auf der Startseite gefragt, wie es Ihnen geht. Was sich daraus im Zeitverlauf konkret ableiten lässt, muss sich erst noch erweisen. Aber die Ergebnisse sind für alle einsehbar und recht unterhaltsam aufbereitet.

5. Projektarbeit – Daten selbst generieren

Wenn die gewünschten Daten zur journalistischen Fragestellung nirgends verfügbar sind, können Journalisten sie auch selbst erheben. Natürlich bedarf es hierfür entsprechender Ressourcen, aber die Ergebnisse kann die Redaktion exklusiv präsentieren.

Wie das funktioniert, zeigt das Beispiel „Hanna und Ismail“. Datenjournalisten des Bayerischen Rundfunks und des Spiegel gingen der Frage nach, inwieweit Menschen mit Migrationshintergrund auf dem deutschen Wohnungsmarkt diskriminiert werden. Sie versendeten dafür selbst 20.000 Wohnungsanfragen. Das leider nicht überraschende Fazit: „Wer mit einem ausländischen Namen eine Wohnung sucht, hat es deutlich schwerer als ein deutscher Bewerber“.

6. Geleakte Daten – Informationen von Insidern

Edward Snowden lässt grüßen: Immer wieder kommt es vor, dass Menschen mit brisantem Datenmaterial direkt auf Journalisten zukommen. Dies betrifft natürlich in der Regel prominente Journalisten und renommierte Medienunternehmen. Viele von ihnen haben eigens anonyme digitale Briefkästen eingerichtet, etwa die Zeit oder der Tagesspiegel.

Ein noch immer aktuelles Beispiel sind die Panama Papers, über die weltweit berichtet wurde. Ein anonymer Whistleblower sendete 1,5 Millionen Dokumente zunächst an die Süddeutsche Zeitung. In der Folge wurde ein internationaler Skandal um Offshore-Firmen, Korruption und Steuerhinterziehung aufgedeckt.

Text: Alexander Laboda

Wie man Datenquellen findet, bewertet und nutzbar macht, ist auch ein Schwerpunktthema des Intensivseminars Datenjournalismus, das die Leipzig School of Media regelmäßig veranstaltet. Die Teilnehmer lernen an drei Tagen, wie man Daten aufbereitet, analysiert und visualisiert.