Big Data for Good

Die Digitalisierung des Alltags führt zu unermesslichen Datenmengen.

Big Data ist eines der großen Buzzwords dieser Zeit. Die mit der Digitalisierung des Alltags wachsende Datenmasse verspricht mehr Effizienz, völlig neue Erkenntnisse und sogar Voraussagen über die Zukunft. Die Daten stammen von uns allen. Wir erzeugen sie mit jedem Klick im Internet, mit jedem Einkauf, beim online- und mobile Banking, aber auch wenn wir das Navigationsgerät einschalten, mit dem Handy telefonieren, Videos hochladen, Fotos ansehen, facebook-Statusnachrichten schreiben, tweeten oder bloggen. Dazu kommen vermehrt Daten aus dem „Internet of things“, von den Sensoren an Frachtcontainern und Wetterstationen oder unserem Kühlschrank und Pulsmesser. Für den sozialen Sektor und das Gemeinwohl bergen Daten ein enormes Potential.

Die Wirtschaft schaut auf google, facebook und amazon, die auf Daten ihre Imperien aufgebaut haben. Viele Unternehmer fragen sich, wie sie ihre Datenbestände ebenso lukrativ ausschöpfen können. Studien kursieren, denen zufolge diejenigen Unternehmen, die Big Data Analysen einsetzen, einen Produktivitätsgewinn von 5 bis 6 Prozent erreichen können. Regierungen, die zweite Gruppe, die auf riesigen Datenmassen sitzt, sind unschlüssig, ob sie sie der Öffentlichkeit freigeben sollen (wie es die open data Bewegung fordert). Derweil fordern Bürger und Datenschützer, dass Daten dem Individuum gehören und besser geschützt werden müssen. Einen guten Überblick zu Big Data bietet diese Broschüre (Download) der Landesanstalt für Medien Nordrhein-Westfalen. Das entsprechende Video verdeutlicht das rasante Wachstum der Datenmenge.

Aber Big Data ist nicht nur für Unternehmen, Regierungen und Datenschützer ein wichtiges Thema: in ihm steckt auch ein enormes Potential für den sozialen Sektor, für das Gemeinwohl und sozialen Fortschritt. Schon kursieren Abkürzungen wie BD4D (Big Data for Development) und der entsprechende Twitter Hashtag ist etabliert.

Globales Frühwarnsystem

Schon heute helfen Daten dabei, Ereignisse schneller vorherzusagen. Beispielsweise nutzt Google Flu die Häufigkeit bestimmter Suchbegriffe, um daraus die Wahrscheinlichkeit von Grippeerkrankungen und deren Ausbreitung abzuleiten. Die Vorhersage ist genauso treffend wie die der US-amerikanischen Seuchenbehörde CDC – jedoch viel schneller. Social-Media-Analysen in den USA und Irland konnten drei Monate vor dem Ansteigen der offiziellen Arbeitslosenstatistik zeigen, dass viele Menschen um ihren Job fürchteten. Und Veränderungen in der Anzahl von Tweets aus Indonesien, die den Preis von Reis erwähnten, korrelierten eng mit realen Preiserhöhungen für das Grundnahrungsmittel, die sich aus offiziellen Statistiken wesentlich später ergaben.

Diese Vorhersagen zu Arbeitslosigkeit und Reispreisschwankungen sind dem Institut Global Pulse zu verdanken. Es wurde 2009 vom UN-Generalsekretariat gegründet, um die Auswirkungen von globalen Krisen nicht erst Monate später beschreiben, sondern vorhersagen zu können. Daten können quasi im Moment ihrer Entstehung ausgewertet werden, sodass noch genug Zeit zum Handeln bleibt. Kaufen Menschen in einer Region plötzlich weniger Handy-Gesprächsguthaben oder greifen auf ihr Erspartes zurück und verzeichnen Wettersensoren kaum Niederschlag, so sind das Indikatoren einer bevorstehenden Krise.

Richard Kirkpatrick, Leiter von Global Pulse, sagt: "Die Analyse von Mustern in Big Data kann die Art und Weise revolutionieren, wie wir auf globale Krisen wie ökonomische Schocks, Seuchen oder Naturkatastrophen reagieren. Wir formulieren und testen Hypothesen und entwickeln Methoden, mit denen wir Echtzeitdaten ernten und ein Echtzeitverständnis von menschlichem Wohlbefinden bekommen können."

Datenanalysen können außerdem vergleichsweise kostengünstig sein. So sammelt die Weltbank regelmäßig makroökonomische Daten, zum Beispiel zur Kaufkraft von Volkswirtschaften (unser Insight dazu). Diese Warenkorbanalyse kostet über siebzig Millionen US-Dollar. Eine kostengünstigere Alternative bietet das Big-Data-Unternehmen Jana: Um herauszufinden, wie viel ein Warenkorb in Kenia oder Argentinien kostet, werden Konsumenten per SMS nach den Preisen auf lokalen Märkten und Geschäften befragt (und bekommen als Belohnung Gesprächsguthaben).

Wertvolle Hinweise zu Epidemien und Katastrophen

Einige der wichtigsten zeitgenössischen Big Data Analysen stammen aus dem Gesundheitsbereich. Mittels Analyse der Mobiltelefone von 15 Millionen Kenianern konnte eine Studie die Verbreitung von Malaria dokumentieren und damit genaure Präventionsprogramme und Behandlungshinweise entwickeln. Ebenso gelang es Wissenschaftlern die Daten von zwei Millionen SIM-Karten in Haiti nach dem Erdbeben 2010 auszuwerten und damit die Bewegungsmuster von über 600.000 heimatlosen Bewohnern von Port-au-Prince zu verfolgen. Als später im Jahr die Cholera ausbrach konnte das gleiche Team die Migrationsbewegungen nachvollziehen und vorhersagen, wo neue Ausbrüche der Krankheit zu erwarten waren.

Auch im Katastrophenfall zeigt sich, wie Big Data helfen kann. Die US-Behörde FEMA schickte während der Wirbelsturmsaison 2011 viel schneller als sonst Rettungsteams in Regionen, aus denen sie Social Media Warnungen erhielten. Die Teams hatten einen Vorsprung von zwölf bis 24 Stunden, im Vergleich zu früher, als FEMA noch auf verifizierte Lageberichte gewartet hatte – ein Zeitgewinn, der lebensrettend sein kann.

Die vielen Anwendungen von Ushahidi (unser Insight zu der Open-Source-Software) sind ein weiteres Beispiel dafür, wie im Katastrophen- und Krisenfall Daten aus den unterschiedlichsten Quellen kombiniert werden und Hilfsorganisationen, Aktivisten und Regierungsinstitutionen helfen, die Lage einzuschätzen und Maßnahmen in die Wege zu leiten.

Im Fall von Hurricane Sandy wurden über 20 Millionen Tweets versandt. Laut einer Studie des Pew Institutes beinhalteten 34 Prozent von ihnen nützliche Informationen und 25 Prozent Photos und Videos. Diese manuell auszuwerten ist unpraktikabel und so arbeitet Patrick Meier von Ushahidi momentan an einem twitter-Dashboard, in dem die riesige Datenmassen aus Tweets gepoolt und analysiert werden können.

Vision: EZ und NGOs legen ihr gesammeltes Wissen über sozialen Fortschritt offen.

In vielen Bereichen ist das Potential von Big Data im sozialen Sektor sogar größer als in der Wirtschaft. Denn während viele Unternehmen schon lange zahlen- und datengetrieben arbeiten, mangelt es im sozialen Sektor in den meisten Fällen selbst an grundlegenden Daten. NGOs, Stiftungen und Geldgeber bemühen sich, Gutes zu tun. Dabei sind viele aber so intransparent, dass sie nicht voneinander lernen können. Sie stochern mit ihrer eigenen Arbeit im Dunkeln, und besonders kleinere, aber auch größere Organisationen verstehen nicht einmal ihre eigenen Zahlen. Es mangelt auch an einer gemeinsamen Informationsinfrastruktur, über die man sich abstimmen könnte – wenn man denn wollte. (Die Angst vor Wettbewerbsnachteilen im Kampf um Spenden ist groß.)

Unter den eloquentesten Fürsprecher eines datengetriebenen sozialen Sektors sind die Initiative Markets for Good, ebenso wie die amerikanische Philanthropieberaterin Lucy Bernholz. In ihrer Vision legen Stiftungen, NGOs und internationale Organisationen der Entwicklungszusammenarbeit nicht nur ihre Geldströme, sondern ihr gesamtes Wissen über sozialen Fortschritt offen und tragen aktiv zu einer transparenten Informationslandschaft bei. Besonders in den USA haben große Organisationen wie die Weltbank (zum Beispiel als App), aber auch Stiftungen erste Schritte getan, um mehr Transparenz für aggregierte Daten zu erzeugen. Die Hewlett-Stiftung hat gerade ihre gesamte Förderhistorie in einer visuell ansprechenden Grants-Tool veröffentlicht, und Ende 2012 schlossen sich fünfzehn große Stiftungen zum sogenannten Reporting Commitment zusammen: In Zukunft werden sie ihre Ausgaben und Projekte in einem standardisierten Format öffentlich zugänglich machen. (Wie wichtig eine solche Standardisierung ist, zeigt die Tatsache, dass momentan allein 82 verschiedene Definitionen für "allgemeine Verwaltungskosten" verwendet werden.)

Auch andere Initiativen wie die International Aid Transparency Initiative (IATI) oder Washfunders werben bei internationalen Entwicklungsorganisationen und NGOs darum, dass sie ihre Daten öffentlich zur Verfügung stellen. Denn nur so können Projekte gut koordiniert werden, Partner gefunden und Missbrauch und Korruption aufgedeckt werden. Um nur zwei Erfolgsbeispiele für die Eindämmung von Missbrauch durch Big Data zu nennen: Im Zuge der Subsidios al Campo-Kampagne in Mexiko wurden erstmalig eine Fülle von Datensätzen zu landwirtschaftlichen Subventionen auf einer Karte öffentlich zugänglich gemacht. Dabei kam heraus, dass einige hohe Regierungsbeamte und große Agrar-Konzerne unberechtigter Weise große Zahlungen erhalten hatten. Ebenso deckte eine Datenanalyse das systemische Versagen des Arzneihandels im südlichen Afrika auf: Im Rahmen des Tendai Projekts wurde deutlich, dass in den verschiedenen Ländern die gleichen Medikamente zu völlig unterschiedlichen Preisen vertrieben werden und oft nicht verfügbar waren. Die Analysen werden jetzt genutzt, um politische Reformen für eine effektivere Gesundheitspolitik zu nutzen.

Bessere NGO-Arbeit durch gezielte Datenanalysen

Eine Big-Data untermauerte Philanthropie kann NGOs helfen, wirksame Hebel für ihre Arbeit zu identifizieren und passgenauere Programme zu entwerfen. So analysiert DoSomething.org, eine Organisation die Jugendliche ermächtigt sich sozial zu engagieren, kontinuierlich die eigene Performance und optimiert sie anhand der digitalen Datenlage. Die Auswertung der Datennutzung von 300.000 mobilen Abonnenten zeigte, dass in ihrer Zielgruppe SMS 30 mal effektiver waren, Teilnehmer für Aktionen zu mobilisieren, als E-Mails (unsere Zusammenfassung).

Große Datenmengen dienen Organisationen aber auch dazu, die Lebensumstände ihrer Zielgruppen besser zu verstehen und Muster und Zusammenhänge sozialer Probleme zu erkennen. Das Justice Mapping Center in New York aggregierte die Adressen aller amerikanischen Gefängnisinsassen. Die Karten zeigen sogenannte Million-Dollar-Blocks, Straßenzüge, aus denen so viele Gefangene kommen, dass ihre Gefangenschaft über eine Million US-Dollar jährlich kostet. Dank der Datenanalyse kann in den betroffenen Wohngebieten gezielter in Jugendzentren, Drogenbetreuung oder Nachbarschaftshilfen investiert werden.

In Washington kooperiert DC Action for Children mit DataKind, einer Organisation, die sozialen Einrichtungen bei der Datenanalyse hilft. DC Action for Kids brachte Daten in Form von offiziellen Statistiken und eigenen Erhebungen mit, die sie selbst nicht analysieren konnten. Gemeinsam mit dem DataKind Team gelang es, interaktive Landkarten zu erstellen, auf denen erstmals die Lebensbedingungen in verschiedenen Stadtvierteln entlang verschiedener Dimensionen sichtbar wurden.

Auf dem Datenportal Metro Boston Data Common werden Daten für die Allgemeinheit aufbereitet und visualisiert, um die Lebensbedingungen in der Region transparent zu machen und sie zu verstehen. Stadtplaner, Journalisten oder Bürger können so fundierte Entscheidungen treffen. In eine ähnliche Richtung weist die Sitegeist App der Sunlight Foundation. Basierend auf öffentlich verfügbaren Daten können Nutzer graphisch ansprechende Informationen zu ihren Standort, Stadtviertel oder Straßenzug einsehen. Momentan erschließen sich über die App Daten wie Alter der lokalen Bevölkerung, Höhe der Spenden an politische Parteien und Durchschnittsmieten, aber auch welche Restaurants empfohlen werden und wie lange Menschen zu ihrem Arbeitsplatz fahren. Denkt man diese Beispiele weiter, so könnten wir zukünftig die Lebensqualität in verschiedenen Regionen in Echtzeit (Trend Echtzeit) abbilden. Luftqualität könnte mit der Häufigkeit von Krankheiten und Arbeitslosigkeit korreliert werden (was die Frage nach Kausalität zunächst offen lässt). Man könnte mit einer solch neuen, vernetzten Sicht auch den Erfolg oder Misserfolg sozialer Programme und Reformen genauer und schneller messen, als es mit den übliche Ex-Post-Evaluationen möglich ist.

Wer engagiert sich wann, wie, wieso?

Big Data Analysen ermöglichen auch Erkenntnisse über Spenderverhalten, die genutzt werden können, um Mobilisierungsmaßnahmen effektiver zu gestalten. Bislang wissen wir wenig darüber, was Menschen motiviert, sich für ein bestimmtes Thema zu engagieren und eine bestimmte Organisation zu unterstützen. Welchen Einfluss haben Freunde und Bekannte, Prominente und andere Fürsprecher und Multiplikatoren? Wie entwickeln sich Spenderbiographien? Wird aus dem Einmalspender im Katastrophenfall mit der Zeit ein kritischer Spender, der nicht mehr nur einem emotionalen Fernsehappell folgt, sondern strategisch in sozialen Wandel investiert? Wie ist das Verhältnis zwischen ehrenamtlicher Mitarbeit und Geldspenden? Über Daten können wir herausfinden wer wo und wie oft ehrenamtlich arbeitet und eine Engagementlandkarte erstellen, in der Über- und Unterversorgung erkennbar ist. Indem wir sozial engagierte Menschen besser verstehen, können wir auch bessere Ansprachen entwickeln und sie stärker als bisher motivieren, zum Gemeinwohl beizutragen. Bislang ist dies erst ein Zukunftsszenario, Analysen wie die von Kickstarter und Indiegogo zur Nutzung ihrer Plattformen weisen aber in eine vielversprechende Richtung.

Ebenso können Analysen und Visualisierungen von großen Datenmengen eindrucksvoll die Mobilisierungsstrategien und -erfolge von NGOs demonstrieren. So offenbarte die Social Media Analyse des Kony-2012-Phänomens durch den Visualisierungsdienst Social Flow, über welche Netzwerke sich das extrem virale Video (s. unseren Blogpost dazu) weltweit verbreitet hatte (in den ersten 2 Wochen hatten 80 Mio. Menschen das fast halbstündige Video auf Youtube gesehen).

Fazit

Daten haben für gute Taten ein großes Potential. Doch noch ist der Trend nicht ausgereift und zahlreiche Hürden sind zu beachten. Eine Herausforderung wird sein, die Daten zu verstehen. Die Berater von McKinsey schätzen, dass allein in den USA 140.000 bis 190.000 Menschen mit datenanalytischer Expertise auf dem Arbeitsmarkt fehlen – sowie 1,5 Millionen Manager, die aufgrund von Datenanalysen Entscheidungen treffen können.

Weil es an Datenkompetenz mangelt, werden immer mehr Hackathons veranstaltet, auf denen Datenbesitzer mit Datenauswertern zusammenkommen. So organisiert die NGO Code for America die Begegnung zwischen Stadtverwaltungen und Programmierern, damit diese gemeinsam überlegen, welche digitalen Werkzeuge dem öffentlichen Sektor helfen, urbane Herausforderungen zu meistern. Für solche Datenanalysen müssen Geldgeber zukünftig auch Fördergelder bereitstellen, denn NGOs alleine sind damit überfordert und können auch Mehrkosten nicht tragen.