© Núria Madrid

Follow the Money investeert in datajournalistiek. Dit is waarom

De filosofie van FTM is simpel: als je het geldspoor volgt, vind je belangen, macht en misstanden. Omdat er steeds meer data en technieken zijn om die geldsporen te volgen, heeft FTM sinds kort een dataredactie. Dit gaan we de komende twee jaar doen.

Al ruim twee jaar vecht FTM’s Wob-specialist Bas van Beek met zeventien overheidsorganen om documenten over de banden tussen Shell en de Nederlandse overheid openbaar te krijgen. Inmiddels ook met enig resultaat: de gemeente Assen maakte ruim 2.500 documenten openbaar. Naar verwachting kunnen we over enkele maanden nog zo’n zestigduizend documenten toevoegen aan onze collectie.

Maar als die documenten binnen zijn, begint het werk pas echt. Hoe vinden we nog relevante informatie in zo’n hooiberg? 

Of neem dat andere gruwelijk ambitieuze onderzoek, waarin een team van onderzoeksjournalisten de geldsporen binnen de Jeugdzorg probeert bloot te leggen. Maandenlang heeft het team gemeenten bestookt om informatie vrij te krijgen over betalingen aan jeugdzorgorganisaties; er zijn talloze jaarverslagen doorgespit. Het resultaat is een kolkende rivier van informatie die we moeten zien in te dammen. Hoe doen we dat?

En dan doen we ook nog een groot onderzoek naar Bouwput Nederland, over de enorme bouwopgave en welke belangen daar achter liggen. Daarvoor moeten we letterlijk in kaart brengen waar al die woningen mogelijk gaan komen. Dit is technisch gespecialiseerd werk. Hoe krijgen we dat voor elkaar?

Het antwoord op al die drie vragen: met een dataredactie. Sinds enkele maanden hebben we onze technische capaciteit gebundeld, uitgebreid en een team van vier man samengesteld dat zich volledig kan toeleggen op datajournalistiek.

Nu zijn we bij FTM nooit vies geweest van cijfertjes, dus waarom is zo’n team nog nodig? Wat gaat de dataredactie doen?

Als je het terugbrengt tot de essentie, zijn dat vier dingen: op grotere schaal werken, meer diversiteit in de bronnen aanbrengen, onderzoeken technisch professioneler uitvoeren, en de resultaten beter vertalen naar publicaties.

Excel is niet genoeg

Zo’n tien jaar geleden was je een hele grote jongen (m/v/anders) als je goed met Excel kon omgaan, want op de meeste redacties liepen daar niet zoveel van rond. Dat is nu gelukkig anders, maar ondertussen zijn de datasets ook zo groot geworden, dat er meer vaardigheden nodig zijn. Als datajournalist moet je inmiddels goed kunnen programmeren, extra rekenkracht weten in te zetten en met databases kunnen werken.

Voor een groot project analyseren we bijvoorbeeld meer dan een half miljoen wetenschappelijke publicaties. Het verkrijgen van die data en het opslaan, ontsluiten en uitvoeren van geavanceerde analyses vereist veel specialistische kennis.

Dat is waar de FTM dataredactie in moet voorzien. Uiteindelijk willen we toe naar een situatie waarin onze dataredactie een aantal grote internationale onderzoeken kan ondersteunen, maar ook snel kan bijspringen bij verhalen met strakke deadlines.

Auteur

Dimitri Tokmetzis

Wil je op de hoogte blijven van de ontwikkelingen bij FTM's datateam? Volg Dimitri, dan ontvang je automatisch zijn nieuwsbrief.

Volg deze auteur

Meer dan cijfertjes

Voordat we die belofte waar kunnen maken, moeten we een goede digitale infrastructuur neerzetten en onze vaardigheden flink oppoetsen. Daar komt bij dat een groot deel van datajournalistiek helemaal niet over cijfers gaat, maar over het ontsluiten van digitale bronnen. Henk Willem Smits en Remy Koens publiceerden vorige week een mooi verhaal over belastingontwijking via Nederland door internationale artiesten. Als ze de klassieke journalistieke methode hadden gevolgd, waren ze achter de telefoon gekropen en hadden ze platenlabels en advocaten afgebeld in de hoop dat iemand een boekje open zou doen.

Hoewel dit soort klassiek journalistiek speurwerk altijd onmisbaar zal blijven, kun je ook op andere manieren aan informatie komen. Op Discogs, een veilingsite voor muziek, staat vaak vermeld wie de houder is van betreffende muziekrechten. Door die site te scrapen en de resultaten te combineren met bedrijfsinformatie, creëerden Smits en Koens een goed beeld van de markt. Ze hoefden niet via via te horen dat AC/DC via een Amsterdamse BV opereert: dat hadden ze zelf al uitgevogeld.

Het is maar om te zeggen: er is ongelooflijk veel informatie beschikbaar. Als je goed kunt zoeken, de vaardigheden hebt om de gevonden data te bewerken, én die weet te combineren met andere data, kun je je journalistieke onderzoeken enorm verrijken.

Nog een voorbeeld. Naar aanleiding van een pitch van een lezer werkt Follow the Money aan een verhaal over de ‘verroompottisering’ van Nederland: het idee dat de Nederlandse kust wordt verpatst aan vakantieparken. Om zo’n verhaal te maken, wil je weten waar in Nederland vakantieparken liggen, van wie ze zijn en wanneer ze zijn aangelegd. Via ‘normale’ journalistieke methoden is dat haast ondoenlijk, maar met de juiste tools en vaardigheden is zo’n overzicht in een paar dagen gemaakt.

En dan is er nog open source intelligence (OSINT). Sinds onderzoekscollectief Bellingcat met behulp van sociale media de herkomst wist te achterhalen van de Buk-raket die in 2014 vlucht MH17 boven Oekraïne neerhaalde, heeft dit vak stevig aan populariteit gewonnen.

OSINT is vaak gewoon journalistiek speurwerk, alleen dan met een technische twist. Je moet goed weten hoe je sociale media kunt doorzoeken, hoe het internet op technisch niveau werkt, en handig zijn met metadata. De dataredactie helpt FTM-redacteuren bij dit soort onderzoek. Heeft Sywert van Lienden zijn tweets gewist? Dan helpen wij die terug te vinden. Is er een vermoeden dat een aantal zorgcowboys en bestuurders elkaar wel heel goed kennen? Dan kunnen wij helpen hun sociale netwerk in kaart te brengen.

Orde en structuur

De komende tijd willen we ook inzetten op een wat minder sexy, maar niet minder belangrijk onderwerp: het aanbrengen van meer structuur, zowel in het verzamelen van data, als in de uitvoering van onderzoeken.

Zo zijn we begonnen met het bouwen van wat we een ‘vloot van scrapers’ noemen. Bij sommige websites – denk aan sanctielijsten of bepaalde gespecialiseerde vacaturesites – verdwijnt bepaalde informatie na verloop van tijd. Die data willen we op tijd onderscheppen en bewaren voor het geval ze niet meer beschikbaar zijn wanner wij die nodig hebben. We kijken daarbij ver vooruit: hoe langer je bepaalde data verzamelt, hoe interessanter die set kan worden. 

Dit soort datasets willen we ook beter gaan ontsluiten voor onze eigen journalisten. We bekijken bijvoorbeeld momenteel hoe we de tool Aleph kunnen inzetten op de redactie. Aleph is ontwikkeld door het journalistencollectief OCCRP en stelt gebruikers in staat om allerlei datasets aan elkaar te knopen, zoals de Panama Papers, WikiLeaks, nationale bedrijvenregisters, subsidieverstrekkingen, aanbestedingen, noem maar op. Aleph is ontworpen om geldsporen te volgen en past dus helemaal in ons straatje. Zo’n tool, aangepast aan de Nederlandse situatie, zou ons journalistieke onderzoek enorm kunnen helpen.

Verantwoording en visualisaties

Tot slot willen we bij grote onderzoeken standaard een technische verantwoording gaan publiceren. Alle code die we schrijven, de methoden die we gebruiken, de keuzes die we tijdens het onderzoek hebben gemaakt, moeten beschikbaar zijn. We zullen lezers daarbij aansporen feedback te geven, maar ook om zelf aan de slag te gaan met de data en de code. 

Op de iets langere termijn zullen jullie hopelijk ook meer van ons werk gaan zien in de vorm van visualisaties en betere kaarten. We willen die wat meer in eigen hand gaan nemen en werken aan nieuwe vertelvormen van verhalen, waarbij we tekst, geluid en beeld beter op elkaar kunnen afstemmen.

Verwacht geen visuele dataporno: alles wat we maken moet in de eerste plaats het verhaal ondersteunen, niet daarvan afleiden. We zullen alleen nog wel even wat geduld hiervoor moeten vragen, want de code waarop FTM draait, moet nog aangepast worden (we zoeken daarvoor nog een developer!). 

Aan ambities geen gebrek en met deze plannen zijn we de komende twee jaar wel zoet. Wil je onze werkzaamheden volgen, schrijf je dan in voor onze tweewekelijkse nieuwsbrief. Het zal een nieuwsbrief worden met een hoog nerd-karakter, veel technologie, data, interessante onderzoeken en niet-alledaagse leestips.