
De filosofie van FTM is simpel: als je het geldspoor volgt, vind je belangen, macht en misstanden. Omdat er steeds meer data en technieken zijn om die geldsporen te volgen, heeft FTM sinds kort een dataredactie. Dit gaan we de komende twee jaar doen.
Al ruim twee jaar vecht FTM’s Wob-specialist Bas van Beek met zeventien overheidsorganen om documenten over de banden tussen Shell en de Nederlandse overheid openbaar te krijgen. Inmiddels ook met enig resultaat: de gemeente Assen maakte ruim 2.500 documenten openbaar. Naar verwachting kunnen we over enkele maanden nog zo’n zestigduizend documenten toevoegen aan onze collectie.
Maar als die documenten binnen zijn, begint het werk pas echt. Hoe vinden we nog relevante informatie in zo’n hooiberg?
Of neem dat andere gruwelijk ambitieuze onderzoek, waarin een team van onderzoeksjournalisten de geldsporen binnen de Jeugdzorg probeert bloot te leggen. Maandenlang heeft het team gemeenten bestookt om informatie vrij te krijgen over betalingen aan jeugdzorgorganisaties; er zijn talloze jaarverslagen doorgespit. Het resultaat is een kolkende rivier van informatie die we moeten zien in te dammen. Hoe doen we dat?
En dan doen we ook nog een groot onderzoek naar Bouwput Nederland, over de enorme bouwopgave en welke belangen daar achter liggen. Daarvoor moeten we letterlijk in kaart brengen waar al die woningen mogelijk gaan komen. Dit is technisch gespecialiseerd werk. Hoe krijgen we dat voor elkaar?
Het antwoord op al die drie vragen: met een dataredactie. Sinds enkele maanden hebben we onze technische capaciteit gebundeld, uitgebreid en een team van vier man samengesteld dat zich volledig kan toeleggen op datajournalistiek.
Nu zijn we bij FTM nooit vies geweest van cijfertjes, dus waarom is zo’n team nog nodig? Wat gaat de dataredactie doen?
Als je het terugbrengt tot de essentie, zijn dat vier dingen: op grotere schaal werken, meer diversiteit in de bronnen aanbrengen, onderzoeken technisch professioneler uitvoeren, en de resultaten beter vertalen naar publicaties.

Excel is niet genoeg
Zo’n tien jaar geleden was je een hele grote jongen (m/v/anders) als je goed met Excel kon omgaan, want op de meeste redacties liepen daar niet zoveel van rond. Dat is nu gelukkig anders, maar ondertussen zijn de datasets ook zo groot geworden, dat er meer vaardigheden nodig zijn. Als datajournalist moet je inmiddels goed kunnen programmeren, extra rekenkracht weten in te zetten en met databases kunnen werken.
Voor een groot project analyseren we bijvoorbeeld meer dan een half miljoen wetenschappelijke publicaties. Het verkrijgen van die data en het opslaan, ontsluiten en uitvoeren van geavanceerde analyses vereist veel specialistische kennis.
Dat is waar de FTM dataredactie in moet voorzien. Uiteindelijk willen we toe naar een situatie waarin onze dataredactie een aantal grote internationale onderzoeken kan ondersteunen, maar ook snel kan bijspringen bij verhalen met strakke deadlines.
Auteur
Dimitri Tokmetzis
Wil je op de hoogte blijven van de ontwikkelingen bij FTM's datateam? Volg Dimitri, dan ontvang je automatisch zijn nieuwsbrief.
Meer dan cijfertjes
Voordat we die belofte waar kunnen maken, moeten we een goede digitale infrastructuur neerzetten en onze vaardigheden flink oppoetsen. Daar komt bij dat een groot deel van datajournalistiek helemaal niet over cijfers gaat, maar over het ontsluiten van digitale bronnen. Henk Willem Smits en Remy Koens publiceerden vorige week een mooi verhaal over belastingontwijking via Nederland door internationale artiesten. Als ze de klassieke journalistieke methode hadden gevolgd, waren ze achter de telefoon gekropen en hadden ze platenlabels en advocaten afgebeld in de hoop dat iemand een boekje open zou doen.
Hoewel dit soort klassiek journalistiek speurwerk altijd onmisbaar zal blijven, kun je ook op andere manieren aan informatie komen. Op Discogs, een veilingsite voor muziek, staat vaak vermeld wie de houder is van betreffende muziekrechten. Door die site te scrapen en de resultaten te combineren met bedrijfsinformatie, creëerden Smits en Koens een goed beeld van de markt. Ze hoefden niet via via te horen dat AC/DC via een Amsterdamse BV opereert: dat hadden ze zelf al uitgevogeld.

Het is maar om te zeggen: er is ongelooflijk veel informatie beschikbaar. Als je goed kunt zoeken, de vaardigheden hebt om de gevonden data te bewerken, én die weet te combineren met andere data, kun je je journalistieke onderzoeken enorm verrijken.
Nog een voorbeeld. Naar aanleiding van een pitch van een lezer werkt Follow the Money aan een verhaal over de ‘verroompottisering’ van Nederland: het idee dat de Nederlandse kust wordt verpatst aan vakantieparken. Om zo’n verhaal te maken, wil je weten waar in Nederland vakantieparken liggen, van wie ze zijn en wanneer ze zijn aangelegd. Via ‘normale’ journalistieke methoden is dat haast ondoenlijk, maar met de juiste tools en vaardigheden is zo’n overzicht in een paar dagen gemaakt.
En dan is er nog open source intelligence (OSINT). Sinds onderzoekscollectief Bellingcat met behulp van sociale media de herkomst wist te achterhalen van de Buk-raket die in 2014 vlucht MH17 boven Oekraïne neerhaalde, heeft dit vak stevig aan populariteit gewonnen.
OSINT is vaak gewoon journalistiek speurwerk, alleen dan met een technische twist. Je moet goed weten hoe je sociale media kunt doorzoeken, hoe het internet op technisch niveau werkt, en handig zijn met metadata. De dataredactie helpt FTM-redacteuren bij dit soort onderzoek. Heeft Sywert van Lienden zijn tweets gewist? Dan helpen wij die terug te vinden. Is er een vermoeden dat een aantal zorgcowboys en bestuurders elkaar wel heel goed kennen? Dan kunnen wij helpen hun sociale netwerk in kaart te brengen.
Orde en structuur
De komende tijd willen we ook inzetten op een wat minder sexy, maar niet minder belangrijk onderwerp: het aanbrengen van meer structuur, zowel in het verzamelen van data, als in de uitvoering van onderzoeken.
Zo zijn we begonnen met het bouwen van wat we een ‘vloot van scrapers’ noemen. Bij sommige websites – denk aan sanctielijsten of bepaalde gespecialiseerde vacaturesites – verdwijnt bepaalde informatie na verloop van tijd. Die data willen we op tijd onderscheppen en bewaren voor het geval ze niet meer beschikbaar zijn wanner wij die nodig hebben. We kijken daarbij ver vooruit: hoe langer je bepaalde data verzamelt, hoe interessanter die set kan worden.
Dit soort datasets willen we ook beter gaan ontsluiten voor onze eigen journalisten. We bekijken bijvoorbeeld momenteel hoe we de tool Aleph kunnen inzetten op de redactie. Aleph is ontwikkeld door het journalistencollectief OCCRP en stelt gebruikers in staat om allerlei datasets aan elkaar te knopen, zoals de Panama Papers, WikiLeaks, nationale bedrijvenregisters, subsidieverstrekkingen, aanbestedingen, noem maar op. Aleph is ontworpen om geldsporen te volgen en past dus helemaal in ons straatje. Zo’n tool, aangepast aan de Nederlandse situatie, zou ons journalistieke onderzoek enorm kunnen helpen.

Verantwoording en visualisaties
Tot slot willen we bij grote onderzoeken standaard een technische verantwoording gaan publiceren. Alle code die we schrijven, de methoden die we gebruiken, de keuzes die we tijdens het onderzoek hebben gemaakt, moeten beschikbaar zijn. We zullen lezers daarbij aansporen feedback te geven, maar ook om zelf aan de slag te gaan met de data en de code.
Op de iets langere termijn zullen jullie hopelijk ook meer van ons werk gaan zien in de vorm van visualisaties en betere kaarten. We willen die wat meer in eigen hand gaan nemen en werken aan nieuwe vertelvormen van verhalen, waarbij we tekst, geluid en beeld beter op elkaar kunnen afstemmen.
Verwacht geen visuele dataporno: alles wat we maken moet in de eerste plaats het verhaal ondersteunen, niet daarvan afleiden. We zullen alleen nog wel even wat geduld hiervoor moeten vragen, want de code waarop FTM draait, moet nog aangepast worden (we zoeken daarvoor nog een developer!).
Aan ambities geen gebrek en met deze plannen zijn we de komende twee jaar wel zoet. Wil je onze werkzaamheden volgen, schrijf je dan in voor onze tweewekelijkse nieuwsbrief. Het zal een nieuwsbrief worden met een hoog nerd-karakter, veel technologie, data, interessante onderzoeken en niet-alledaagse leestips.
30 Bijdragen
Bouke van Laethem
Dimitri Tokmetzis 1
Bouke van Laethemyolanda Buchel
Bouke van LaethemSucces!
Sjors Pals 1
Bouke van LaethemDimitri Tokmetzis 1
Sjors PalsPeter Tetteroo 2
Pieter de Haan
Dimitri Tokmetzis 1
Pieter de HaanPieter de Haan
Dimitri TokmetzisDumky de Wilde
Dimitri TokmetzisFlorian Oosterman
(Te snel gelezen)
Elmar Otter 6
Is deze data straks alleen voor FTM beschikbaar of worden het open databases die ook voor andere raadpleegbaar zijn?
Want ik kan me goed voorstellen dat de informatie die jullie gaan 'scrapen' ook waarde hebben voor anderen.
Dimitri Tokmetzis 1
Elmar OtterDaarnaast kunnen we zoiets ook gebruiken voor ons eigen geheugen. Nu verzamelen we per project heel veel data, maar blijft dat verder ongebruikt. Ik zie best een rol voor Aleph om die data te bewaren (ons eigen geheugen) en te delen met publiek.
Het aardige van Aleph is dat je kunt kiezen wat je openbaar zet. De OCCRP heeft bijvoorbeeld best wat gevoelige datasets die ze niet openbaar zet (om goede redenen), of alleen beschikbaar stelt aan journalisten waar ze mee samenwerken of die ze vertrouwen. Volgens mij kan zo'n model prima werken.
Elmar Otter 6
Dimitri TokmetzisCailin Kuit 1
Dimitri Tokmetzis 1
Cailin KuitOwen James
Ik moet bekennen dat het me verbaast dat het een nieuwe ontwikkeling is (in het algemeen, niet specifiek bij FTM). Ik zou zeggen, een goed initiatief en ik kijk uit naar alle data analyses!! Nu nog de inschrijving van de nieuwbrief vinden.
Dimitri Tokmetzis 1
Owen JamesDe journalistiek is vrij conservatief als het om nieuwe methoden gaat. Daarnaast zit er gewoon weinig geld in de journalistiek: dit soort dingen worden al snel als luxe gezien, zeker omdat het tijd nodig heeft voordat je de effecten gaat zien.
Maar ik moet ook zeggen dat ik de laatste jaren veel flashy dingen voorbij heb zien komen waarvan ik uiteindelijk dacht: mwoah. Leuk dat het kan, interessant, maar het levert niet direct een nieuw inzicht of journalistiek verhaal op. Ik denk dat AI bijvoorbeeld echt wel nuttig kan zijn in bepaalde situaties, maar het is altijd heel specifiek en uiteindelijk vrij beperkt wat je ermee kunt doen.
Hannah Heijmans
Dimitri Tokmetzis 1
Hannah HeijmansSicco van Sas 2
Walter Boer 3
Francois peters 2
Vincent Huijbers 9
Toch klinkt visuele dataporno (in contrast met de vooral technische uitleg en reacties eronder) wat denigerend voor wat beeld voor data kan doen. De artikelen van FTM leunen sterk op het naratief en de grafiek is vooralsnog ondersteunend (en misschien wel ondergeschikt daaraan).
Wat gaat volgen jullie verloren en wat valt er te winnen met goede visuele data storytelling? Data is voor mij (en denk voor vele) erg abstract. Wanneer jullie datagedreven verhalen gaan maken kan een visueel verhaal nieuwe inzichten bieden en jullie journalistiek misschien voor een brede publiek toegankelijk worden. Ik zie het als een toevoeging en niet ter vervanging van de uitstekende verhalen.
Edward Tufte laat op fenomenale manier zien wat visualisatie kan doen:
www.edwardtufte.com
Maar een initiatief als Gapminder richt zich vooral op de (onjuiste)perceptie die bij veel mensen leeft over grote onderwerpen (en getallen).
www.gapminder.org
Merwin Rook
Vincent HuijbersVincent Huijbers 9
Merwin Rookhttps://www.nytimes.com/interactive/2021/05/24/us/tulsa-race-massacre.html
http://rhythm-of-food.net/
https://news.sky.com/story/better-for-brexit-how-uk-has-changed-since-leave-vote-11920143
Merwin Rook
Erik Kemp
Het lijkt me nuttig om een beetje de wereld van datavisualisatie in te duiken. Ik ben jullie vacature daar al wel ergens tegen gekomen.
Visuele dataporno klinkt wat lachwekkend, maar het zou vooral lachwekkend zijn als je de ervaringen en vooruitgang van het vakgebied niet meeneemt ;-)
Ik denk dat alle stukken met getallen goed aangevuld kunnen worden met visualisaties. Voor lezers die geen domeinexpert zijn kan een simpele treemap al goed werken om een overzicht te krijgen van de cijfertjes, en bijvoorbeeld om het in perspectief met andere onderwerpen te plaatsen.
Je vroeg om concrete suggesties waar in te duiken, dus bij deze:
1) Evenement 16 september: https://www.pbl.nl/agenda/webinar-kennis-verbeeld-lessen-uit-25-jaar-datavisualisatie-voor-beleid
2) Evenement 23 november: https://op.europa.eu/en/web/eudataviz
3) Een recent opgerichte wereldwijde vereniging waar mensen uit het vakgebied kennis delen en elkaar helpen: https://www.datavisualizationsociety.org/
4) Schroom niet om bestaande visualisaties toe te voegen om lezers een completer beeld van een onderwerp te geven. Dit gebeurt in de journalistiek nog maar erg weinig naar mijn idee, maar alle grafieken van de non-profit Our World in Data hebben een CC-BY licentie en kun je zo embedden (https://ourworldindata.org/).
Verder vind ik het erg mooi dat jullie de code gaan publiceren!
Niek Jansen 9
Illustratief is het voorbeeld van Bellingcat, dat een pro-westers en als zodanig ook gefinancierde inlichtingen organisatie is wat ook blijkt uit deze artikelen:
https://thegrayzone.com/?s=Bellingcat.
Bellingcat is nauw gelieerd aan de Britse inlichtingendienst MI6 en wordt ook gefinancierd door de Britse overheid en is dus niet zo’n gelukkig gekozen voorbeeld door Dimitri, die nu in dienst is vanFTM, dat zich voorstaat op onafhankelijkheid.
Daaraan verbind ik dan ook de opmerking dat ik hoop dat FTM in de toekomst eens meer gebruik gaat maken van andere internationale onderzoekplatforms die meer kritisch staan mbt westerse politiek, waarvan the Grayzone een voorbeeld is.
Misschien zal FTM dan ook een meer kritische informatiebron kunnen worden als het gaat om geopolitieke issues ipv kritiekloos de internationale mainstream media te volgen.
En als jullie zo gek zijn op data, tel dan eens op hoeveel dagen Julian Assange in de beruchte Londense Belmarsh gevangenis zit en wat de reden daarvan is en waarom jullie daar geen enkele interesse voor hebben of solidariteit mee kunnen opbrengen als collega onderzoekjournalisten.
En omzeil het onderwerp Israël niet, zoals de Correspondent zich ook altijd angstvallig van kritiek heeft onthouden.
Hoe interssant zou het toch zijn de geldstromen te volgen van en naar de misdadige Joodse apartheidsstaat Israël, nietwaar!
Wees niet bang enkele leden te verliezen vanwege het in Nederland overgevoelige onderwerp dat het racistische koloniserende Israël is.
Nelson Mandela vond de apartheid van Israël gewelddadiger en meer ingrijpend dan de Z.Afrikaanse apartheid waartegen we immers zo ferm oppositie boden via een handels- en politieke boycot itt onze uitgebreide handels en politieke betrekkingen met Israël ten koste van de verdreven, vervolgde , vermoorde enz. Palestijnen.
Jasper van Weerd 1