Toen Lucia de Berk veroordeeld werd, was hij voorzitter van de Nederlandse Vereniging Voor Statistiek. Iemand veroordelen op statistisch bewijs, is in zichzelf al pure onzin, vond Gerrit Timmer toen. En met hem overigens de andere hoogleraren statistiek in Nederland. Maar als het over algoritmes en kunstmatige intelligentie gaat, dan wint sensatie het vaak van de werkelijkheid. Zelf is Gerrit Timmer een van de grootste algoritme-experts van ons land, maar daar hoor je hem eigenlijk zelden over. Als nuchtere bèta vindt hij publieke discussies over kunstmatige intelligentie vaak oververhit. Algoritmes iets van de laatste jaren? Welnee joh, die gebruiken we al decennia lang. Daar kunnen we ook helemaal niet zonder. En we zijn er als Nederland trouwens ook wereldleidend in.
“Laatst weer zo’n kop in de krant: ‘X procent van de Nederlandse gemeentes zou inmiddels gebruikmaken van algoritmes.’ Nou, dat is dus echt onzin, want dat percentage is al heel lang 100%,” zegt Gerrit Timmer. “Elke computer gebruikt algoritmes, er is nog geen stoplicht dat kan werken zonder. Elk béétje geavanceerd apparaat, daar zitten rekenregeltjes in. Er wordt een hoop gezwetst over kunstmatige intelligentie en algoritmes.”
“Het aantal mensen dat voldoende begrip van AI heeft, is in het bedrijfsleven gewoon veel te laag. En bij het hogere management van bedrijven en instellingen al helemáál.”
“Je hoort de overheid trouwens ook wel eens roepen dat algoritmes gecontroleerd zouden moeten worden. Nog los van of dat zinnig is of niet: er zijn er miljoenen van! Dat gaat hélemaal nergens over. Dat is alsof je zegt: we moeten toch maar eens bij gaan houden hoe vaak elk mens op een dag z’n voorhoofd aanraakt. Totaal ondenkbaar.”
Gerrit Timmer promoveerde in de econometrie bij Alexander Rinnooy Kan – “Nou, die kon ongeveer alles beter dan ik” – en werd daarna een van de oprichters van ORTEC, een van de grootste leveranciers van wiskundige optimalisatiesoftware en advanced analytics wereldwijd. Hij was daarnaast gedurende meer dan 25 jaar professor Business Econometrics aan de Vrije Universiteit van Amsterdam en is lid van de Nederlandse AI-Coalitie.
Wat is artificial intelligence eigenlijk?
“Ken je die film, The Imitation Game? Daarin volg je Alan Turing, de bedenker van het concept ‘computer’. Tot die tijd werden machines alleen gemaakt voor een specifiek doel: je maakt een schop, omdat je wilt scheppen. Turing bedacht toen: kunnen we niet een apparaatje maken dat je verschillende dingen kunt laten doen. Met het programmaatje dat je erin stopt, gaat het dan iets anders doen. En dat noem je dan programmeren. Kunstmatige intelligentie is eigenlijk niets anders dan het gebruiken van de rekenkracht van een computer om problemen op te lossen.”
En wat is een algoritme?
“Niets meer dan een rekenregeltje. Zo’n computer kun je niet één, maar vele simpele, analytische formules laten doen. Eigenlijk is het veredeld proberen. Je maakt een rekenschema en als die computer dat maar volgt, dan leidt dat uiteindelijk tot het antwoord.”
“Bol.com en Ahold zouden waarschijnlijk béter zijn dan Amazon. Amazon wint het puur op datamacht.”
Bij ORTEC werken jullie met algoritmes. Zit er dan een aantal slimme jongens en meisjes op een rij rekenschema’s te maken?
Nee, de wetenschap heeft al een groot aantal standaardalgoritmes bedacht. De Nederlandse wiskundige Dijkstra bedacht een oplossing voor het kortste-padprobleem. Stel, je wilt de kortste route van Amsterdam naar Eindhoven, via Utrecht. Dijkstra redeneerde: een eigenschap van de optimale route moet zijn dat je via de optimale route van Amsterdam naar Utrecht bent gegaan en via de optimale route van Utrecht naar Eindhoven. Daarmee deelde hij het probleem op in veel kleinere probleempjes. Dit algoritme kijkt dus eerst wat de snelste route is vanaf je huis in Amsterdam naar het eerste kruispunt bij je huis. En daarna hoe je vanaf dat kruispunt het snelst naar de volgende kruispunten komt. Op een gegeven moment kun je dan van elk punt in Nederland de kortste route naar elk ander punt in Nederland berekenen.”
Hoe lang is die formule van het kortste-padprobleem wel niet?
“Het is geen formule, je kunt het in slechts twintig regels omschrijven. Je maakt er alleen loops in: je gaat van stap 4 bijvoorbeeld steeds terug naar stap 2. Dan reken je het opnieuw uit, op net andere data. Je blijft rondjes draaien in diezelfde twintig regels. Die herhalingen noemen we iteraties en die zijn dus niet overbodig.”
“Voor een van de eerste projecten van ORTEC bedachten we een algoritme voor de routeplanning van Schuitema, de voorganger van Jumbo. De IT-afdeling van Schuitema zou ons algoritme gaan programmeren. Maar ze zeiden: wat een domme berekeningen, er gebeurt steeds hetzelfde, dat kan niet goed zijn. Dus ze hadden de berekening naar eigen zeggen ‘verbeterd’: alles wat dubbel was, hadden ze geschrapt. Maar dan krijg je natuurlijk helemaal het antwoord niet meer.” Timmer lacht smakelijk. “Toen realiseerden we ons: dat programmeren moeten we ook zelf gaan doen. We kunnen het ons niet permitteren om het alleen te bedenken, we moeten het ook in software gieten.”
AI Hub Zuid-Holland
- 26% van de Nederlandse AI-startups en -scale-ups zit in Zuid-Holland
- 1000 wetenschappers met een AI-specialisatie is actief in Zuid-Holland
- 7500 BSc en MSc studenten studeren er jaarlijks af in Zuid-Holland
- 32% van de werknemers bij Nederlandse AI-bedrijven in Life Sciences werkt in Zuid-Holland
Men is geneigd te denken dat elk antwoord dat uit een algoritme rolt, waarheid is. Maar mensen hebben van tevoren allerlei variabelen en doelen aan zo’n algoritme gehangen. Daarmee bepaal jij als wiskundige dus eigenlijk door welke bril ik de wereld zie.
“In de regel wordt die kleuring niet in een algoritme gestopt. Niet bewust in ieder geval. Misschien dat je onbewust tussen mannen en vrouwen discrimineert, door de voorselectie die je maakt.”
Mooi voorbeeld vind ik profilering bij criminaliteit: je kunt je vanuit de politieorganisatie voorstellen dat ze vanwege ondercapaciteit willen weten waar statistisch gezien de meeste criminaliteit gaat plaatsvinden. In je algoritme selecteer je dan misschien op wijk, op geslacht, op etniciteit. En dan kom je uiteindelijk tot een profilering die ethisch niet meer te verantwoorden is. Als wiskundigen hebben jullie dan gewoon een probleem voor een opdrachtgever opgelost, maar er komt onbedoeld een ethisch onverantwoorde oplossing uit. Zijn jullie je bewust van de onbedoeld ongewenste effecten die jullie algoritmen kunnen veroorzaken?
“Het gevaar zit hem wat mij betreft eerder in onkunde dan in ethiek. Ik heb zelf rechten gestudeerd, daar kwam toen net het vak jurimetrie op, statistiek dus. En wat ze daar deden klopte wiskundig gezien gewoon van geen kant. Die juristen begrepen er te weinig van. Dat leidde tot de voorbeelden waar jij hebt nu over hebt. Ze gingen in een groot databestand in het wilde weg verbanden zitten zoeken. Iedere statisticus begrijpt dat dat geen goede methode is. Als je miljárden data met elkaar gaat vergelijken, natuurlijk vind je dan verbanden. Random zoeken mag gewoon niet.”
Maar hoe werken jullie dan anders?
“Je moet eerst een hypothese hebben, anders kun je niet toetsen. We kunnen wel duizend kledingstukken onderscheiden tegenwoordig. Ook als er géén relatie is tussen kleding en criminaliteit zal er toch één type kledingstuk zijn, wellicht gestreepte truitjes, waarvoor het verband met criminaliteit het hoogste is. Dat zegt dus hélemaal niks. Het is wat anders als je van te voren al reden had om gestreepte truitjes te verdenken. Dan kun je statistiek gebruiken om die hypothese te toetsen. Dan heb je het ‘toeval’ dat je naar het antwoord toe redeneert, uitgeschakeld.”
“Random zoeken is de ene fout die gemaakt wordt uit onkunde. De andere fout is veronderstellen dat je met statistiek zaken kunt bewijzen. Ten tijde van Lucia de Berk was ik voorzitter van de Nederlandse Vereniging Voor Statistiek. Lucia de Berk werd op statistisch bewijs veroordeeld. Dat is in zichzelf al onzin. De kans dat het toeval was geweest, zou in haar geval zogenaamd heel klein zijn. Nou, ga maar eens naar een casino en schrijf op welke 30 nummers er achter elkaar zijn gevallen bij de roulettetafel. De kans dat precies die 30 nummer achter elkaar vallen, is nagenoeg nul. Maar dat is toch geen bewijs dat het niet gebeurd is? Het is namelijk wél gebeurd. Alles wat zich nu buiten voor ons raam afspeelt, heeft een heel kleine kans om te gebeuren. Dus op die kansen afgaan is een benadering van drie keer niks.”
Hoe ga je die fouten tegen?
“Er moet transparantie komen over de afwegingen, zeker bij publieke instellingen. Of de overheid jou wel of niet een vergunning geeft, moet je bepalen aan de hand van een set heldere regels, niet aan de hand van een algoritme. De regel mag wel door een algoritme uitgevoerd worden, maar de overheid moet jou duidelijk na kunnen vertellen op basis waarvan jij wel of geen uitkering krijgt. En dat mag niet zijn: de computer zei dat we jou beter geen vergunning konden geven, want uit historische data blijkt dat…enzovoorts. Dat kan niet.”
Wat heeft AI in Nederland nu nodig?
“Op wetenschappelijk gebied zijn we koploper in AI en statistiek. Econometrie is zelfs in Nederland ontstaan. Er moet uiteraard geld naar wetenschappelijk onderzoek, zodat we koploper blijven. De bottleneck is echter niet dat we nog extra wetenschappelijke doorbraken nodig hebben. De bottleneck is dat bestaande methoden en technieken hun weg naar de markt beter moeten vinden. Daarvoor moeten voldoende mensen iets van die methoden begrijpen. Het aantal mensen dat voldoende begrip van AI heeft, is bij het bedrijfsleven gewoon veel te laag. En bij het hogere management van bedrijven en instellingen al helemáál. Daar hebben ze weinig begrip van wat er allemaal kan.”
Zouden elk managementteam in Nederland een cursus AI moeten krijgen?
“Daar willen we vanuit ORTEC inderdaad mee beginnen. Samen met de UvA geven we via “The Analytics Academy” al een range aan cursussen gericht op het bedrijfsleven. In de zorg is de kennis vaak echt onder de maat en ontwikkelen we nu een cursus gericht op Raden van Toezicht. In een ééndaagse cursus laten we zien hoe de wereld er vandaag eigenlijk uitziet. En wat dat bijvoorbeeld voor ziekenhuizen kan betekenen.”
Dus de verandering moet vanuit het management komen en niet van de vloer?
“Het kán niet van de vloer komen. Bedrijven zijn nog steeds ingedeeld naar menselijke capaciteiten: HR, productie, logistiek, communicatie. Zo is het ingedeeld omdat het voor de mens anders niet te overzien was. Degene die over de prijsstelling gaat, zal nooit opperen: goh, laten we de prijsstelling eens op een andere manier aan de productie gaan koppelen. Want hij gáát niet over de productie. Hij wordt niet geacht zich ermee te bemoeien en bovendien zegt het hem ook niks.”
“Die splitsing van afdelingen kan met behulp van AI weer teruggedraaid worden. Dat zie je steeds meer gebeuren. De prijs hangt vaak af van wat er logistiek mogelijk is. Als jij wilt dat je pakket om 11:00 uur bezorgd wordt, kan dat, maar dat is dan wel duurder dan wanneer ze om 13:00 uur langskomen. Want om 13:00 uur kwamen ze toch al in de buurt langs. Wat ik daarmee wil zeggen: wie over de prijs gaat, moet begrijpen wat voor de logistiek de makkelijke en de ingewikkelde optie is.”
Wat is het grootste risico op het vlak van AI?
Er ontstaan momenteel monopolies door de mate waarin data beschikbaar zijn. Sommige bedrijven weten oneindig veel data te verzamelen, zoals Amazon en Facebook. Daarmee kunnen ze megaveel. Nederland is wereldtop op algoritmiek en Data Science, het vak econometrie is zelfs in Nederland ontstaan. Onze bol.com en Ahold zouden vermoedelijk béter zijn dan Amazon, maar als Amazon over veel meer data mag beschikken, zijn ze niet te verslaan. ”
Wat zou de overheid daartegen moeten doen?
“Je moet iets doen aan de transparantie. Het moet zo zijn dat als Amazon data gebruikt, Ahold die dan ook mag gebruiken. Zodat je de concurrentieslag niet alleen maar wint omdat je een datamonopolie hebt.”
En waarom zouden ze hun data zomaar vrijgeven, die bedrijven?
“Dat moeten we wereldwijd regelen, met een verbod op data voor jezelf houden. Je moet in ieder geval niet gaan discussiëren langs lijnen van beperkingen; dat Amerikaanse bedrijven hier minder zouden mogen ofzo. Dat leidt tot een nieuw soort handelsoorlog met slechts verliezers. Je moet Amerika en China ervan overtuigen dat we allen een gezamenlijk belang hebben.”
ORTEC is ook onderdeel van de Nederlandse AI-Coalitie. Wat hoop je te bereiken?
“Dat we in Nederland meer strategische partnerschappen sluiten, meer gezamenlijk optreden. Concurrentie speelt voor ons eigenlijk nauwelijks. De markt groeit veel harder dan het aanbod. Meer aanbod betekent alleen maar nóg veel meer vraag. Het ergste is een concurrent die het slecht doet of onethisch handelt. Dan denken mensen: zie je wel, het werkt niet of het deugt niet. Maar een concurrent die het goed doet, zorgt alleen maar voor heel veel extra vraag. Die hij ook weer met geen mogelijkheid alleen aan kan.”