Niet blind rennen, niet stilzitten; de lessen uit ons Belastingdienst-onderzoek over Agentic AI


Afgelopen maanden interviewden wij in opdracht van de Concerndirectie Innovatie en Strategie van de Belastingdienst elf vooraanstaande experts over de vraag: wat betekent agentic AI voor een organisatie die jaarlijks miljoenen aangiften verwerkt, miljoenen telefoongesprekken voert en complexe regelgeving uitvoert?
Het resultaat is een rapport dat we vandaag publiceren: "Agentic AI: De buitenwereld aan het woord." Geen blauwdruk, maar een kompas. Hieronder de belangrijkste inzichten.
We kozen bewust voor diversiteit. Aan tafel zaten onder meer Durk Kingma (onderzoeker bij Anthropic, eerder OpenAI en Google DeepMind), Robert Engels (hoofd Gen AI Lab bij Capgemini), Deborah Nas (hoogleraar TU Delft), Sanne Manders (President van Flexport), Winifred Andriessen (VP AI Excellence bij KPN), Geert-Jan van der Snoek (CEO Sdu Lefebvre), Jorissa Neutelings (CDO ABN AMRO), Jeroen van Glabbeek (CEO CM.com), Marijn Pijnenborg (medeoprichter Funda), Bas Haring (filosoof) en Douwe Groenevelt (oprichter Viridea, voormalig ASML).
Technologen, wetenschappers, bestuurders en denkers. Die combinatie bleek essentieel om voorbij de hype te komen.
Eén ding viel op in vrijwel elk gesprek: de waarschuwing om niet te zwichten voor de marketingmachine rond AI. Deborah Nas was het meest uitgesproken: zij ziet in de praktijk nauwelijks organisaties waar agents écht operationeel draaien in kritieke processen. Robert Engels noemde het de "Bermuda-driehoek" van agentic AI — de spanning tussen autonomie, agency en authority. Je communiceert met natuurlijke taal met een systeem dat fundamenteel probabilistisch is. Dat is prima voor brainstormen, maar riskant voor processen met juridische consequenties.
Tegelijkertijd nuanceerde Jeroen van Glabbeek: het hallucinatieprobleem van een paar jaar geleden is grotendeels opgelost. Bij CM.com wordt 85% van de helpdeskvragen volledig autonoom afgehandeld — met hogere klanttevredenheid dan voorheen.
De kunst zit in de middenweg: noch naïef enthousiasme, noch verlamde scepsis, maar geïnformeerd experimenteren.
Het meest concrete voorbeeld kwam van Sanne Manders bij Flexport, dat 51% automatisering in de kernoperatie heeft bereikt. Hij beschreef drie lagen van automatisering: klassieke software engineering, de "Excel-stack" (werk dat te variabel was om traditioneel te automatiseren), en een nieuwe derde laag waarin je met LLM's en low-code die middenlaag aanpakt.
Wat de Belastingdienst hiervan kan leren: de grootste waarde zit niet in chatbots, maar in het automatiseren van processen die nu handmatig verlopen terwijl ze dat niet hoeven. Flexport audiëert inmiddels 100% van alle douanetransacties in plaats van een steekproef van enkele procenten. Dat verandert fundamenteel wat je als organisatie kunt weten.
Filosoof Bas Haring vertelde het mooiste voorbeeld. Een man bij de gemeente Tilburg, boven de zestig, hielp mensen met rapporten schrijven. Dat doet hij niet meer — AI kan dat beter. Maar hij heeft evenveel werk. Waarom? Omdat mensen met hem koffie willen drinken. Ze willen een mens tegenover zich die luistert, meedenkt, ondersteunt. Evenveel werk, maar héél ander werk.
Dit is de kernvraag voor elke organisatie: wat doe je met de vrijgespeelde capaciteit? Het rapport pleit ervoor die niet in te zetten voor meer efficiëntie, maar voor betere dienstverlening. De burger die vastloopt, de ondernemer met een complexe situatie, de nabestaande die geen weg weet — daar heb je mensen voor nodig.
Jorissa Neutelings van ABN AMRO schetste misschien wel het meest vergaande scenario. Wat als de burger niet meer zelf naar de website van de Belastingdienst komt, maar zijn eigen AI-assistent stuurt? Zij introduceerde het concept van de "vloeibare onderneming": een organisatie die haar dienstverlening opknipt in kleine, koppelbare blokjes die zowel door mensen als door machines bevraagd kunnen worden.
Voor de Belastingdienst betekent dit: je moet niet alleen nadenken over hoe AI jouw processen verbetert, maar ook over hoe je omgaat met een wereld waarin de burger een agent stuurt in plaats van zelf te bellen.
De les van de kinderopvangtoeslagaffaire klonk door in meerdere interviews. Elke AI-implementatie moet vanaf dag één zijn ontworpen met logging, audit trails en uitlegbaarheid. Niet als afterthought, maar als fundament. Geert-Jan van der Snoek van Sdu Lefebvre besteedt structureel 5 tot 6 procent van alle ontwikkeltijd aan betrouwbaarheid en governance.
Robert Engels vatte het kernachtig samen: vertrouwen bouw je niet met technologie alleen, maar met transparantie, met uitlegbaarheid, met de mogelijkheid om fouten te corrigeren.
Het rapport sluit af met zeven concrete aanbevelingen:
De elf experts waren het roerend eens over twee dingen. Stilzitten is geen optie — de technologie ontwikkelt zich, de private sector omarmt haar, burgers zullen vergelijkbare dienstverlening verwachten. Maar blind rennen is evenmin verstandig. Succes gaat niet naar wie het eerste is, maar naar wie het beste leert.
Of, in de woorden van Bas Haring: "Piel een beetje. Maar piel met aandacht, met reflectie, en met het grotere doel voor ogen."
Het volledige rapport "Agentic AI: De buitenwereld aan het woord" is geschreven in opdracht van de Concerndirectie Innovatie en Strategie van de Belastingdienst door Remy Gieling en Job van den Berg van The AI Group (ai.nl). Het rapport is hier te downloaden.

