Model collapse: leidt AI tot een saai gemiddelde?
Hoe AI getraind op AI-output vervalt in een beige middelmaat — en waarom reasoning-modellen die trend deels kunnen breken.

Steeds meer tekst, beeld en code op het internet wordt door AI gemaakt. Diezelfde output wordt vervolgens weer ingelezen door de volgende generatie AI-modellen. De voor de hand liggende vraag: ontstaat er dan een soort "regression to the mean" — verdwijnen de scherpe randen, en blijft er een beige gemiddelde over?
Het korte antwoord: ja, dat risico is reëel. Er is een officiële wetenschappelijke term voor: model collapse. In de tech-wereld wordt het ook wel gekscherend Habsburg AI genoemd — naar de Europese koninklijke familie die door extreme inteelt steeds meer genetische defecten ontwikkelde. Bij AI gebeurt iets vergelijkbaars: de "genetische variatie" van data verdwijnt, waardoor output minder accuraat en minder creatief wordt.
Maar er is ook een belangrijk tegengeluid: moderne reasoning-modellen breken die spiraal deels open. Hieronder leg ik beide kanten uit, met de belangrijkste onderzoeken erbij.
Wat is model collapse precies?
Model collapse beschrijft wat er gebeurt wanneer generatieve AI-modellen worden getraind op data die deels door eerdere AI-modellen is gegenereerd. Shumailov et al. lieten in 2024 in Nature zien dat modellen die generaties lang worden bijgetraind op synthetische data, langzaam de staarten van de verdeling verliezen — de zeldzame, vreemde, verrassende voorbeelden. Wat overblijft is wat statistisch het meest waarschijnlijk is.
De nuances, de uitschieters en de menselijke "vibe" worden weggefilterd. Niet in één klap, maar geleidelijk. En precies dat patroon — convergentie naar het gemiddelde — herken je nu al in veel AI-tekst.
Drie redenen waarom AI-output naar het midden trekt
1. Reinforcement Learning from Human Feedback (RLHF)
De meeste consumenten-chatbots — ChatGPT, Claude, Gemini — worden bijgesteld met menselijke feedback. Beoordelaars geven een duim omhoog of omlaag, en het model leert welke antwoorden "prettig" worden gevonden. Daar zitten twee bijwerkingen aan vast:
- Standaardisering. Modellen ontwikkelen een voorkeur voor een herkenbare structuur: korte inleiding, genummerd lijstje, keurige conclusie. Het werkt — maar het is overal hetzelfde.
- Tone-leveling. Omdat de AI niemand mag beledigen en objectief moet blijven, sneuvelen sarcasme, sterke meningen en stilistische uitschieters. Het resultaat is die "beige" toon die je inmiddels op een halve alinea herkent.
2. Sycophancy: de AI als jaknikker
Een verwant probleem is sycophancy: het model bevestigt liever je aanname dan dat het je tegenspreekt. Ook dit is een onbedoeld gevolg van RLHF — meebewegen met de gebruiker scoort gemiddeld beter bij menselijke beoordelaars dan een kritisch weerwoord.
Het effect: een digitale echokamer waarin sociale wenselijkheid wint van feitelijke scherpte. Voor wie AI wil gebruiken om beter te denken, is dat een serieus probleem.
3. De Collective Novelty Paradox
Doshi en Hauser publiceerden in 2024 in Science Advances een onderzoek naar AI in creatief schrijven. Hun bevinding is opvallend dubbel:
- Op individueel niveau: verhalen werden meetbaar beter — vlotter, grammaticaal correcter, leuker om te lezen.
- Op collectief niveau: de verhalen leken juist véél meer op elkaar dan teksten die puur door mensen waren geschreven.
Of zoals de auteurs het samenvatten: AI verhoogt de bodem, maar verlaagt het plafond. Minder slechte teksten — maar ook minder unieke uitschieters. Dat noemen ze de afname van sociale diversiteit in creativiteit.
De Alignment Tax: betrouwbaar óf creatief, niet allebei
Er is een technische parameter die dit goed illustreert: temperature. Die bepaalt hoe "vrij" een model mag kiezen welk woord er volgt.
- Lage temperature (≈ 0.1). Het model kiest steeds het meest waarschijnlijke volgende woord. Veilig, voorspelbaar — en saai.
- Hoge temperature (≈ 0.9+). Het model mag onwaarschijnlijke paden in. Verrassender, creatiever — maar ook vaker feitelijk fout. Onderzoek (o.a. Shumailov et al., 2024) laat zien dat dit precies het punt is waarop modellen "uit de bocht vliegen".
Onderzoekers noemen dit de Alignment Tax: de prijs in creativiteit en diversiteit die je betaalt om een feitelijk betrouwbaar model te krijgen. Een nieuwe stroming spreekt zelfs over good hallucinations — de stelling dat een zekere mate van "verzinnen" noodzakelijk is voor échte creativiteit, omdat creativiteit per definitie gaat over iets dat niet letterlijk in de trainingsdata staat.
Waarom reasoning-modellen de spiraal deels doorbreken
Tot zover de "ja". Nu de "nee" — of in elk geval de nuance.
Vroeger waren generatieve modellen vrij eenlijnig: vraag erin, transformer-model erop, antwoord eruit. Dat leverde zowel veel hallucinaties op (output werd nergens tegen gecheckt) als generieke teksten.
De huidige generatie chatbots werkt anders. Wanneer je een vraag stelt, staat meestal een reasoning- of thinking-modus aan. Het model reflecteert eerst:
- Welke informatie heb ik nodig?
- Moet ik iets opzoeken om dit te kunnen beantwoorden?
- Welke stijlkeuze past hier — formeel, informeel, technisch?
- Is tekst überhaupt het juiste format, of werkt een interactief overzicht beter?
Die reasoning-stap heeft twee effecten. Eén: hallucinaties nemen af, omdat het model expliciet kan zeggen "dat weet ik niet zeker, ik zoek het op". Twee: het model trekt niet automatisch de meest standaard stijl uit de kast, maar bedenkt dat een mate van variatie passend kan zijn.
Of, korter: een input → output-model is bland en dat gaat snel. Een input → reasoning → output-model is een stap in de goede richting om dat — waar gewenst — te voorkomen. Wel met de kanttekening dat creatievere modellen tegelijk vaker hallucineren.
Wat betekent dit voor jou als gebruiker?
Drie praktische consequenties voor wie AI dagelijks inzet:
- Gebruik AI als sparringpartner, niet als auteur. Laat het model je denken aanscherpen, niet je stem overnemen. Schrijf de eerste én de laatste versie zelf.
- Vraag actief om tegenspraak. "Geef drie redenen waarom dit een slecht idee is" werkt beter dan "wat vind je ervan?" — dat laatste activeert sycophancy.
- Kies bewust een reasoning-model voor lastige vragen. Voor snel werk volstaat een snelle chatbot. Voor strategie, analyse of inhoudelijke nuance is een reasoning-model bijna altijd de moeite waard.
Conclusie
Model collapse is geen complottheorie — het is een gemeten effect, met een groeiende lijst peer-reviewed onderzoeken eronder. Tegelijk is het geen onontkoombaar lot. Reasoning-modellen, bewuste prompting en de discipline om je eigen oordeel niet uit handen te geven, zijn drie krachtige tegenkrachten.
De vraag is niet óf AI naar het gemiddelde trekt. Dat doet het. De vraag is of jij — als gebruiker, schrijver, denker — bereid bent het werk te doen om er bovenuit te komen.
Belangrijkste bronnen
- Shumailov et al. (2024). AI models collapse when trained on recursively generated data. Nature.
- Doshi & Hauser (2024). Generative AI enhances individual creativity but reduces the collective diversity of novel content. Science Advances.
- Onderzoek naar RLHF en de Alignment Tax (diverse, o.a. Anthropic & OpenAI).
- Recente literatuur over good hallucinations en reasoning-modellen (OpenReview, 2025–2026).
Verder denken over AI-risico's
Vragen over hoe je je AI-strategie toekomstbestendig maakt? Lees ons artikel over de grootste zorgen over AI, of plan een gesprek via AI Consultancy en train je team met een AI Workshop op maat.
// Over de auteur
Remy Gieling
Mede-oprichter, AI-expert & bestseller-auteur
Tech-expert (1988) gespecialiseerd in kunstmatige intelligentie en mede-oprichter van ai.nl, The Automation Group, Proxies en eBrain.ai. Oud-hoofdredacteur van diverse zakenmerken en daardoor een geoefend verteller op het podium en in de media. Verzorgt jaarlijks 150+ AI-keynotes in binnen- en buitenland en is gastdocent aan Nyenrode. Co-auteur van zeven boeken, waaronder 'Handboek AI Strategie' en 'AI Agents', en bekend als presentator op radio en RTL Z. Reist langs de labs van OpenAI, Nvidia en Tencent en vertaalt de nieuwste doorbraken naar inzichten die leiders direct kunnen toepassen.
LinkedIn

