Érica 20 januari 2026

Systeem 1 ontmoet de chatbot

13 min leestijd

Daniel Kahneman besteedde vijftig jaar aan het bestuderen van hoe mensen beslissingen nemen. Het framework dat hij destilleerde — Systeem 1 en Systeem 2 — is zo breed gerefereerd dat het dreigt zijn precisie te verliezen. Systeem 1: snel, automatisch, intuitief. Systeem 2: langzaam, weloverwogen, analytisch. De populaire versie is een afkorting. Het onderzoek eronder is specifieker, verontrustender en relevanter voor AI-adoptie dan de meeste mensen die het framework gebruiken beseffen.

De specifieke relevantie: Systeem 1 evalueert elke nieuwe ervaring voordat Systeem 2 de kans krijgt in te grijpen. De evaluatie is niet rationeel. Het is niet gebaseerd op bewijs. Het is gebaseerd op patroonherkenning, emotionele associatie en cognitieve vloeiendheid — hoe makkelijk de ervaring te verwerken is. Deze evaluatie duurt circa twee seconden. En het bepaalt of Systeem 2 ooit inschakelt.

Wanneer een teamlid voor het eerst een AI-chatbot opent, heeft Systeem 1 al besloten of het te vertrouwen is voordat de eerste query is getypt.

De tweesecondenevaluatie

Kahnemans onderzoek, samen met het complementaire werk van Zajonc (1980) over affectieve prioriteit en Ambady en Rosenthal (1993) over thin-slice oordelen, demonstreert dat initiele evaluaties niet voorlopig zijn — ze zijn fundamenteel. Ze zetten niet het toneel voor een meer overwogen evaluatie. Ze vormen de basis waarop alle volgende evaluaties worden geinterpreteerd.

Wanneer een inkoopmedewerker voor het eerst de nieuwe AI-assistent van het bedrijf opent, verwerkt Systeem 1 het volgende in circa twee seconden:

Visuele coherentie. Ziet de interface eruit als iets betrouwbaars? Niet “ziet het er goed uit” in esthetische zin, maar lijkt het op de categorie tools die de gebruiker al vertrouwt? Een chatinterface die lijkt op het bestaande berichtenplatform van de gebruiker (bekende layout, herkenbare inputpatronen) triggert cognitieve vloeiendheid — het verwerkingsgemak dat Systeem 1 interpreteert als veiligheid. Een interface die onbekend oogt — ongebruikelijke kleuren, onverwachte layout, onbekende interactiepatronen — triggert cognitieve disfluency, die Systeem 1 interpreteert als onzekerheid. Onzekerheid is niet neutraal. Het is aversief.

Toonkalibratie. De eerste woorden die de tool toont — de begroeting, de prompt, de instructietekst — worden op toon beoordeeld voordat ze op inhoud worden beoordeeld. Een toon die past bij de verwachting van de gebruiker van een professionele tool (helder, direct, competent) produceert cognitieve vloeiendheid. Een toon die niet past — te informeel voor een conservatieve bedrijfsomgeving, te formeel voor een startup, te enthousiast voor een Scandinavisch publiek, te koud voor een Zuid-Europees publiek — produceert disfluency. De gebruiker denkt niet “de toon klopt niet.” De gebruiker voelt dat er iets niet klopt. Systeem 1 registreert het gevoel. Systeem 2 krijgt niet de kans om het te overschrijven.

Competentiesignalen. Voordat er enige werkelijke interactie plaatsvindt, beoordeelt Systeem 1 of de tool “eruitziet alsof het weet wat het doet.” Deze beoordeling is gebaseerd op thin-slice signalen: de specificiteit van de gesuggereerde prompts (generieke prompts als “Vraag me van alles” signaleren lage competentie; specifieke prompts als “Classificeer een inkomend supportticket” signaleren domeincompetentie), de aanwezigheid van domeinrelevant vocabulaire, en de afwezigheid van duidelijke fouten (een typfout in het welkomstscherm is een thin-slice signaal van incompetentie, ongeacht de werkelijke capaciteit van het model).

Twee seconden. Drie beoordelingen. Geen bewuste deliberatie. Het oordeel staat vast voordat de gebruiker het eerste karakter typt.

De verankeringscascade

Kahnemans verankeringsonderzoek (Tversky en Kahneman, 1974) toont aan dat initiele schattingen referentiepunten creeren die alle volgende oordelen beinvloeden. De aanpassing vanaf het anker is doorgaans onvoldoende — mensen “verankeren en passen aan,” maar de aanpassing is nooit genoeg.

Pas dit toe op de eerste AI-toolinteractie. De eerste query produceert een output. Die output — de kwaliteit, de relevantie, het formaat — wordt het anker. Als het anker sterk is (een oprecht nuttig, specifiek, goed opgemaakt antwoord), worden alle volgende interacties door een positieve lens geinterpreteerd. Als het anker zwak is (een vaag, generiek of incorrect antwoord), moeten alle volgende interacties dat negatieve anker overwinnen.

De asymmetrie doet ertoe. Kahneman en Tversky’s verliesaversie-onderzoek (1979) toont aan dat negatieve ervaringen ruwweg twee keer het psychologische gewicht dragen van equivalente positieve ervaringen. Een slechte eerste interactie creert een tekort dat circa twee goede interacties vereist om te neutraliseren. Maar de gebruiker die een slechte eerste interactie had, is minder geneigd om ueberhaupt een tweede interactie te hebben — omdat Systeem 1 de tool al heeft gecategoriseerd als “niet nuttig,” en categorisaties van Systeem 1 zijn resistent tegen herziening.

Daarom is het cureren van de eerste interactie niet een nice-to-have. Het is de enkele beslissing met de hoogste hefboom in AI-toolimplementatie. De eerste query moet slagen. Niet “slagen” in de zin van “een technisch correct resultaat produceren.” Slagen in de zin van “een output produceren die Systeem 1 evalueert als competent, relevant en betrouwbaar.” De output moet makkelijk te lezen zijn (cognitieve vloeiendheid), duidelijk relevant voor het werk van de gebruiker (patroonmatch met bestaande behoeften), en aantoonbaar beter dan het alternatieve proces (comparatief voordeel zichtbaar in een oogopslag).

De affectheuristiek

Slovic, Finucane, Peters en MacGregor (2007) documenteerden de affectheuristiek — het proces waarbij emotionele reacties op een stimulus de plaats innemen van weloverwogen risico-batenanalyse. Mensen evalueren de risico’s en baten van een technologie niet onafhankelijk. Ze evalueren hun emotionele reactie op de technologie, en die emotionele reactie bepaalt zowel hun risicoperceptie als hun batenperceptie tegelijkertijd.

Als de emotionele reactie positief is (ik vind dit leuk), worden risico’s als laag waargenomen en baten als hoog. Als de emotionele reactie negatief is (ik vind dit niet leuk), worden risico’s als hoog waargenomen en baten als laag. De evaluatie is niet rationeel in de traditionele zin. Het is heuristisch — een shortcut die gevoel substitueert voor analyse.

Voor AI-tooladoptie betekent dit dat de gebruiker die een positieve eerste indruk heeft, de tool als zowel nuttiger als minder risicovol waarneemt dan het objectief is. De gebruiker die een negatieve eerste indruk heeft, neemt de tool als zowel minder nuttig als risicovoller waar dan het objectief is. De objectieve kenmerken van de tool zijn niet veranderd. De emotionele reactie van de gebruiker heeft hun perceptie van de kenmerken veranderd.

Daarom zijn functievergelijkingen ineffectief voor gebruikers die al een negatieve eerste ervaring hadden. Je kunt iemand niet uit een Systeem 1-evaluatie redeneren met een functielijst. De functielijst wordt verwerkt door de lens van het bestaande affect. “Het doet ook X” wordt door een negatief-affect gebruiker geinterpreteerd als “Het beweert ook X te doen maar doet het waarschijnlijk niet goed.” Dezelfde functie gepresenteerd aan een positief-affect gebruiker wordt geinterpreteerd als “Het doet ook X — geweldig.”

De implicatie: fix de eerste indruk. Al het andere volgt.

De cognitieve-belasting paradox

George Millers paper uit 1956 “The Magical Number Seven, Plus or Minus Two” stelde vast dat het werkgeheugen een eindige capaciteit heeft — ruwweg zeven brokken informatie tegelijk. Vervolgonderzoek door Cowan (2001) herzag dit naar beneden tot circa vier brokken. Het exacte getal doet er minder toe dan het principe: werkgeheugen is een bottleneck. Wanneer het overbelast is, neemt Systeem 1 het over — en Systeem 1 kiest standaard voor het bekende, het veilige en het bekende.

Een AI-tool overbelast het werkgeheugen door te veel nieuwheid tegelijk te presenteren. Een nieuwe interface, een nieuw interactiepatroon, een nieuw outputformaat, een nieuw vocabulaire, een nieuw evaluatiekader (is deze output goed? Hoe zou ik dat weten?) — elk hiervan is een brok. Samen overschrijden ze de werkgeheugencapaciteit. Systeem 2 kan ze niet allemaal verwerken. Systeem 1 neemt het over. De beoordeling van Systeem 1: dit is onbekend en dus onzeker en dus aversief.

De ontwerprespons is om de nieuwe brokken terug te brengen tot binnen de werkgeheugencapaciteit. Als de interface bekend is (een brok minder nieuw), het interactiepatroon bekend is (een minder), het outputformaat past bij bestaande documentformaten (een minder), dan heeft het werkgeheugen van de gebruiker capaciteit om de echt nieuwe elementen te verwerken — de antwoorden van de AI, de evaluatie van outputkwaliteit, de integratie in de workflow.

Daarom gebruiken succesvolle AI-toolimplementaties vaak bewust saaie interfaces. Een simpele tekstinvoer en een geformatteerde tekstoutput. Geen dashboards. Geen widgets. Geen gamificatie. Geen nieuwe interactiepatronen. De interface is onopvallend. De capaciteit van de AI is opmerkelijk. De gewoonheid van de interface bewaart werkgeheugen voor het ding dat ertoe doet — begrijpen wat de tool kan doen.

Het cognitieve-vloeiendheid probleem bij cross-culturele implementatie

Kahnemans framework heeft een culturele dimensie die onderbelicht is in de AI-adoptieliteratuur.

Cognitieve vloeiendheid — het gemak waarmee informatie wordt verwerkt — is cultureel gekalibreerd. Wat “makkelijk te verwerken” is, hangt af van wat de gebruiker eerder verwerkt heeft. De patronen die competentie signaleren, de toon die professionaliteit signaleert, de layout die betrouwbaarheid signaleert — dit alles is cultureel specifiek.

Een chatbot-interface ontworpen in San Francisco draagt de cognitieve patronen van San Francisco: informele toon, voornaam, emoji-achtige energie, progressieve onthulling, minimale tekst, veel witruimte. Deze interface is cognitief vloeiend voor gebruikers in vergelijkbare culturele contexten. Het is cognitief disfluent voor een Duitse inkoopmedewerker die formele aanspreekvorm, uitgebreide informatie en gestructureerde layouts verwacht. Het is cognitief disfluent voor een Japanse teamleider die hierarchische signalen, indirecte communicatie en contextrijke presentatie verwacht.

Systeem 1 weet niet dat het een culturele mismatch ervaart. Het weet dat het disfluency ervaart. Disfluency wordt verwerkt als onzekerheid. Onzekerheid wordt verwerkt als wantrouwen. De tool wordt niet afgewezen om culturele redenen — de gebruiker is zich er niet van bewust dat cultuur de variabele is. De tool wordt afgewezen omdat “iets niet klopte.”

Dit is de onzichtbare faalwijze van AI-tools die over Europese markten worden uitgerold zonder culturele kalibratie. De tool werkt. Het model is nauwkeurig. De functies zijn relevant. De interface is disfluent — niet omdat het slecht is, maar omdat het ontworpen was voor een ander Systeem 1. En Systeem 1 evalueert voordat Systeem 2 kan ingrijpen.

Ontwerpen voor Systeem 1

Het praktische framework voor het ontwerpen van AI-toolervaringen die de tweesecondenevaluatie van Systeem 1 overleven:

Principe 1: Visuele bekendheid. De interface moet eruitzien als dingen die de gebruiker al vertrouwt. Dit betekent niet het kopieren van bestaande tools. Het betekent het gebruik van visuele patronen — layout, typografie, kleurverhoudingen, informatiedichtheid — die het Systeem 1 van de doelgebruiker al heeft gecategoriseerd als “professionele tool.” Voor een Europese enterprise-context betekent dit doorgaans: gestructureerde layouts, ingetogen kleurpaletten, heldere typografie, zichtbare informatiehierarchie. Niet trendy. Niet speels. Competent.

Principe 2: Toonmatch. De taal van de tool moet passen bij het professionele register van de gebruiker. Dit is niet alleen een vertaalkwestie — het is een registerkwestie. Dezelfde taal op verschillende formaliteitsniveaus triggert verschillende Systeem 1-reacties. Voor een Duitse enterprise-implementatie: formeel register (Sie) met technische precisie. Voor een Nederlandse startup: informeel register (jij/je) met directheid. De capaciteit van het model is taalonafhankelijk. Het vertrouwen dat het genereert is taalspecifiek.

Principe 3: Gecureerde eerste ervaring. De eerste interactie moet een Systeem 1-overwinning zijn. Selecteer de eerste use case vooraf — een waarvan de tool goed presteert. Formuleer de eerste query vooraf — niet automatisch gegenereerd, maar gesuggereerd met voldoende specificiteit dat de output waarschijnlijk goed is. Maak het eerste antwoord zichtbaar nuttig — helder opgemaakt, relevant voor het domein van de gebruiker, aantoonbaar beter dan het alternatief.

Principe 4: Progressieve cognitieve belasting. Begin met een nieuw element. Het antwoord van de AI. Al het andere — de interface, het interactiepatroon, het outputformaat — moet bekend zijn. Naarmate de gebruiker vloeiendheid ontwikkelt met de kerninteractie, introduceer extra capaciteiten. Presenteer nooit alle functies tegelijk. Het werkgeheugen kan ze niet vasthouden. Systeem 1 zal de overbelasting afwijzen.

Principe 5: Verminder evaluatie-onzekerheid. De gebruiker weet niet hoe AI-output te evalueren. Is dit antwoord goed? Hoe zou ik dat weten? Deze onzekerheid is cognitief belastend en Systeem 1 registreert het als aversie. Verminder de onzekerheid door evaluatiescaffolding te bieden: “Dit antwoord is gebaseerd op je laatste 50 supporttickets” (brontransparantie), “Vertrouwen: Hoog” (expliciet vertrouwenssignaal), “Vergelijkbaar met hoe je team ticket #4.231 afhandelde” (vergelijking met bekende goede uitkomsten).

De sessiearchitectuur

Kahnemans peak-end rule (Kahneman et al., 1993) toont dat ervaringen niet worden beoordeeld op hun gemiddelde kwaliteit maar op twee momenten: de piek (meest intense) en het einde (laatste indruk). Alles daartussenin wordt grotendeels vergeten.

Voor AI-toolsessies betekent dit:

Ontwerp de piek. Zorg ervoor dat elke sessie ten minste een moment bevat waarop de output van de tool opvallend indrukwekkend is — een verband dat de gebruiker niet zag, een samenvatting die duidelijk tijd bespaart, een antwoord dat domeincompetentie demonstreert. Dit is de piek. Het verankert de sessieherinnering.

Ontwerp het einde. De laatste interactie in elke sessie moet positief zijn. Als de gebruiker waarschijnlijk de beperkingen van de tool tegenkomt (en dat zal gebeuren), zorg er dan voor dat die confrontaties in het midden van de sessie plaatsvinden, niet aan het einde. De laatste interactie moet de gebruiker achterlaten met een positief Systeem 1-residu — een gevoel van “dat was nuttig” in plaats van “dat was frustrerend.”

Optimaliseer het midden niet. Het midden van de sessie wordt cognitief verwerkt op een lagere resolutie. Kleine wrijving in het midden van een sessie heeft minimale impact op de algehele evaluatie. Bewaar je ontwerpenergie voor het begin (eerste indruk), de piek (meest indrukwekkende moment) en het einde (laatste indruk).

De terugkerende gebruiker

Alles tot nu toe besproken geldt voor de eerste interactie. Maar Systeem 1 blijft opereren bij elke volgende interactie.

De gebruiker die een positieve eerste ervaring had, keert terug met een positieve Systeem 1-dispositie. Hun snelle evaluatie is al gekalibreerd: deze tool is betrouwbaar. Elke volgende positieve interactie versterkt de kalibratie. De gebruiker ontwikkelt wat Zajonc het “mere exposure effect” noemde — bekendheid kweekt positief affect, onafhankelijk van bewuste evaluatie.

De gebruiker die een negatieve eerste ervaring had, staat voor een andere dynamiek. Als ze al terugkeren, is hun Systeem 1-dispositie negatief. De tool moet de verankeringsbias overwinnen — en zoals Kahneman documenteerde, is de aanpassing vanaf een negatief anker doorgaans onvoldoende. De tool moet significant beter zijn dan verwacht, niet slechts adequaat, om de initiele evaluatie te verschuiven.

Deze asymmetrie — positieve ankers zijn makkelijk te handhaven, negatieve ankers zijn moeilijk te overwinnen — heeft een ontwerpimplicatie voor doorlopende toolinteractie, niet alleen onboarding. Elke sessie moet ten minste een positieve piek bevatten. Elke sessie moet positief eindigen. Het midden kan wrijving, leren, zelfs frustratie bevatten. De piek en het einde bepalen de herinnering aan de sessie, die de Systeem 1-dispositie bepaalt voor de volgende sessie.

Consistentie doet ertoe. Een tool die indrukwekkend is op maandag en middelmatig op woensdag creert evaluatieve onzekerheid. Systeem 1 gaat niet goed om met onzekerheid — het lost onzekerheid op door standaard de meer negatieve evaluatie te kiezen (Kahnemans negativiteitsbias). Consistente gemiddelde kwaliteit wordt gunstiger beoordeeld door Systeem 1 dan inconsistente kwaliteit die gemiddeld hoger scoort.

De praktische ontwerpimplicatie: beheer outputkwaliteitsvariantie. Een tool die af en toe briljante resultaten produceert en af en toe slechte resultaten, zal strenger beoordeeld worden door Systeem 1 dan een tool die consistent goede (niet briljante) resultaten produceert. Verminder variantie voordat je capaciteit verhoogt.

De integratie

Kahneman besteedde vijftig jaar aan het demonstreren dat menselijk oordeelsvermogen niet is wat rationele keuzetheorie aanneemt. We zijn geen weloverwogen evalueerders die bewijs afwegen en conclusies trekken. We zijn snelle patroonherkenners die onmiddellijk indrukken vormen en dan ons weloverwogen denken gebruiken om te rationaliseren wat onze intuitie al besliste.

AI-tooladoptie is onderhevig aan dezelfde dynamiek. De functies zijn echt. De capaciteiten zijn meetbaar. De ROI is berekenbaar. Niets hiervan doet ertoe als Systeem 1 al heeft besloten, in twee seconden, dat de tool niet betrouwbaar is.

De conventionele benadering van AI-adoptie — presenteer de functies, demonstreer de ROI, train het team — is een Systeem 2-benadering van een Systeem 1-probleem. Het spreekt de weloverwogen, analytische geest aan. Maar tegen de tijd dat Systeem 2 de presentatie ontvangt, heeft Systeem 1 al gestemd. En de stem van Systeem 1 is hardnekkig.

Ontwerp voor Systeem 1. De functies spreken daarna voor zich — zodra de gebruiker bereid is te luisteren.

Geschreven door

Érica

Organisatiepsycholoog

Zij weet waarom mensen tools weigeren — en hoe je tools ontwerpt waar ze van houden. Als Érica spreekt, veranderen bedrijven van koers. Niet door overtuiging. Door begrip.

← Alle notities