Echte kunstenaars leveren
Steve Jobs zei het tegen het Macintosh-team in januari 1983. Ze hadden zitten verfijnen, discussieren, polijsten — alles behalve afronden. “Real artists ship.” Drie woorden die de mensen die dingen maken scheidden van de mensen die praten over dingen maken.
Tweeenveertig jaar later hebben de meeste AI-projecten ze nog steeds niet gehoord.
Het pilotprobleem
Schattingen uit de sector laten consequent zien dat de overgrote meerderheid van AI-pilotprojecten nooit een productieomgeving bereikt. Gartner en IDC hebben beide gerapporteerd dat slechts een fractie van enterprise AI-initiatieven — over mondiale steekproeven — voorbij de pilotfase komt binnen achttien maanden na aanvang. De rest blijft hangen in een variant van “proof of concept,” “evaluatiefase,” of “afstemming met stakeholders” — bedrijfstaal voor stilstaan.
Het percentage is slechter voor het mkb. Kleinere bedrijven missen de gespecialiseerde engineeringteams en integratie-infrastructuur die pilots naar productie brengen. Onder micro-ondernemingen is de conversie van pilot naar productie nauwelijks meetbaar.

Dit zijn geen mislukte projecten. Het zijn projecten die nooit geprobeerd hebben te slagen. Een pilot is geen product. Een pilot is een gecontroleerde omgeving waar falen geen gevolgen heeft en succes geen gebruikers. Het is theater met een begrotingspost.
Waarom pilots geen producten worden
Drie structurele redenen. Geen ervan is technisch.
De eerste is diffusie van verantwoordelijkheid. Een pilot is van iedereen en van niemand. Het innovatieteam stelde het voor. IT keurde de infrastructuur goed. De business unit leverde de use case. De stuurgroep beoordeelt de kwartaalupdate. Vijf groepen zijn betrokken. Nul groepen zijn verantwoordelijk voor het in handen geven van de tool aan de mensen die het dagelijks zullen gebruiken.
Bij een productie-implementatie staat iemands naam eronder. Iemand besloot: deze tool gaat live op deze datum voor deze gebruikers. Die beslissing is oncomfortabel. Pilots bestaan om die te vermijden.
De tweede is inflatie van succescriteria. Pilots beginnen met bescheiden doelen: “Kan het model klantvragen classificeren met 85% nauwkeurigheid?” Het model haalt 87%. Succes. Maar dan verschuiven de succescriteria. Kan het randgevallen aan? Kan het integreren met het ERP? Kan het vragen in vier talen verwerken? Kan het on-premises draaien? Elke vraag is redelijk. Samen vormen ze een oneindige kwalificatielus die ervoor zorgt dat de pilot nooit eindigt omdat de eindstreep blijft verschuiven.
Enquetegegevens uit meerdere bronnen laten dit patroon duidelijk zien. Onder bedrijven die “AI in evaluatie” rapporteren, rekken evaluatieperiodes routinematig uit tot meer dan een jaar. Een jaar of langer evalueren of een tool werkt, terwijl het team dat het zou gebruiken wacht — of, waarschijnlijker, een spreadsheet-workaround bouwt en verder gaat.
De derde is angst voor adoptie-falen. Dit is de echte reden. Een pilot die een pilot blijft, kan niet publiekelijk falen. Een product dat naar 200 gebruikers gaat en genegeerd wordt, is een zichtbaar falen — in het budget, in de metrics, in de wandelgangengesprekken. De pilot is een hedge tegen schaamte. Houd het klein, houd het beperkt, houd het weg van de mensen die het zouden kunnen afwijzen.
Maar afwijzing is data. Afwijzing vertelt je wat de tool daadwerkelijk nodig heeft. Een pilot die een jaar draait en een positieve evaluatie oplevert, zegt niets over of iemand het ding zal gebruiken. Adoptie is de enige metric die ertoe doet, en je kunt adoptie niet meten zonder te leveren.
Wat “leveren” werkelijk betekent
Jobs was specifiek. Leveren was niet uitbrengen. Leveren was niet beschikbaar stellen. Leveren was een afgewerkt product in handen geven van de mensen die het zouden gebruiken, in hun werkelijke omgeving, met hun werkelijke beperkingen.
Voor AI-tools in een Europees mkb-bedrijf betekent leveren:
De tool is toegankelijk voor de mensen voor wie het ontworpen is — niet het innovatieteam, niet de IT-afdeling, maar de inkoopmedewerker, de klantenservicemedewerker, de logistiek coordinator. De daadwerkelijke gebruikers.
De tool is geintegreerd in de daadwerkelijke workflow. Geen apart tabblad. Geen nieuwe login. Geen dashboard dat niemand bezoekt. Geintegreerd in de plek waar het werk gebeurt.
De tool heeft een feedbackmechanisme. Gebruikers kunnen melden wat werkt en wat niet, en iemand handelt naar die meldingen binnen dagen, niet kwartalen.
De tool heeft een eigenaar. Een persoon wiens taak het is om ervoor te zorgen dat deze tool bruikbaar blijft. Geen commissie. Geen kanaal. Een naam.
Bluewaves noemt dit de “driewekentest.” Als de tool niet in dagelijks gebruik is binnen drie weken na implementatie, is er iets mis — niet met de tool, maar met de implementatiearchitectuur. Drie weken. Niet drie maanden. Niet “na de volgende trainingssessie.” Drie weken.
Het prototype is het argument
Leonardo da Vinci vulde notitieboeken met ideeen. Hij bouwde ook dingen. Het verschil deed ertoe. Een idee in een notitieboek is speculatie. Een idee in de wereld is een argument — het pleit voor zijn eigen bestaan door te werken of te falen. Beide uitkomsten zijn nuttig. Slechts een is beschikbaar voor het idee dat nooit geleverd wordt.
Hetzelfde principe geldt voor elke AI-implementatie. Een model in een Jupyter notebook is een hypothese. Een model in productie is een argument. Het stelt dat deze specifieke taak, op deze specifieke manier uitgevoerd, betere resultaten oplevert dan de vorige methode. Het argument is toetsbaar. De hypothese niet.
Ik heb acht bedrijven gebouwd in zes landen. Elk begon met een prototype dat geleverd werd voordat het klaar was. Niet omdat ongeduld een deugd is — omdat feedback van echte gebruikers de enige input is die ertoe doet, en je kunt die niet krijgen uit een pilotomgeving.
De eerste versie van elk goed product is achteraf genant. De eerste versie van elk goed product leerde de makers ook meer in twee weken echt gebruik dan zes maanden intern testen.
De kosten van niet leveren
Een mislukte AI-pilot kost een mkb-bedrijf tussen de EUR 10.000 en EUR 50.000 aan directe uitgaven, afhankelijk van bedrijfsgrootte en projectomvang — licenties, rekenkracht, consultanturen, interne tijdsbesteding. Deze cijfers bevatten geen opportuniteitskosten — het concurrentievoordeel dat toekomt aan het bedrijf dat levert terwijl jij evalueert.
Maar de echte kosten zijn cultureel. Elke pilot die sterft leert de organisatie een les: AI is experimenteel. AI is niet voor ons. AI is iets waarmee het innovatieteam speelt terwijl wij echt werk doen. Deze les stapelt zich op. Na de tweede mislukte pilot kampt de derde met een geloofwaardigheidstekort dat geen enkele stuurgroeppresentatie kan overwinnen.
Het omgekeerde geldt ook. Een tool die levert, die werkt, die mensen daadwerkelijk gebruiken — die ene implementatie verandert de relatie van de organisatie met AI permanent. Het team dat de tool een naam geeft (een betrouwbaar teken van adoptie, zoals Erica heeft gedocumenteerd) wordt een ambassadeur. Het team dat resultaten ziet, wordt nieuwsgierig. Het culturele momentum van een succesvolle implementatie is meer waard dan tien succesvolle pilotevaluaties.
Het Europese nadeel dat er niet is
Er is een verhaal dat Europese bedrijven trager zijn met de adoptie van AI vanwege regelgeving, vanwege risicoaversie, vanwege cultureel conservatisme. Het verhaal klopt niet — of beter, het is onnauwkeurig genoeg om nutteloos te zijn.
Europese bedrijven zijn trager met de adoptie van AI omdat ze te veel piloten. Ze evalueren langer, kwalificeren grondiger, en bouwen uitgebreidere businesscases voordat ze committeren. Dit zijn geen karakterfouten. In veel contexten zijn het sterktes. Europese productiekwaliteit, Europese financiele stabiliteit, Europese productveiligheidsrecords — deze komen allemaal voort uit een cultuur van grondigheid.
Maar grondigheid toegepast op pilotprojecten produceert grondigheid zonder levering. Dezelfde nauwkeurigheid die ervoor zorgt dat een Duitse auto niet kapotgaat, zou ervoor moeten zorgen dat een AI-implementatie werkt. In plaats daarvan zorgt het ervoor dat de AI-implementatie nooit van de testbaan afkomt.
De AI-verordening van de EU, die in fasen volledig van kracht wordt tot augustus 2026, biedt juist een kader voor verantwoord leveren. Het risicoclassificatiesysteem (artikel 6) vertelt je precies welk niveau van toezicht elke implementatie vereist. De conformiteitsbeoordelingsprocedures (artikelen 16-22) definieren hoe “klaar om te leveren” eruitziet voor hoog-risicosystemen. Dit zijn geen obstakels — het zijn specificaties. Een engineer leest een specificatie en bouwt ernaar. Een commissie leest een specificatie en plant een vergadering erover.
Regelgeving is een creatieve beperking. De beste producten uit de geschiedenis — van de originele Macintosh tot de Volkswagen Golf tot het Europese SEPA-betalingssysteem — werden gebouwd binnen strakke beperkingen. Beperkingen voorkomen levering niet. Ze definieren hoe levering eruitziet.
De riff en het optreden
Er is een moment in livemuziek waarop een gitarist een riff duizend keer heeft geoefend en nog steeds aarzelt om hem op het podium te spelen. De oefenruimte is veilig. Het podium niet. Het publiek hoort elke onvolkomenheid. De verleiding is om nog een keer te oefenen, nog een keer te verfijnen, te wachten tot het perfect is.
David Gilmour wacht niet. Hij speelt. En de kleine onvolkomenheden — de menselijke timing, de ademhaling voor de buiging — zijn wat het echt maken. De studioversie is perfect. De liveversie is waar.
AI-implementatie werkt op dezelfde manier. De pilotomgeving is de oefenruimte. Productie is het podium. De tool zal inputs tegenkomen die je niet voorspelde, gebruikers die je niet trainde, workflows die je niet in kaart bracht. Sommige van die ontmoetingen zullen onvolmaakte output opleveren. Goed. Nu weet je wat je moet fixen. Dat kun je niet leren vanuit de oefenruimte.
Wat wij daadwerkelijk doen
Bij Bluewaves is de bouwmethode drie golven van elk drie weken. Niet omdat drie weken een magisch getal is — omdat drie weken lang genoeg is om iets echts te bouwen en kort genoeg om je verstoppen in een pilot onmogelijk te maken.
Golf een: bouwen en implementeren. De tool gaat naar echte gebruikers met echte taken binnen de eerste drie weken. Geen demo. Geen sandbox. Echt.
Golf twee: observeren en aanpassen. Kijk wat mensen daadwerkelijk doen met de tool. Niet wat ze zeggen dat ze zullen doen. Wat ze doen. Pas de tool aan op basis van geobserveerd gedrag, niet gerapporteerde voorkeuren.
Golf drie: optimaliseren en documenteren. De tool werkt. Maak het nu sneller, nauwkeuriger, beter geintegreerd. Documenteer wat geleerd is voor de volgende implementatie.
Negen weken. Drie iteraties. Een geimplementeerd product. Niet perfect. Geimplementeerd.
Het alternatief — de twaalfmaanden-evaluatiecyclus, de kwartaalstuurgroep, de sessies voor afstemming met stakeholders — is comfortabeler. Niemands naam staat op een falen. Niemands reputatie loopt gevaar. Niemand levert.
Het samengestelde effect
Het verschil tussen een bedrijf dat zijn eerste AI-tool levert in oktober 2025 en een bedrijf dat levert in oktober 2026 is niet twaalf maanden. Het is twaalf maanden samengesteld leren.
Het bedrijf dat levert in oktober 2025 zal twaalf maanden productiedata hebben tegen oktober 2026. Twaalf maanden gebruikersfeedback. Twaalf maanden aanpassingen, verbeteringen en opgebouwde kennis over hoe de specifieke gebruikers omgaan met AI-tools in de specifieke operationele context. Het model zal verfijnd zijn. De workflows zullen geoptimaliseerd zijn. Het team zal vloeiendheid ontwikkeld hebben. De organisatie zal de culturele verschuiving geabsorbeerd hebben van “wij hebben een AI-strategie” naar “wij gebruiken AI.”
Het bedrijf dat levert in oktober 2026 begint vanaf nul. Dezelfde technologie. Dezelfde functies. Dezelfde modelcapaciteit. Nul opgebouwd leren. Nul productiedata. Nul organisatorisch spiergeheugen.
Het samengestelde effect bij AI-implementatie gaat niet over de technologie. De technologie verbetert ongeacht of je het gebruikt. Het samengestelde effect gaat over operationele kennis — het begrip van de organisatie over hoe AI-tools interacteren met de specifieke workflows, de specifieke klanten, de specifieke beperkingen. Deze kennis stapelt zich op. Het kan niet versneld worden. Het kan alleen gestart worden.
Elke maand uitstel is een maand misgelopen samengesteld leren. De kosten zijn niet lineair. Ze zijn exponentieel — omdat elke maand leren de volgende maand productiever maakt, en de kloof groeit met de tijd.
Daarom is “laten we wachten op betere modellen” de duurste zin in AI-strategie. De modellen zullen beter zijn over zes maanden. Ze zullen ook beter zijn over twaalf maanden. En over vierentwintig maanden. De modelverbetering is continu en extern. Het operationele leren is intern en moet beginnen. Het beste model ter wereld, geimplementeerd bij een team zonder operationele ervaring, zal onderpresteren ten opzichte van een middelmatig model geimplementeerd bij een team met twaalf maanden productie-ervaring.
De surfer die wacht op de perfecte golf leert nooit surfen. De golven blijven komen. Het leren gebeurt alleen in het water.
Lever vroeg. Het samengestelde effect begint bij implementatie. Het begint nergens anders.
De ongemakkelijke waarheid
De meeste AI-projecten sterven niet omdat de technologie faalt, maar omdat niemand zich committeert aan het moment waarop de tool zijn gebruikers ontmoet. De technologie is klaar. De infrastructuur bestaat. Het regelgevingskader is gedefinieerd. De use case is duidelijk. Wat ontbreekt is de beslissing: dit gaat live op deze datum voor deze mensen.
Die beslissing vereist dat iemand accepteert dat de eerste versie onvolmaakt zal zijn. Dat sommige gebruikers gefrustreerd zullen zijn. Dat sommige use cases niet zullen werken zoals verwacht. Dat het dashboard adoptiemetrics zal tonen die laag beginnen en langzaam stijgen — als de implementatie goed is uitgevoerd — of laag beginnen en laag blijven, wat ook nuttige informatie is.
De beslissing vereist iemand die meer geeft om het implementeren van een werkende tool dan om het presenteren van een succesvolle pilot.
De EU heeft ongeveer 33 miljoen ondernemingen. Volgens de Eurostat-gegevens van december 2025 heeft ruwweg 20% van de ondernemingen met 10 of meer werknemers AI in enige vorm geadopteerd. De 80% die dat niet heeft gedaan, wacht niet op betere technologie. Ze wachten tot iemand zegt: dit gaat live.
Het anti-pilot manifest
Laat me expliciet zijn over wat ik betoog, want de conventionele wijsheid duwt hard terug.
Ik pleit niet tegen testen. Test grondig. Test met echte data. Test met randgevallen. Test met vijandige inputs. Testen is engineering. Engineering is niet-onderhandelbaar.
Ik pleit niet tegen plannen. Plan de implementatie. Breng de workflow in kaart. Identificeer de gebruikers. Ontwerp de integratie. Plannen is architectuur. Architectuur is niet-onderhandelbaar.
Ik pleit tegen de pilot als permanente toestand. De pilot die zes maanden draait zonder leverdatum. De pilot die elk kwartaal verlengd wordt omdat “we meer data nodig hebben.” De pilot die een comfortabele, laag-risico, laag-verantwoordelijke activiteit is geworden waarmee de organisatie kan zeggen “we werken aan AI” zonder ooit een tool voor een gebruiker te zetten.
De pilot is niet inherent fout. Een pilot van twee weken die een use case valideert en vervolgens levert, is een krachtig instrument. Een pilot van twee weken die een use case valideert en vervolgens een evaluatie van vier maanden wordt die een beoordeling van twaalf maanden wordt, is geen pilot. Het is vermijding met een tijdlijn.
Het onderscheid is de leverdatum. Een pilot met een leverdatum is een engineeringactiviteit. Een pilot zonder leverdatum is een organisatorisch comfortmechanisme. De leverdatum dwingt een beslissing af: dit is goed genoeg om te implementeren, of dit is niet waard om te implementeren. Beide uitkomsten zijn nuttig. Geen van beide is beschikbaar voor de pilot die nooit eindigt.
Stel de leverdatum vast voordat de pilot begint. Schrijf het op. Vertel het aan het team. Vertel het aan de stakeholders. Vertel het aan het bestuur. De tool gaat live op deze datum, of het project wordt geannuleerd op deze datum. Er is geen derde optie.
Echte kunstenaars leveren. Echte engineers leveren. Echte bedrijven — de bedrijven die in 2030 nog competitief zullen zijn — leveren.
De pilot is voorbij. Lever het of stop ermee.