Bertrand 7 octobre 2025

Les vrais artistes livrent

14 min de lecture

Steve Jobs l’a dit à l’équipe Macintosh en janvier 1983. Ils avaient passé leur temps à peaufiner, débattre, polir — à tout faire sauf terminer. “Real artists ship.” Trois mots qui séparaient ceux qui fabriquent des choses de ceux qui parlent de fabriquer des choses.

Quarante-deux ans plus tard, la plupart des projets IA ne les ont toujours pas entendus.

Le problème du pilote

Les estimations du secteur montrent régulièrement que la grande majorité des projets pilotes IA n’atteignent jamais la production. Gartner et IDC ont tous deux rapporté que seule une fraction des initiatives IA en entreprise — sur des échantillons mondiaux — dépasse le stade pilote dans les dix-huit mois suivant leur lancement. Le reste demeure dans une variante de « preuve de concept », « phase d’évaluation » ou « alignement des parties prenantes » — ce qui est du vocabulaire corporate pour dire qu’on fait du sur-place.

Le taux est pire pour les PME. Les petites entreprises n’ont pas les équipes d’ingénierie dédiées ni l’infrastructure d’intégration qui font passer un pilote en production. Parmi les micro-entreprises, la conversion pilote-production est quasi inexistante.

Pilot-to-production funnel

Ce ne sont pas des projets ratés. Ce sont des projets qui n’ont jamais tenté de réussir. Un pilote n’est pas un produit. Un pilote est un environnement contrôlé où l’échec n’a pas de conséquences et le succès n’a pas d’utilisateurs. C’est du théâtre avec une ligne budgétaire.

Pourquoi les pilotes ne deviennent pas des produits

Trois raisons structurelles. Aucune n’est technique.

La première est la dilution de la responsabilité. Un pilote appartient à tout le monde et à personne. L’équipe innovation l’a proposé. La DSI a validé l’infrastructure. Le métier a fourni le cas d’usage. Le comité de pilotage examine la mise à jour trimestrielle. Cinq groupes sont impliqués. Zéro groupe est responsable de mettre l’outil dans les mains de ceux qui l’utiliseront au quotidien.

Dans un déploiement en production, le nom de quelqu’un est dessus. Quelqu’un a décidé que cet outil serait livré à telle date à tels utilisateurs. Cette décision est inconfortable. Les pilotes existent pour l’éviter.

La deuxième est l’inflation des critères de succès. Les pilotes commencent avec des objectifs modestes : « Le modèle peut-il classer les demandes clients avec 85 % de précision ? » Le modèle atteint 87 %. Succès. Mais les critères de succès se déplacent. Peut-il gérer les cas limites ? S’intégrer à l’ERP ? Traiter les demandes en quatre langues ? Fonctionner on-premise ? Chaque question est raisonnable. Ensemble, elles forment une boucle de qualification infinie qui garantit que le pilote ne finit jamais, parce que la ligne d’arrivée ne cesse de bouger.

Les données d’enquêtes auprès des entreprises, issues de sources multiples, montrent ce schéma clairement. Parmi les entreprises qui déclarent « IA en évaluation », les périodes d’évaluation s’étirent régulièrement au-delà d’un an. Un an ou plus à évaluer si un outil fonctionne, pendant que l’équipe qui l’utiliserait attend — ou, plus probablement, construit un contournement sur tableur et passe à autre chose.

La troisième est la peur de l’échec d’adoption. C’est la vraie raison. Un pilote qui reste un pilote ne peut pas échouer publiquement. Un produit livré à 200 utilisateurs et ignoré est un échec visible — dans le budget, dans les métriques, dans les conversations de couloir. Le pilote est une couverture contre l’embarras. Le garder petit, le garder contenu, le garder loin de ceux qui pourraient le rejeter.

Mais le rejet est de la donnée. Le rejet dit ce dont l’outil a vraiment besoin. Un pilote qui tourne un an et produit une évaluation positive ne dit rien sur le fait que quiconque utilisera la chose. L’adoption est la seule métrique qui compte, et on ne peut pas mesurer l’adoption sans livrer.

Ce que « livrer » veut vraiment dire

Jobs était précis. Livrer, ce n’était pas « rendre disponible ». Livrer, ce n’était pas « publier ». Livrer, c’était mettre un produit fini dans les mains des personnes qui l’utiliseraient, dans leur environnement réel, avec leurs contraintes réelles.

Pour les outils IA dans une PME européenne, livrer signifie :

L’outil est accessible aux personnes pour lesquelles il a été conçu — pas l’équipe innovation, pas la DSI, mais le responsable des achats, l’agent du service client, le coordinateur logistique. Les vrais utilisateurs.

L’outil est intégré dans le flux de travail réel. Pas un onglet séparé. Pas un nouveau login. Pas un tableau de bord que personne ne consulte. Intégré là où le travail se fait.

L’outil a un mécanisme de retour. Les utilisateurs peuvent signaler ce qui marche et ce qui ne marche pas, et quelqu’un agit sur ces signalements en jours, pas en trimestres.

L’outil a un propriétaire. Une personne dont le travail inclut de s’assurer que cet outil reste utile. Pas un comité. Pas un canal. Un nom.

Chez Bluewaves, on appelle ça le « test des trois semaines ». Si l’outil n’est pas utilisé quotidiennement dans les trois semaines suivant le déploiement, quelque chose ne va pas — pas avec l’outil, mais avec l’architecture de déploiement. Trois semaines. Pas trois mois. Pas « après la prochaine session de formation ». Trois semaines.

Le prototype est l’argument

Léonard de Vinci remplissait des carnets d’idées. Il construisait aussi des choses. La différence comptait. Une idée dans un carnet est de la spéculation. Une idée dans le monde est un argument — elle argumente pour sa propre existence en fonctionnant ou en échouant. Les deux résultats sont utiles. Un seul est disponible pour l’idée qui n’est jamais livrée.

Le même principe s’applique à chaque déploiement IA. Un modèle dans un notebook Jupyter est une hypothèse. Un modèle en production est un argument. Il argumente que cette tâche particulière, faite de cette manière particulière, produit de meilleurs résultats que la méthode précédente. L’argument est testable. L’hypothèse ne l’est pas.

J’ai créé huit entreprises dans six pays. Chacune a commencé avec un prototype livré avant d’être prêt. Pas parce que l’impatience est une vertu — parce que le retour des vrais utilisateurs est le seul input qui compte, et on ne peut pas l’obtenir dans un environnement pilote.

La première version de chaque bon produit est embarrassante rétrospectivement. La première version de chaque bon produit a aussi appris à ses créateurs davantage en deux semaines d’usage réel qu’en six mois de tests internes.

Le coût de ne pas livrer

Un pilote IA raté coûte à une PME entre 10 000 € et 50 000 € en dépenses directes, selon la taille de l’entreprise et le périmètre du projet — licences, calcul, heures de conseil, temps interne. Ces chiffres n’incluent pas le coût d’opportunité — l’avantage concurrentiel qui s’accumule pour l’entreprise qui livre pendant que vous évaluez.

Mais le vrai coût est culturel. Chaque pilote qui meurt enseigne à l’organisation une leçon : l’IA est expérimentale. L’IA n’est pas pour nous. L’IA est un truc avec lequel l’équipe innovation joue pendant que nous faisons le vrai travail. Cette leçon se cumule. Après le deuxième pilote raté, le troisième fait face à un déficit de crédibilité qu’aucune présentation en comité de pilotage ne peut surmonter.

L’inverse est aussi vrai. Un outil qui est livré, qui fonctionne, que les gens utilisent vraiment — ce seul déploiement change la relation de l’organisation avec l’IA de manière permanente. L’équipe qui donne un nom à l’outil (un signe fiable d’adoption, comme Érica l’a documenté) devient prescriptrice. L’équipe qui voit les résultats devient curieuse. L’élan culturel d’un seul déploiement réussi vaut plus que dix évaluations pilotes réussies.

Le désavantage européen qui n’en est pas un

Il y a un récit selon lequel les entreprises européennes sont plus lentes à adopter l’IA à cause de la réglementation, de l’aversion au risque, du conservatisme culturel. Ce récit est faux — ou plutôt, il est suffisamment imprécis pour être inutile.

Les entreprises européennes sont plus lentes à adopter l’IA parce qu’elles font trop de pilotes. Elles évaluent plus longtemps, qualifient plus minutieusement, et construisent des dossiers d’investissement plus complets avant de s’engager. Ce ne sont pas des défauts de caractère. Dans beaucoup de contextes, ce sont des forces. La qualité de l’industrie européenne, la stabilité du système financier européen, les records de sécurité produit européens — tout cela vient d’une culture de la rigueur.

Mais la rigueur appliquée aux projets pilotes produit de la rigueur sans livraison. La même exigence qui garantit qu’une voiture allemande ne tombe pas en panne devrait garantir qu’un déploiement IA fonctionne. Au lieu de cela, elle garantit que le déploiement IA ne quitte jamais le circuit d’essai.

La Loi sur l’IA de l’UE, qui entre pleinement en vigueur par étapes jusqu’en août 2026, fournit en réalité un cadre pour une livraison responsable. Le système de classification des risques (Article 6) dit exactement quel niveau de supervision chaque déploiement requiert. Les procédures d’évaluation de la conformité (Articles 16-22) définissent ce à quoi « prêt à livrer » ressemble pour les systèmes à haut risque. Ce ne sont pas des obstacles — ce sont des spécifications. Un ingénieur lit une spécification et construit en conséquence. Un comité lit une spécification et planifie une réunion à ce sujet.

La réglementation est une contrainte créative. Les meilleurs produits de l’histoire — du Macintosh original à la Volkswagen Golf en passant par le système SEPA de l’UE — ont été construits dans des contraintes serrées. Les contraintes n’empêchent pas de livrer. Elles définissent ce que livrer signifie.

Le riff et la scène

Il y a un moment dans la musique live où un guitariste a répété un riff mille fois et hésite encore avant de le jouer sur scène. La salle de répétition est sûre. La scène ne l’est pas. Le public entendra chaque imperfection. La tentation est de répéter encore une fois, de peaufiner encore une fois, d’attendre que ce soit parfait.

David Gilmour n’attend pas. Il joue. Et les légères imperfections — le timing humain, le souffle avant le bend — sont ce qui rend le jeu réel. La version studio est parfaite. La version live est vraie.

Le déploiement IA fonctionne de la même manière. L’environnement pilote est la salle de répétition. La production est la scène. L’outil rencontrera des inputs que vous n’aviez pas prévus, des utilisateurs que vous n’aviez pas formés, des flux de travail que vous n’aviez pas cartographiés. Certaines de ces rencontres produiront des résultats imparfaits. Tant mieux. Maintenant vous savez quoi corriger. On ne peut pas apprendre cela depuis la salle de répétition.

Ce que nous faisons concrètement

Chez Bluewaves, la méthodologie de construction se fait en trois vagues de trois semaines chacune. Pas parce que trois semaines est un nombre magique — parce que trois semaines, c’est assez long pour construire quelque chose de réel et assez court pour rendre impossible de se cacher dans un pilote.

Vague un : construire et déployer. L’outil va vers de vrais utilisateurs sur de vraies tâches dans les trois premières semaines. Pas une démo. Pas un bac à sable. Du réel.

Vague deux : observer et ajuster. Regarder ce que les gens font vraiment avec l’outil. Pas ce qu’ils disent qu’ils feront. Ce qu’ils font. Ajuster l’outil sur la base du comportement observé, pas des préférences déclarées.

Vague trois : optimiser et documenter. L’outil fonctionne. Maintenant le rendre plus rapide, plus précis, mieux intégré. Documenter ce qui a été appris pour le prochain déploiement.

Neuf semaines. Trois itérations. Un produit déployé. Pas parfait. Déployé.

L’alternative — le cycle d’évaluation de douze mois, le comité de pilotage trimestriel, les sessions d’alignement des parties prenantes — est plus confortable. Le nom de personne n’est sur un échec. La réputation de personne n’est en jeu. Personne ne livre.

L’effet composé

La différence entre une entreprise qui livre son premier outil IA en octobre 2025 et une entreprise qui livre en octobre 2026 n’est pas douze mois. C’est douze mois d’apprentissage composé.

L’entreprise qui livre en octobre 2025 aura douze mois de données de production en octobre 2026. Douze mois de retours utilisateurs. Douze mois d’ajustements, d’améliorations et de connaissances accumulées sur la manière dont ses utilisateurs spécifiques interagissent avec les outils IA dans son contexte opérationnel spécifique. Le modèle aura été affiné. Les flux de travail auront été optimisés. L’équipe aura développé une aisance. L’organisation aura absorbé le changement culturel de « nous avons une stratégie IA » à « nous utilisons l’IA ».

L’entreprise qui livre en octobre 2026 partira de zéro. Même technologie. Mêmes fonctionnalités. Même capacité du modèle. Zéro apprentissage accumulé. Zéro donnée de production. Zéro mémoire musculaire organisationnelle.

L’effet composé dans le déploiement IA ne concerne pas la technologie. La technologie s’améliore que vous l’utilisiez ou non. L’effet composé concerne le savoir opérationnel — la compréhension par l’organisation de la manière dont les outils IA interagissent avec ses flux de travail spécifiques, ses clients spécifiques, ses contraintes spécifiques. Ce savoir se compose. Il ne peut pas être accéléré. Il peut seulement être commencé.

Chaque mois de retard est un mois d’apprentissage composé perdu. Le coût n’est pas linéaire. Il est exponentiel — parce que chaque mois d’apprentissage rend le mois suivant plus productif, et l’écart se creuse avec le temps.

C’est pourquoi « attendons de meilleurs modèles » est la phrase la plus chère en stratégie IA. Les modèles seront meilleurs dans six mois. Ils seront aussi meilleurs dans douze mois. Et dans vingt-quatre mois. L’amélioration des modèles est continue et externe. L’apprentissage opérationnel est interne et doit commencer. Le meilleur modèle du monde, déployé auprès d’une équipe sans expérience opérationnelle, sera moins performant qu’un modèle médiocre déployé auprès d’une équipe avec douze mois d’apprentissage en production.

Le surfeur qui attend la vague parfaite n’apprend jamais à surfer. Les vagues continuent d’arriver. L’apprentissage ne se fait que dans l’eau.

Livrez tôt. L’effet composé commence au déploiement. Il ne commence nulle part ailleurs.

La vérité qui dérange

La plupart des projets IA meurent non pas parce que la technologie échoue, mais parce que personne ne s’engage au moment où l’outil rencontre ses utilisateurs. La technologie est prête. L’infrastructure existe. Le cadre réglementaire est défini. Le cas d’usage est clair. Ce qui manque, c’est la décision : cet outil est livré à cette date à ces personnes.

Cette décision exige que quelqu’un accepte que la première version sera imparfaite. Que certains utilisateurs seront frustrés. Que certains cas d’usage ne fonctionneront pas comme prévu. Que le tableau de bord montrera des métriques d’adoption qui commencent bas et montent lentement — si le déploiement est bien fait — ou commencent bas et restent bas, ce qui est aussi une information utile.

La décision exige quelqu’un qui se soucie davantage de déployer un outil fonctionnel que de présenter un pilote réussi.

L’UE compte environ 33 millions d’entreprises. Selon les données d’Eurostat de décembre 2025, environ 20 % des entreprises de 10 employés ou plus ont adopté l’IA sous une forme ou une autre. Les 80 % restants n’attendent pas une meilleure technologie. Ils attendent que quelqu’un dise : on livre.

Le manifeste anti-pilote

Soyons explicite sur ce que j’argumente, parce que la pensée dominante résiste fort.

Je ne plaide pas contre les tests. Testez rigoureusement. Testez avec des données réelles. Testez avec des cas limites. Testez avec des inputs hostiles. Les tests sont de l’ingénierie. L’ingénierie n’est pas négociable.

Je ne plaide pas contre la planification. Planifiez le déploiement. Cartographiez le flux de travail. Identifiez les utilisateurs. Concevez l’intégration. La planification est de l’architecture. L’architecture n’est pas négociable.

Je plaide contre le pilote comme état permanent. Le pilote qui tourne six mois sans date de livraison. Le pilote reconduit chaque trimestre parce qu’« il nous faut plus de données ». Le pilote devenu une activité confortable, à faible risque, à faible responsabilité, qui permet à l’organisation de dire « on travaille sur l’IA » sans jamais mettre un outil devant un utilisateur.

Le pilote n’est pas intrinsèquement mauvais. Un pilote de deux semaines qui valide un cas d’usage puis livre est un outil puissant. Un pilote de deux semaines qui valide un cas d’usage puis devient une évaluation de quatre mois puis une évaluation de douze mois n’est pas un pilote. C’est de l’évitement avec un calendrier.

La distinction, c’est la date de livraison. Un pilote avec une date de livraison est une activité d’ingénierie. Un pilote sans date de livraison est un mécanisme de confort organisationnel. La date de livraison force une décision : c’est assez bon pour être déployé, ou ce n’est pas la peine de le déployer. Les deux résultats sont utiles. Aucun n’est disponible au pilote qui ne finit jamais.

Fixez la date de livraison avant que le pilote ne commence. Écrivez-la. Dites-la à l’équipe. Dites-la aux parties prenantes. Dites-la au conseil d’administration. L’outil est livré à cette date, ou le projet est annulé à cette date. Il n’y a pas de troisième option.

Les vrais artistes livrent. Les vrais ingénieurs livrent. Les vraies entreprises — celles qui seront encore compétitives en 2030 — livrent.

Le pilote est terminé. Livrez ou arrêtez tout.

Écrit par

Bertrand

Technologue Créatif

Entrepreneur en série titulaire d'un doctorat en IA, avec vingt-cinq ans à construire des systèmes à travers l'Europe. Il crée du code comme il surfe : en lisant les patterns, en trouvant le flux, en rendant le difficile facile.

← Toutes les notes