Bertrand 3 février 2026

L'erreur à 500 000 €

16 min de lecture

Au T3 2025, le Commissaire de Hambourg pour la protection des données et la liberté d’information (HmbBfDI) a infligé une amende de 492 000 € à une société de services financiers pour violation des dispositions du RGPD sur la prise de décision automatisée. L’entreprise avait déployé un système algorithmique pour traiter les demandes de carte de crédit — rejetant automatiquement des demandeurs sans explication adéquate de la logique de décision ni implication humaine effective dans le processus.

Le schéma n’est pas propre aux services financiers. Imaginons le scénario que chaque autorité de protection des données européenne surveille : un système IA déployé pour l’évaluation automatisée de la performance des employés. Le système note les employés sur une métrique composite, signale les sous-performants pour examen et génère des recommandations de licenciement. Un examinateur humain approuve chaque recommandation que le système génère pendant des mois. Chacune d’entre elles.

Au titre de l’article 22 du RGPD, ceci n’est pas une « supervision humaine effective ». Un humain qui approuve chaque recommandation machine sans évaluation indépendante n’est pas un décideur. C’est un relais — un tampon en forme d’humain qui ajoute de la latence à un processus automatisé sans ajouter de jugement.

L’amende de Hambourg était de 492 000 €. La leçon vaut davantage.

Ce que dit réellement l’article 22

L’article 22(1) du RGPD stipule : « La personne concernée a le droit de ne pas faire l’objet d’une décision fondée exclusivement sur un traitement automatisé, y compris le profilage, produisant des effets juridiques la concernant ou l’affectant de manière significative de façon similaire. »

L’expression clé est « fondée exclusivement sur un traitement automatisé ». Si un humain est véritablement impliqué dans la décision, l’article 22 ne s’applique pas. La question — toute la question — est ce que « véritablement impliqué » signifie.

Le Groupe de travail Article 29 (devenu le Comité européen de la protection des données) a fourni des orientations en 2018 : l’implication humaine doit être « effective » plutôt qu’un « geste symbolique ». L’humain doit avoir « l’autorité et la compétence pour modifier la décision ». Il doit « prendre en compte toutes les données d’entrée disponibles » et « procéder à une évaluation ».

Ce sont des exigences qualitatives. L’affaire de Hambourg les a traduites en critères opérationnels pour la première fois dans une action de mise en application significative.

Quatre critères pour une supervision effective

L’action de mise en application de Hambourg, combinée aux orientations du Groupe de travail Article 29 de 2018 sur la prise de décision automatisée, désigne quatre critères opérationnels pour une supervision humaine effective :

Critère 1 : Capacité d’évaluation indépendante. L’examinateur humain doit avoir accès à toutes les informations que le système automatisé a utilisées pour parvenir à sa recommandation — les données d’entrée, la logique de traitement (dans la mesure où elle est explicable) et le résultat. Il doit aussi avoir accès à des informations que le système n’a pas utilisées : facteurs contextuels, schémas historiques, dynamiques interpersonnelles et expertise métier que le système ne peut pas capturer.

Dans un déploiement défaillant typique, l’examinateur reçoit le score et la recommandation du système mais n’a pas accès aux données sous-jacentes analysées. L’examinateur évalue la sortie du système, pas la situation de l’individu. Il examine l’examinateur, pas les preuves.

Critère 2 : Autorité opérationnelle de dérogation. L’examinateur humain doit avoir l’autorité pratique — pas seulement théorique — de rejeter la recommandation du système. Cela signifie que la structure d’incitations organisationnelle doit soutenir les dérogations. Si déroger au système déclenche des exigences de documentation supplémentaires, des questions de la hiérarchie, ou des conséquences sur la performance de l’examinateur, le mécanisme de dérogation est fonctionnellement désactivé même s’il existe formellement.

Un schéma de défaillance courant : le processus exige de l’examinateur une justification écrite pour chaque dérogation, tandis que les approbations ne nécessitent aucune documentation. L’asymétrie crée une incitation implicite à approuver. Les autorités européennes de protection des données ont systématiquement jugé que ce type d’asymétrie structurelle compromet le caractère effectif de la supervision.

Critère 3 : Temps et ressources suffisants. L’examinateur doit avoir assez de temps pour mener une évaluation véritable. Si le flux de travail attribue 200 décisions d’examen par jour à une seule personne, le temps par décision se compte en minutes. L’évaluation effective de la performance d’un employé — en considérant l’entrée du système IA, les données sous-jacentes et les facteurs contextuels — ne peut pas se faire en trois minutes.

Quand un examinateur traite 40 ou 50 dossiers par jour, le temps par décision se mesure en minutes. L’évaluation effective de la situation d’un individu ne peut pas se faire en trois minutes. Le tamponnage induit par le volume est fonctionnellement équivalent au traitement automatisé.

Critère 4 : Variation démontrée des résultats. Un examinateur humain qui est d’accord avec chaque recommandation automatisée sur une période prolongée n’examine pas. Il approuve. Un taux d’approbation de 100 % sur plusieurs mois est la preuve directe que la supervision n’est pas effective. Une véritable évaluation indépendante produirait des désaccords — à moins que le système automatisé ne soit parfait, ce qu’aucun système n’est.

Ce critère est statistique. Il n’exige pas un taux de dérogation spécifique. Mais un taux de dérogation de 0 % est la preuve que le processus d’examen est cérémoniel.

L’architecture technique de la supervision humaine

La mise en application de Hambourg est une affaire de conformité. Les implications sont architecturales. Si une supervision humaine effective exige une évaluation indépendante, une autorité de dérogation, un temps suffisant et une variation démontrée, alors le système IA doit être conçu pour supporter les quatre.

Ce n’est pas un problème de politique. C’est un problème d’ingénierie.

Soutenir l’évaluation indépendante : Le système doit présenter à l’examinateur les données d’entrée, le raisonnement du modèle (ou les signaux de confiance, ou les scores d’importance des variables), et une présentation claire de ce que le modèle n’a pas eu comme information. C’est une exigence de conception d’interface : l’interface d’examen ne peut pas être un bouton binaire approuver/rejeter à côté d’un score. Ce doit être un espace de travail où l’examinateur peut examiner les preuves.

Pour une PME déployant un système IA pour l’évaluation du crédit client, cela signifie que l’interface d’examen montre : les données de la demande client, le score de risque du modèle, les facteurs ayant le plus influencé le score (positifs et négatifs), le niveau de confiance du modèle, et un espace structuré pour que l’examinateur ajoute les informations contextuelles que le modèle n’a pas prises en compte (par exemple, une relation client existante, une situation financière temporaire connue).

Construire cette interface coûte du temps d’ingénierie. Ne pas la construire coûte des centaines de milliers d’euros d’amendes — au minimum.

Soutenir l’autorité de dérogation : Le système doit rendre les dérogations aussi faciles que les approbations. Pas de documentation supplémentaire. Pas de chaîne d’approbation supplémentaire. Si approuver une recommandation prend un clic, déroger à une recommandation doit prendre un clic plus un motif (sélectionné dans une liste déroulante, pas un essai en texte libre). Le processus organisationnel doit valoriser explicitement les dérogations — non pas comme des erreurs du système automatisé, mais comme la preuve que le jugement humain est opérationnel.

Soutenir le temps suffisant : Le système doit gérer le volume du flux de travail pour garantir aux examinateurs un temps adéquat par décision. C’est un problème de théorie des files d’attente. Si l’évaluation moyenne nécessite 12 minutes d’examen effectif et que l’examinateur travaille 7 heures productives par jour, le volume maximal soutenable est de 35 examens par jour. Le système doit imposer cette limite — non par la supervision managériale, mais par la conception du flux. Le 36e examen va à un autre examinateur ou attend le lendemain.

Soutenir la variation démontrée : Le système doit suivre les taux de dérogation et signaler les anomalies. Un examinateur avec un taux d’approbation soutenu de 100 % doit déclencher un examen du processus — pas parce que l’examinateur est négligent, mais parce que le système peut ne pas présenter de cas où la dérogation est justifiée, ou le seuil de l’examen humain peut être mal calibré.

L’amplification par la Loi sur l’IA de l’UE

L’exigence de supervision humaine effective de l’article 22 du RGPD est amplifiée par la Loi sur l’IA de l’UE, qui pousse le concept plus loin pour les systèmes IA à haut risque.

L’article 14 de la Loi sur l’IA de l’UE exige que les systèmes IA à haut risque soient « conçus et développés de manière, y compris avec des outils d’interface homme-machine appropriés, à ce qu’ils puissent être effectivement supervisés par des personnes physiques pendant la période d’utilisation du système IA ».

Les ajouts clés au-delà du RGPD :

Exigence au niveau de la conception. La supervision humaine doit être intégrée dans la conception du système, pas ajoutée comme une couche de processus. C’est une exigence produit, pas une exigence de politique. L’évaluation de la conformité (Articles 16–22) évalue si le système a été conçu pour une supervision humaine effective — pas si un processus d’examen humain a été ajouté par-dessus un système automatisé.

Exigence d’interface. La réglementation mentionne explicitement les « outils d’interface homme-machine ». L’interface d’examen n’est pas optionnelle. C’est une exigence réglementaire. L’interface doit permettre au superviseur humain d’« interpréter correctement la sortie du système » et de « décider, dans toute situation particulière, de ne pas utiliser le système IA à haut risque ou d’ignorer, de passer outre ou d’annuler la sortie ».

Exigence de compétence. L’article 14(4) exige que les superviseurs humains aient « la compétence, la formation et l’autorité nécessaires » pour exercer une supervision effective. Cela signifie que l’examinateur doit être formé — pas seulement au processus d’examen, mais au fonctionnement du système IA, à ses limites connues et au domaine dans lequel il opère.

Pour une PME qui se prépare à la date d’application du 2 août 2026, ces exigences se traduisent en décisions d’ingénierie et opérationnelles spécifiques qui doivent être prises avant le déploiement, pas après.

Les trois erreurs les plus courantes

Sur la base des tendances de mise en application et des exigences de la Loi sur l’IA de l’UE, trois schémas de déploiement échouent au test de supervision effective :

Erreur 1 : L’interface de confirmation. L’interface d’examen montre la recommandation du système IA et demande à l’examinateur de confirmer ou rejeter. La recommandation est présentée comme le choix par défaut. Le bouton de confirmation est proéminent. Le bouton de rejet nécessite des étapes supplémentaires. L’interface est conçue pour fluidifier l’approbation, ce qui signifie qu’elle est conçue pour décourager la supervision.

La correction : l’interface d’examen doit présenter les preuves sans recommandation préformée. L’examinateur examine les données et forme un jugement indépendant avant de voir la recommandation du système. C’est ce qu’on appelle l’« examen en aveugle » en recherche clinique. Cela prévient le biais d’ancrage — la tendance cognitive à s’en remettre au premier chiffre vu.

Erreur 2 : L’examen a posteriori. Le système IA prend une décision. La décision est mise en œuvre. L’humain l’examine ensuite. C’est courant dans le service client automatisé : le chatbot répond, l’équipe qualité examine un échantillon de réponses après coup. Les orientations du Groupe de travail Article 29 précisent que l’examen a posteriori n’est pas une supervision conforme à l’article 22 pour les décisions qui « produisent des effets juridiques » ou « affectent de manière significative » la personne concernée. L’humain doit être dans la boucle, pas après la boucle.

La correction : pour les décisions ayant un impact significatif sur l’individu, le système IA génère une recommandation. L’humain examine la recommandation avant qu’elle ne soit mise en œuvre. La décision de l’humain est la décision. La recommandation du système est un input.

Erreur 3 : La surcharge de volume. L’organisation conçoit un processus d’examen effectif, puis le submerge de volume. Cent examens par jour assignés à une seule personne. Le processus est effectif sur le papier. L’exécution est impossible en pratique. Les autorités européennes de protection des données ont traité le tamponnage induit par le volume comme fonctionnellement équivalent au traitement automatisé.

La correction : planification de capacité. Faire correspondre le nombre d’examinateurs au volume de décisions nécessitant un examen, avec un objectif de temps d’évaluation effective par décision. Si le système IA génère plus d’examens que l’équipe humaine ne peut traiter de manière effective, le périmètre du système doit être réduit — pas la qualité de l’examen.

Le problème du biais d’automatisation

Il y a une quatrième erreur que les tendances de mise en application mettent en lumière : le biais d’automatisation.

Le biais d’automatisation, documenté par Parasuraman et Manzey (2010), est la tendance des opérateurs humains à s’appuyer sur les sorties automatisées même quand des informations contradictoires sont disponibles. Le biais est le plus fort quand le système automatisé a un historique de précision — ce qui, paradoxalement, signifie que plus le système IA est performant, moins l’examinateur humain est susceptible de le contredire.

Un taux d’approbation soutenu de 100 % est compatible avec le biais d’automatisation. Le système IA était probablement précis la plupart du temps. L’examinateur a appris à lui faire confiance. À mesure que la confiance s’accumulait, l’examen est devenu sommaire — un coup d’œil à la recommandation, un clic sur « approuver ». L’examinateur n’était pas négligent. Il était humain. Le biais d’automatisation est un schéma cognitif documenté, pas un défaut de caractère.

L’implication pour la conception : une supervision humaine effective doit inclure des contre-mesures au biais d’automatisation. Trois contre-mesures spécifiques :

Contre-mesure 1 : Invites de délibération obligatoires. À intervalles aléatoires — tous les 5 ou 10 examens — le système exige de l’examinateur qu’il saisisse une brève justification de sa décision avant de continuer. La justification n’a pas besoin d’être longue. « D’accord avec la recommandation — données de performance cohérentes avec le schéma historique » suffit. L’objectif est d’interrompre le réflexe d’approbation automatique et d’engager un traitement délibéré (Système 2).

Contre-mesure 2 : Cas de calibration. Le système insère périodiquement des recommandations volontairement incorrectes dans la file d’examen. L’examinateur qui les détecte démontre un engagement actif. L’examinateur qui les approuve démontre un biais d’automatisation. Les cas de calibration servent un double objectif : ils mesurent la qualité de la supervision humaine, et ils entraînent l’examinateur à rester vigilant.

Contre-mesure 3 : Incitations à la dérogation. Le système organisationnel doit suivre et récompenser les dérogations, pas seulement les accords. Un examinateur qui déroge à la recommandation du système avec une justification documentée remplit exactement la fonction que la réglementation exige. Cette fonction doit être visible dans les métriques de performance et valorisée dans les évaluations de performance.

Ces contre-mesures ont un coût d’ingénierie. Elles ont aussi une valeur de conformité que la mise en application de Hambourg a chiffrée à près d’un demi-million d’euros — au minimum.

Le coût de bien faire

Le coût d’ingénierie de l’intégration d’une supervision humaine effective dans un déploiement IA est réel. Pour un déploiement PME typique :

Développement de l’interface d’examen : 2 à 4 semaines d’ingénierie pour construire une interface qui présente les preuves, capture les évaluations de l’examinateur et supporte les flux de dérogation. Coût estimé : 8 000 € à 20 000 €.

Conception du flux de travail : 1 à 2 semaines de conception de processus pour déterminer les volumes d’examen, les qualifications des examinateurs, les chemins d’escalade et la documentation des dérogations. Coût estimé : 4 000 € à 8 000 €.

Formation des examinateurs : 2 à 4 jours de formation par examinateur sur le fonctionnement du système IA, ses limites connues et la méthodologie d’examen. Coût estimé : 2 000 € à 5 000 € par examinateur.

Suivi continu : suivi automatisé des taux de dérogation, des temps d’examen et de la variance des résultats. 1 à 2 jours d’ingénierie pour l’implémentation. Coût estimé : 2 000 € à 4 000 €.

Total : environ 16 000 € à 37 000 € pour un déploiement initial.

Cost of compliance vs non-compliance

L’amende de Hambourg était de 492 000 €. Le coût de bien faire est une fraction du coût de mal faire. Et l’amende de Hambourg est modeste au regard des standards du RGPD — l’article 83 autorise des amendes jusqu’à 20 millions d’euros ou 4 % du chiffre d’affaires annuel mondial.

Ce que « humain dans la boucle » veut dire

« Humain dans la boucle » est l’expression la plus utilisée à la légère dans le déploiement IA. Elle apparaît dans les pitch decks, les documents de conformité et les présentations stratégiques. Elle ne signifie presque jamais ce qu’elle devrait signifier.

Après la mise en application de Hambourg et la Loi sur l’IA de l’UE, « humain dans la boucle » signifie :

L’humain a accès à toutes les preuves que le système a considérées, plus les preuves que le système n’a pas considérées. L’humain a l’autorité pratique de déroger, sans pénalité de processus pour déroger. L’humain a suffisamment de temps pour évaluer chaque cas sur ses mérites. L’humain exerce manifestement un jugement indépendant, attesté par un taux de dérogation non nul. Le système est conçu pour soutenir cette supervision — au niveau de l’interface, du flux de travail et de l’organisation.

Tout ce qui est en-deçà n’est pas humain dans la boucle. C’est humain à proximité.

L’entreprise de Hambourg avait un humain à proximité. Cela lui a coûté un demi-million d’euros et un dossier de conformité qu’elle portera à chaque future interaction réglementaire.

La boucle est précise. La boucle est architecturale. La boucle est une décision de conception, pas une décision de recrutement.

Construisez la boucle.

Le coût d’ingénierie est réel mais borné. Le coût de conformité de ne pas la construire est illimité — 500 000 € à Hambourg, potentiellement des millions sous le cadre de sanctions de la Loi sur l’IA de l’UE. Le coût réputationnel est incalculable — l’entreprise connue pour ses décisions automatisées sans supervision effective porte cette réputation à chaque interaction réglementaire, chaque conversation client, chaque évaluation par un candidat potentiel.

La boucle n’est pas optionnelle. Après la décision de Hambourg, elle n’est pas théorique. C’est une exigence spécifique, documentée, appliquée, avec une sanction spécifique, documentée, appliquée.

Construisez la boucle avant que le régulateur ne construise le dossier. Le coût de la construire se mesure en semaines et en milliers d’euros. Le coût de ne pas la construire se mesure en actions de mise en application et en dossiers de conformité permanents.

Construisez la boucle.

Écrit par

Bertrand

Technologue Créatif

Entrepreneur en série titulaire d'un doctorat en IA, avec vingt-cinq ans à construire des systèmes à travers l'Europe. Il crée du code comme il surfe : en lisant les patterns, en trouvant le flux, en rendant le difficile facile.

← Toutes les notes