Érica 24. März 2026

Die Intensivierungsfalle

14 Min. Lesezeit

Das Versprechen war einfach. Die KI übernimmt die Routinearbeit. Sie übernehmen die kreative Arbeit. Die Maschine nimmt Ihnen die repetitiven Aufgaben ab, und Sie nutzen die freigewordene Zeit zum Denken, für Strategie, für die Arbeit, die nur Menschen leisten können. Alle gewinnen. Die Produktivitätsgewinne sind real und der Arbeitstag wird leichter.

Das war das Versprechen. Hier ist, was tatsächlich geschah.

Im Februar 2026 veröffentlichten Aruna Ranganathan und Xingqi Maggie Ye die Ergebnisse einer achtmonatigen ethnographischen Studie in der Harvard Business Review. Ye, Doktorandin an der Haas School of Business der UC Berkeley, hatte sich in ein US-amerikanisches Technologieunternehmen mit etwa zweihundert Mitarbeitern integriert. Sie beobachtete sie zweimal wöchentlich, verfolgte ihre Kommunikationskanäle und führte mehr als vierzig ausführliche Interviews in den Bereichen Entwicklung, Produkt, Design, Forschung und Betrieb. Die Studie umfasste den Zeitraum von April bis Dezember.

Das Ergebnis war nicht das, was die Produktivitätserzählung vorhergesagt hatte. Mitarbeiter, die KI-Tools nutzten, arbeiteten nicht weniger. Sie arbeiteten mehr. Schneller. Sie übernahmen ein breiteres Aufgabenspektrum. Sie dehnten die Arbeit auf Zeiten aus, die zuvor leer waren — Mittagspausen, Abende, die zehn Minuten vor einem Meeting. Das Werkzeug, das Spielraum schaffen sollte, verbrauchte ihn.

Ranganathan und Ye identifizierten drei Formen der Intensivierung. Die erste war die Umfangserweiterung: Menschen begannen, Arbeit zu übernehmen, die zuvor jemand anderem gehört hätte oder die gar nicht erst versucht worden wäre. Die Definition von „meine Arbeit” weitete sich aus. Die zweite war die Grenzauflösung: Weil KI es leicht macht, Aufgaben zu beginnen und fortzusetzen, sickerte die Arbeit in Momente ein, die zuvor als Pausen funktionierten. Ein Prompt während des Mittagessens. Eine Abfrage vor dem Schlafengehen. Die natürlichen Haltepunkte des Arbeitstages lösten sich auf. Die dritte war die Parallelverarbeitung: Mitarbeiter hielten mehrere Stränge gleichzeitig am Laufen, führten KI-Prozesse im Hintergrund aus, während sie an Meetings teilnahmen, Code überprüften oder Dokumente verfassten.

Nichts davon war angeordnet. Niemand sagte diesen Mitarbeitern, sie sollten mehr arbeiten. Die Intensivierung war freiwillig — oder schien es zu sein. Das Werkzeug machte das Mehr-Tun möglich, zugänglich und im Moment belohnend. Also taten die Menschen mehr. Und das Mehr-Tun wurde zur neuen Grundlinie.

Das Jevons-Paradoxon der Arbeit

Dieses Muster hat einen Namen, auch wenn er aus einem anderen Jahrhundert und von einer anderen Ressource stammt. 1865 beobachtete der englische Ökonom William Stanley Jevons, dass James Watts Verbesserungen an der Dampfmaschine — die die Effizienz der Kohlenutzung dramatisch steigerten — nicht zu einer Reduktion des Kohleverbrauchs führten. Sie führten zu einem Anstieg. Die Maschine war effizienter pro Arbeitseinheit, also wurde es wirtschaftlich, sie für mehr Arbeit einzusetzen. Der Gesamtkohleverbrauch stieg, nicht sank.

Das Jevons-Paradoxon — die Erkenntnis, dass Effizienzgewinne bei der Ressourcennutzung zu einem erhöhten Gesamtverbrauch dieser Ressource führen — handelte von Kohle. Aber der Mechanismus handelt von Anreizen, und Anreize kümmern sich nicht darum, an welche Ressource sie sich heften.

KI ist die Wattsche Maschine der kognitiven Arbeit. Sie macht jede Einheit Wissensarbeit effizienter. Ein Entwurf, der zwei Stunden dauerte, dauert vierzig Minuten. Eine Datenanalyse, die einen Spezialisten erforderte, kann nun von einem Generalisten mit dem richtigen Prompt angenähert werden. Ein Bericht, der nicht geschrieben worden wäre — weil die Kosten den wahrgenommenen Wert überstiegen — wird nun geschrieben, weil die Kosten unter die Schwelle gefallen sind.

Die Effizienz pro Aufgabe ist real. Ranganathan und Ye bestreiten sie nicht. Das Paradoxon ist, dass die Effizienz pro Aufgabe, aggregiert über eine Organisation, die Produktionsvolumen misst, Intensivierung produziert, nicht Entlastung. Die Gesamtmenge kognitiver Arbeit steigt. Der Arbeitstag wird dichter, nicht kürzer. Das Laufband beschleunigt.

Das ist kein Technologieversagen. Die Technologie tat genau das, wofür sie entwickelt wurde. Das ist ein Versagen des Anreizdesigns. Die organisatorischen Systeme, die die Technologie umgeben, belohnen Produktionsvolumen. Wenn ein Werkzeug es ermöglicht, mehr zu produzieren, absorbiert das System den Anstieg. Die freigewordene Zeit wird nicht an den Mitarbeiter zurückgegeben. Sie wird in mehr Arbeit reinvestiert — automatisch, strukturell, ohne dass jemand eine bewusste Entscheidung zur Intensivierung trifft.

Die Metrik belohnt Intensivierung

Charles Goodhart, ein britischer Ökonom, formulierte 1975 ein Prinzip, das zu einer der meistzitierten Beobachtungen im Organisationsdesign geworden ist: „Wenn eine Kennzahl zum Ziel wird, hört sie auf, eine gute Kennzahl zu sein.” Goodhart schrieb über Geldpolitik, aber das Prinzip gilt überall dort, wo Metriken Verhalten bestimmen.

Die meisten Organisationen messen Produktivität als Output pro Zeiteinheit. Erledigte Aufgaben. Gelöste Tickets. Produzierte Dokumente. Geschriebene Codezeilen. Gesendete E-Mails. Die Metrik ist Volumen.

Wenn KI in dieses System eintritt, steigt das Volumen. Die Metrik verbessert sich. Dashboards werden grün. Quartalsberichte feiern die Produktivitätsgewinne. Und niemand fragt, ob die Menschen, die den Output produzieren, härter arbeiten, mehr denken oder weniger ruhen — weil die Metrik die kognitive Belastung nicht erfasst. Sie erfasst Volumen. Und das Volumen ist gestiegen.

Das Upwork Research Institute befragte in Partnerschaft mit Workplace Intelligence 2024 weltweit 2.500 Arbeitnehmer — darunter 1.250 Führungskräfte der C-Ebene. Die Haupterkenntnis: 77 Prozent der Mitarbeiter, die KI nutzen, sagten, die Tools hätten ihre Arbeitsbelastung erhöht. Nicht reduziert. Erhöht. Die Quellen der zusätzlichen Belastung waren spezifisch: 39 Prozent berichteten, mehr Zeit mit der Überprüfung oder Moderation KI-generierter Inhalte zu verbringen. 23 Prozent berichteten, mehr Zeit in das Erlernen der Tools zu investieren. 21 Prozent berichteten, dass ihnen als direktes Ergebnis der KI mehr Arbeit aufgetragen wurde.

Die Führungskräfte waren unterdessen begeistert. 96 Prozent äußerten hohe Erwartungen, dass KI die Produktivität steigern werde. Die Kluft zwischen der Erwartung der Führungskräfte und der Erfahrung der Mitarbeiter ist kein Kommunikationsproblem. Es ist ein Messproblem. Die Führungskräfte schauen auf die Volumenmetrik. Die Metrik ist gestiegen. Die Mitarbeiter leben innerhalb der Volumenmetrik. Das Volumen ist gestiegen, weil sie mehr Arbeit leisten.

Goodharts Gesetz sagt dies präzise voraus. Die Organisation machte das Produktionsvolumen zum Ziel. Die Metrik verbesserte sich. Und die Metrik hörte auf, eine gute Messgröße dessen zu sein, was sie angeblich darstellte — nämlich nicht Volumen, sondern Wert pro Einheit menschlicher Anstrengung.

Was die KI zurücklässt

Es gibt eine subtilere Dimension der Intensivierung, die die Volumenmetriken völlig übersehen.

Wenn KI die Routineaufgaben übernimmt — den ersten Entwurf, die Datenextraktion, die Vorlage, die Zusammenfassung — ist das, was für den Menschen bleibt, nicht Routine. Es ist der schwierige Teil. Die Urteilsentscheidungen. Die Ambiguität. Die Entscheidungen, die Kontext, Nuancen und Domänenwissen erfordern, das das Modell nicht hat.

Das ist der kognitive Rückstand KI-unterstützter Arbeit. Die leichten Aufgaben sind automatisiert. Die schwierigen Aufgaben bleiben. Und die schwierigen Aufgaben sind jetzt schwieriger — nicht weil sie sich verändert haben, sondern weil die leichten Aufgaben kognitive Erholung boten. Die Routinearbeit war eine Pause. Keine aufregende Pause, keine erholsame Pause im bewussten Sinne, aber eine Phase geringerer kognitiver Anforderung, die dem Gehirn erlaubte, sich zwischen Episoden anspruchsvollen Denkens zu erholen.

Daniel Kahnemans Unterscheidung zwischen System 1 (schnell, automatisch, wenig Aufwand) und System 2 (langsam, bewusst, hoher Aufwand) ist hier nützlich. Routineaufgaben leben in System 1. Urteilsaufgaben leben in System 2. System 2 ist metabolisch teuer — es verbraucht Glukose, es produziert Ermüdung, es hat ein begrenztes Tagesbudget. Ein Arbeitstag, der System-1- und System-2-Aufgaben mischt, ist nachhaltig. Ein Arbeitstag, der überwiegend System 2 ist — weil die System-1-Aufgaben automatisiert wurden — ist bei gleicher Dauer nicht nachhaltig.

Die Workday-Studie, durchgeführt mit Hanover Research und veröffentlicht im Januar 2026, ergab, dass 37 Prozent der durch KI eingesparten Zeit durch Nacharbeit verloren ging — Fehler korrigieren, Ergebnisse verifizieren, Inhalte umschreiben, die Qualitäts- oder Kontextanforderungen nicht erfüllten. 77 Prozent der Mitarbeiter überprüften KI-generierte Arbeit genauso sorgfältig oder sorgfältiger als von Menschen erledigte Arbeit. Nur 14 Prozent berichteten konsistent über netto-positive Ergebnisse der KI-Nutzung.

Die Nacharbeit ist System-2-Arbeit. KI-Output zu bewerten erfordert Urteil, Vergleich, Verifizierung — alles anspruchsvoll, alles metabolisch teuer, alles aus demselben begrenzten kognitiven Budget schöpfend, das die „freigewordene” Zeit angeblich auffüllen sollte. Der Mitarbeiter sparte vierzig Minuten beim Entwurf und verbrachte fünfundzwanzig Minuten mit der Verifizierung des Outputs. Die Nettoersparnis beträgt fünfzehn Minuten. Aber das kognitive Profil dieser fünfundzwanzig Minuten ist anspruchsvoller als die vierzig Minuten, die sie ersetzten, weil die Überprüfung fremder Arbeit auf unvorhersehbare Fehler mehr anhaltende Aufmerksamkeit erfordert als die Erstellung von Arbeit nach einem bereits bekannten Muster.

Die Volumenmetrik sieht fünfzehn eingesparte Minuten. Der präfrontale Kortex des Mitarbeiters sieht fünfundzwanzig Minuten hochanspruchsvoller Verifizierung, die einem bereits gesättigten Tag hinzugefügt werden.

Die Anforderungs-Kontroll-Kollision

Robert Karaseks Anforderungs-Kontroll-Modell, entwickelt 1979 und über vier Jahrzehnte arbeitsmedizinischer Forschung verfeinert, beschreibt Arbeitsstress als die Wechselwirkung zweier Variablen: die Anforderungen an den Arbeitnehmer und die Kontrolle, die der Arbeitnehmer darüber hat, wie er diese Anforderungen erfüllt.

Hohe Anforderungen kombiniert mit hoher Kontrolle erzeugen aktive Arbeit — herausfordernd, nachhaltig und mit Lernen und beruflicher Entwicklung verbunden. Hohe Anforderungen kombiniert mit geringer Kontrolle erzeugen Hochbelastungsarbeit — die Konfiguration, die am stärksten mit Burnout, Herz-Kreislauf-Erkrankungen und chronischem Stress assoziiert ist.

KI-unterstützte Arbeit, wie Ranganathan und Ye sie dokumentierten, ist zunehmend anforderungsreich. Der Umfang ist breiter. Das Tempo ist schneller. Die Grenzen haben sich aufgelöst. Die kognitive Belastung pro Stunde ist höher, weil die Routineaufgaben verschwunden sind und die Urteilsaufgaben bleiben.

Die Kontrolldimension ist der Punkt, an dem sich die Falle schließt. In den meisten Organisationen kontrolliert der einzelne Mitarbeiter nicht die Volumenziele. Er bestimmt nicht die Output-Erwartungen. Er entscheidet nicht, wie die durch KI eingesparte Zeit zugeteilt wird. Die Zeiteinsparungen werden automatisch vom System absorbiert — durch das nächste Ticket in der Warteschlange, das nächste Projekt, das machbar wird, den nächsten Bericht, den jemand anfordert, weil „die KI das schnell erledigen kann.”

Hohe Anforderungen. Geringe Kontrolle. Karaseks Modell sagt Belastung voraus. Die Vorhersage ist nicht theoretisch. PwCs 29. Global CEO Survey, veröffentlicht im Januar 2026 und 4.454 CEOs in 95 Ländern umfassend, ergab, dass 56 Prozent keinen signifikanten finanziellen Nutzen aus ihren KI-Investitionen berichteten. Nur 12 Prozent berichteten sowohl Kosten- als auch Umsatzverbesserungen. Die Investition produziert Intensivierung auf Mitarbeiterebene, ohne Rendite auf Organisationsebene zu erzeugen. Das Laufband ist schneller, aber das Gebäude hat sich nicht bewegt.

Der Anreiz, den niemand neu gestaltete

Hier ist der Satz, den ich festhalten möchte: Das Problem ist nicht die KI. Das Problem ist die Anreizstruktur, die die KI umgibt.

Wenn eine Organisation ein KI-Tool einsetzt und dessen Auswirkung über das Produktionsvolumen misst, hat die Organisation eine Intensivierungsmaschine gebaut. Nicht absichtlich. Nicht böswillig. Strukturell. Das Werkzeug steigert die Effizienz pro Aufgabe. Die Metrik belohnt Volumen. Das Volumen steigt. Die Mitarbeiter absorbieren den Anstieg. Der Zyklus setzt sich fort.

Der Ausweg aus der Falle ist nicht, das Werkzeug zu entfernen. Das Werkzeug funktioniert. Die Effizienz pro Aufgabe ist echt. Der Ausweg ist, den Anreiz neu zu gestalten.

Das erfordert, etwas anderes zu messen. Nicht Produktionsvolumen. Wert des Outputs pro Einheit kognitiver Anstrengung. Das ist schwieriger zu messen als Volumen — was genau der Grund ist, warum Organisationen auf Volumen zurückgreifen. Volumen ist leicht zu zählen. Kognitive Anstrengung nicht. Aber Goodharts Gesetz ist klar: Die einfache Metrik, einmal zum Ziel erklärt, hört auf zu messen, was zählt.

Wie würde es aussehen, anders zu messen?

Es würde bedeuten, nicht zu verfolgen, wie viele Berichte das Team produziert hat, sondern welche Berichte zu Entscheidungen geführt haben. Nicht wie viele Tickets gelöst wurden, sondern welche Lösungen Bestand hatten — welche nicht innerhalb von dreißig Tagen als wiedereröffnete Probleme zurückkehrten. Nicht wie viele Dokumente verfasst wurden, sondern welche Dokumente gelesen, zitiert und verwendet wurden. Die Metrik verschiebt sich von Produktion zu Wirkung.

Es würde auch bedeuten, die kognitive Belastung direkt zu verfolgen. Nicht als Wellness-Initiative — als operative Variable. Die Workday-Studie ergab, dass fast neun von zehn Unternehmen weniger als die Hälfte ihrer Stellen aktualisiert hatten, um KI-Fähigkeiten widerzuspiegeln. Nur 37 Prozent der intensiven KI-Nutzer erhielten zusätzliche Schulung. Die Organisationen setzen Werkzeuge ein, ohne die Stellen neu zu gestalten, die diese Werkzeuge verändern. Das Anforderungsprofil der Stelle hat sich verschoben — mehr Urteil, weniger Routine — aber die Stellenbeschreibung, die Leistungsmetriken und das erwartete Produktionsvolumen haben sich nicht verändert.

Die Stelle ist neu. Der Anreiz ist alt. Die Lücke zwischen beiden ist die Intensivierungsfalle.

Die Laufband-Metapher

Ich komme immer wieder auf das Bild eines Laufbands zurück — nicht weil es clever ist, sondern weil es präzise ist.

Ein Laufband erhöht Ihre Geschwindigkeit, ohne Ihren Standort zu ändern. Sie laufen schneller. Ihre Herzfrequenz steigt. Ihre Muskeln arbeiten härter. Sie schwitzen. Und am Ende sind Sie genau an derselben Stelle, an der Sie angefangen haben.

KI-unterstützte Arbeit unter der aktuellen Anreizstruktur ist ein Laufband. Die Geschwindigkeit pro Aufgabe steigt. Das Volumen steigt. Die kognitive Anstrengung steigt. Und die Ergebnisse — gemessen auf Organisationsebene — verbessern sich nicht proportional. PwCs Daten sind eindeutig: 56 Prozent der CEOs berichten keinen finanziellen Nutzen. Das Laufband läuft. Das Gebäude bewegt sich nicht.

Das Laufband ist nicht defekt. Es funktioniert genau wie konzipiert. Das Problem ist, dass niemand gefragt hat, ob ein Laufband die richtige Maschine für das Ziel war. Wenn das Ziel ist, voranzukommen — mehr Wert zu schaffen, nicht mehr Volumen — braucht man eine andere Maschine. Eine Maschine, die Wirkung belohnt, nicht Durchsatz. Eine Maschine, die die Qualität der Entscheidungen misst, nicht die Menge der Outputs.

Das Laufband misst Schritte. Das Ziel erfordert Richtung.

Was Organisationen tun können

Ich bin vorsichtig mit präskriptiven Listen. Sie reduzieren komplexe Probleme auf Handlungspunkte, und Handlungspunkte ohne Kontext sind Goodharts Gesetz im Wartestand — die Liste wird zum Ziel, das Ziel hört auf, nützlich zu sein. Aber es gibt strukturelle Interventionen, die die Anreizlandschaft verändern, statt nur Aufgaben hinzuzufügen.

Neu definieren, wofür die KI-Zeiteinsparungen da sind. Wenn KI einem Team acht Stunden pro Woche einspart, müssen diese acht Stunden explizit zugeteilt werden — und die Zuteilung darf nicht standardmäßig „mehr derselben Arbeit” sein. Die Optionen umfassen: Zeit für tiefes Denken (ungeplante, unüberwachte Blöcke für komplexe Problemlösung), Kompetenzentwicklung (Lernen, das nicht direkt produktiv ist, aber zukünftige Kapazität aufbaut), Erholung (kognitive Ruhe, die die kumulative Belastung reduziert und das Burnout verhindert, das Karaseks Modell vorhersagt). Die Zuteilung ist eine Designentscheidung. Wenn die Organisation sie nicht trifft, wird das System sie für sie treffen — und das System greift standardmäßig auf mehr Volumen zurück.

Die Volumenmetrik von der Leistungsmetrik trennen. Volumen ist ein Aktivitätsmaß. Es sagt, was passiert ist. Es sagt nicht, was es wert war. Leistungsmetriken sollten Ergebnisse verfolgen: getroffene Entscheidungen, gelöste Probleme, aufrechterhaltene Qualität, vermiedene Fehler. Diese sind schwieriger zu zählen. Diese Schwierigkeit ist der Punkt. Einfache Metriken produzieren Goodharts Gesetz. Schwierige Metriken produzieren Information.

Stellen neu gestalten, um KI-unterstützte Arbeit widerzuspiegeln. Wenn KI die Routine übernimmt, ist die Stelle jetzt eine Urteilsstelle. Urteilsstellen erfordern andere Kompetenzen, andere Schulung, andere kognitive Profile und andere Erholungsmuster. Eine Stelle, die zu 60 Prozent Routine und zu 40 Prozent Urteil war, ist jetzt zu 20 Prozent Routine und zu 80 Prozent Urteil. Die Leistungserwartungen, die Schulung und die Belastungsziele müssen diesen Wandel widerspiegeln. Das tun sie fast nie.

Die kognitive Belastung sichtbar machen. Nicht als Wellness-Initiative im HR-Portal. Als operatives Dashboard neben den Volumenmetriken. Wenn Führungskräfte sehen können, dass das Volumen gestiegen ist und die kognitive Belastung gestiegen ist, ändert sich das Gespräch. Die Intensivierung wird sichtbar. Und sichtbare Probleme sind leichter anzugehen als unsichtbare.

Die Integration

Hier ist die Spannung, die ich halten möchte, ohne sie aufzulösen.

KI-Tools sind genuineffizient. Sie reduzieren die Zeit und den Aufwand für spezifische Aufgaben. Die Verbesserung pro Aufgabe ist messbar und real. Ranganathan und Ye fanden nicht, dass KI in ihrer vorgesehenen Funktion versagt. Sie fanden, dass sie Erfolg hat — und der Erfolg, im Kontext volumenbasierter Anreize, ein Paradoxon erzeugt, das den Menschen schadet, die die Arbeit tun.

Das Werkzeug ist nicht die Falle. Der Anreiz ist die Falle. Das Werkzeug ist ein Laufband. Ob es Sie voranbringt oder auf der Stelle laufen lässt, hängt vollständig vom System ab, in dem es sich befindet.

Organisationen, die KI einsetzen, ohne ihre Anreizstrukturen neu zu gestalten, werden Intensivierung bekommen. Nicht weil die KI fehlerhaft ist, sondern weil das Organisationsdesign für eine Metrik optimiert ist, die KI leicht aufblähen lässt. Die Metrik steigt. Die Menschen innerhalb der Metrik werden müder. Die Ergebnisse, auf der Ebene, die zählt — finanzielle Rendite, nachhaltige Leistung, Mitarbeiterwohl — verbessern sich nicht.

Organisationen, die den Anreiz neu gestalten — die Wirkung statt Volumen messen, die eingesparte Zeit bewusst zuteilen, die den kognitiven Wandel von Routinearbeit zu Urteilsarbeit anerkennen — werden etwas anderes bekommen. Nicht unbedingt mehr Output. Möglicherweise weniger Output, dem Volumen nach. Aber bessere Entscheidungen. Weniger Fehler. Nachhaltiges Tempo. Und Werkzeuge, die Menschen nutzen, weil die Werkzeuge ihre Arbeit besser machen, nicht weil die Werkzeuge ihre Arbeit mehr machen.

Die Intensivierungsfalle ist kein Technologieproblem. Es ist ein Anreizdesignproblem im Technologiekostüm. Die Technologie tat, was man von ihr verlangte. Die Frage ist, was die Organisation von ihr verlangte — und ob irgendjemand daran dachte, die Menschen, die die Arbeit tun, zu fragen, ob „mehr, schneller” die richtige Antwort war.

Das Laufband läuft. Die Frage ist nicht, ob man absteigen soll. Die Frage ist, ob man das Ziel ändern soll.

Geschrieben von

Érica

Organisationspsychologin

Sie weiß, warum Menschen Werkzeuge ablehnen — und wie man Werkzeuge entwickelt, die sie lieben werden. Wenn Érica spricht, ändern Unternehmen ihre Richtung. Nicht durch Überzeugung. Durch Verstehen.

← Alle Notizen