I modelli multilingue non sono modelli multiculturali
Le ultime release dei modelli sono arrivate con un’affermazione familiare. Più lingue. Più fluenza. Più benchmark.
I principali modelli ora dichiarano supporto per decine fino a oltre cento lingue. Le pagine di marketing enfatizzano il numero. Il numero è impressionante. Il numero è anche irrilevante rispetto alla domanda che conta.
La domanda non è: il modello sa parlare portoghese?
La domanda è: il modello sa operare nella cultura portoghese?
Fluenza linguistica non è competenza culturale. Un modello che traduce dall’inglese al portoghese con grammatica perfetta, vocabolario accurato e fraseologia dal suono naturale ha raggiunto la fluenza linguistica. Un modello che traduce le pratiche commerciali inglesi nella cultura commerciale portoghese — che adegua i registri di formalità, adatta le assunzioni gerarchiche, calibra i livelli di direttezza e rispetta le aspettative relazionali della comunicazione d’affari portoghese — ha raggiunto la competenza culturale.
Nessun modello attuale fa la seconda.
I cinque divari
Il divario tra multilingue e multiculturale opera su cinque dimensioni specifiche. Non sono astratte — sono osservabili in ogni distribuzione IA interculturale.
Divario 1: Registri di formalità
Ogni lingua contiene registri di formalità — livelli di distanza sociale codificati nel vocabolario, nella grammatica e nel tono. I registri portano un significato culturale che va ben oltre la cortesia.
Il portoghese ha due forme primarie di indirizzo: “tu” (informale) e “você” (formale, anche se meno formale del “o senhor/a senhora” in terza persona). Il portoghese europeo predefinisce “você” nella maggior parte dei contesti professionali. Il portoghese brasiliano predefinisce “você” universalmente ma usa “tu” in alcune regioni con un livello di informalità che non ha equivalente portoghese.
Il tedesco ha “du” (informale) e “Sie” (formale). La scelta tra i due è un contratto sociale. Usare “du” prematuramente in un contesto d’affari tedesco non è un errore grammaticale. È una trasgressione sociale — una violazione del contratto implicito che governa la distanza professionale.
Il giapponese ha più livelli di formalità — il keigo (linguaggio onorifico) da solo contiene tre sotto-sistemi: sonkeigo (rispettoso), kenjougo (umile) e teineigo (cortese). La scelta tra essi dipende dalle posizioni sociali relative di chi parla e chi ascolta, dal contesto della conversazione e dalla storia della relazione. Un chatbot che usa teineigo (la forma cortese più basilare) quando ci si aspetta sonkeigo ha commesso un errore sociale equivalente a un dipendente junior che si rivolge al CEO chiamandolo “amico”.
Gli attuali modelli IA gestiscono i registri di formalità come una funzione di traduzione: l’utente seleziona “formale” o “informale”, e il modello adegua il vocabolario. Questo è l’alfabeto latino della competenza culturale — tecnicamente corretto e strutturalmente insufficiente.
I registri di formalità non sono impostazioni. Sono relazioni. Il registro corretto non è determinato da un’impostazione di preferenza. È determinato da chi parla, chi ascolta, di cosa si discute e quale storia comunicativa esiste tra le parti. Un modello che non sa valutare queste variabili non sa selezionare il registro corretto. Può solo tirare a indovinare — o chiedere all’utente di scegliere, che è l’equivalente di chiedere “Quanto è importante lei?” prima di iniziare una conversazione.
Divario 2: Assunzioni gerarchiche
Quando un modello genera comunicazione d’affari, fa assunzioni sulla gerarchia. Queste assunzioni sono invisibili perché sembrano naturali — alla persona la cui cultura le condivide.
Uno strumento IA che genera un’email da un team lead a un capo dipartimento in inglese predefinisce comunicazione egualitaria: diretta, per nome, da pari a pari. “Hi Sarah, I wanted to share the Q4 results and get your thoughts.”
La stessa comunicazione in giapponese richiede posizionamento gerarchico: riconoscimento della posizione superiore del destinatario, uso di onorifici appropriati, inquadramento indiretto di qualsiasi richiesta, e attenta elusione di qualsiasi formulazione che possa essere letta come presunzione di uguaglianza.
La stessa comunicazione in portoghese brasiliano richiede prima calore e riconoscimento relazionale — un check-in personale prima del contenuto d’affari — ma con più flessibilità sulla gerarchia rispetto al giapponese e più formalità rispetto all’inglese americano.
Il modello sa tradurre le parole. Non sa tradurre la gerarchia. L’email perfettamente appropriata in inglese è socialmente mal calibrata in giapponese e relazionalmente insufficiente in portoghese brasiliano.
Questo non è un fallimento di traduzione. È un fallimento dell’architettura culturale. Il modello genera comunicazione basata sulle norme comunicative apprese dai suoi dati di addestramento — prevalentemente dati in lingua inglese, prevalentemente norme commerciali americane. Quando genera testo in altre lingue, traduce le parole preservando l’architettura comunicativa americana.
Il risultato: testo portoghese perfettamente fluente che suona come se un americano l’avesse scritto in portoghese. Che è esattamente ciò che è successo.
Divario 3: Calibrazione della direttezza
La mappa culturale di Erin Meyer identifica uno spettro di direttezza nella comunicazione d’affari — dai Paesi Bassi (estremamente diretti) al Giappone (estremamente indiretto), con la maggior parte delle culture da qualche parte nel mezzo.
Una cultura a comunicazione diretta dice: “Questa proposta ha tre problemi. Eccoli.”
Una cultura a comunicazione indiretta dice: “Questa proposta mostra un lavoro accurato. Mi chiedo se ci possano essere delle aree dove una riflessione aggiuntiva potrebbe rafforzare l’analisi.”
Entrambe le frasi consegnano lo stesso messaggio: la proposta ha bisogno di revisione. La codifica differisce. L’aspettativa culturale su come il feedback negativo è consegnato differisce. Le conseguenze sociali della violazione dell’aspettativa differiscono.
Gli attuali modelli IA predefiniscono una direttezza moderata — calibrata grossomodo sull’inglese commerciale americano, che si colloca a metà dello spettro di Meyer. Questo default è inoffensivo per le culture moderatamente dirette e offensivo per entrambi gli estremi.
Per un utente olandese, la direttezza moderata del modello sembra evasiva. “Smettila di coprire. Cosa c’è che non va?”
Per un utente giapponese, la direttezza moderata del modello sembra brusca. La valutazione negativa è troppo esplicita. L’utente si aspettava che il modello inquadrasse i problemi come possibilità, non come carenze.
La calibrazione non è una caratteristica linguistica. È una caratteristica culturale. E nessun modello attuale calibra la direttezza in base al contesto culturale dell’utente.
Divario 4: Orientamento temporale
Il modo in cui una cultura si relaziona al tempo influenza il modo in cui comunica su piani, scadenze, impegni e priorità.
Nelle culture monocroniche (Germania, Svizzera, paesi nordici), il tempo è lineare. Gli impegni sono sequenziali. Le scadenze sono assolute. Uno strumento IA che genera un piano di progetto per un team tedesco dovrebbe produrre una sequenza rigida: il compito 1 si completa prima che il compito 2 inizi, con date specifiche e nessuna ambiguità.
Nelle culture policroniche (la maggior parte del Mediterraneo, America Latina, gran parte del Medio Oriente), il tempo è flessibile. Più attività si sovrappongono. Le scadenze sono obiettivi, non assoluti. Le relazioni hanno priorità sugli orari. Uno strumento IA che genera un piano di progetto per un team brasiliano dovrebbe produrre un framework con flessibilità — traguardi piuttosto che scadenze, binari paralleli piuttosto che sequenze rigide, e riconoscimento esplicito che il piano si adatterà man mano che il lavoro progredisce.
Quando un modello multilingue genera un piano di progetto in portoghese, traduce la struttura temporale della tradizione anglosassone di project management — che è monocronica, sequenziale e con scadenze assolute. Il piano è linguisticamente portoghese e culturalmente anglosassone.
Un project manager brasiliano che riceve questo piano non pensa “l’orientamento temporale è sbagliato”. Pensa “questo piano è irrealistico”. Potrebbe persino pensare “questo strumento non capisce come il lavoro viene effettivamente svolto”. Entrambe le valutazioni sono corrette — dalla loro posizione culturale.
Divario 5: Precedenza relazionale
Nelle culture orientate al compito (Stati Uniti, Germania, Paesi Bassi), le interazioni d’affari iniziano con il compito. La relazione si sviluppa attraverso il lavoro. Guadagni fiducia consegnando risultati.
Nelle culture orientate alla relazione (la maggior parte dell’Asia, America Latina, Medio Oriente, gran parte dell’Europa meridionale), le interazioni d’affari iniziano con la relazione. Il compito può procedere solo una volta che la relazione è stabilita. Guadagni il diritto di discutere d’affari investendo prima nella connessione personale.
Uno strumento IA è intrinsecamente orientato al compito. Il modello di interazione è: l’utente presenta un compito, lo strumento lo esegue. Nessun preambolo relazionale. Nessuna connessione personale. Nessun investimento nella relazione prima della transazione.
Nelle culture orientate al compito, questo è efficiente. Nelle culture orientate alla relazione, questo è brusco. Lo strumento che salta la relazione e va direttamente al compito ha violato il protocollo culturale. La violazione non è consapevole — l’utente non pensa “questo strumento ha saltato la fase relazionale”. L’utente sente che l’interazione è fredda, meccanica e inaffidabile.
La stessa sensazione, sperimentata da milioni di utenti nelle culture orientate alla relazione, si aggrega in un divario di adozione misurabile.
Il problema strutturale
I cinque divari condividono una causa strutturale: gli attuali modelli IA sono addestrati prevalentemente su dati in lingua inglese che incorporano norme culturali di lingua inglese. Quando questi modelli generano testo in altre lingue, eseguono traduzione linguistica e conservazione culturale — traducono le parole preservando le assunzioni culturali della lingua di partenza.
Il risultato è linguisticamente multilingue e culturalmente monoculturale.
Un’email commerciale portoghese generata da un modello multilingue si legge come parole portoghesi disposte secondo norme comunicative americane. La grammatica è corretta. Il vocabolario è appropriato. L’architettura culturale — la gerarchia, la formalità, la direttezza, l’orientamento temporale, l’aspettativa relazionale — è americana.
Questo non è un bug. È una limitazione architetturale. Il modello ha appreso norme comunicative dai suoi dati di addestramento. Le norme comunicative dei dati di addestramento sono ponderate verso l’inglese americano. Il modello generalizza quelle norme a tutte le lingue perché non ha appreso che le norme comunicative sono culturalmente variabili.
Il modello sa che il portoghese usa parole diverse dall’inglese. Il modello non sa che la cultura portoghese usa regole comunicative diverse dalla cultura americana.
Cosa richiede la competenza culturale
Un modello IA culturalmente competente dovrebbe conoscere — e applicare — cinque cose che nessun modello attuale conosce:
Il contesto culturale dell’utente. Non la sua lingua. La sua cultura. Un parlante portoghese a Lisbona ha aspettative comunicative diverse da un parlante portoghese a San Paolo. La lingua è la stessa. La cultura no.
Il registro di formalità appropriato. In base al contesto culturale dell’utente, all’interazione specifica (email interna vs proposta per un cliente vs risposta a un consumatore), e alla relazione tra le parti. Il registro non è un’impostazione. È un giudizio.
Il livello di direttezza appropriato. In base al contesto culturale e allo scopo comunicativo specifico. Il feedback positivo in olandese dovrebbe essere diretto. Il feedback negativo in giapponese dovrebbe essere indiretto. Il modello dovrebbe sapere quale calibrazione applicare senza che gli venga detto.
L’inquadramento temporale appropriato. Piani, impegni e scadenze dovrebbero essere inquadrati secondo l’orientamento culturale del pubblico. Inquadramento monocronico per le culture monocroniche. Inquadramento policronico per le culture policroniche.
Il preambolo relazionale appropriato. Nelle culture orientate alla relazione, l’interazione dovrebbe iniziare con un riconoscimento relazionale. Nelle culture orientate al compito, l’interazione dovrebbe iniziare con il compito. Il modello dovrebbe sapere quale fare.
Queste cinque capacità non sono capacità linguistiche. Sono capacità culturali. Richiedono un tipo diverso di addestramento — non su più testo in più lingue, ma sui sistemi culturali che governano come il testo funziona in società diverse.
Il problema dei dati di addestramento
La causa strutturale merita un esame più approfondito. Perché i modelli multilingue predefiniscono norme culturali americane?
La risposta è nei dati di addestramento. I modelli linguistici di grandi dimensioni sono addestrati su testo proveniente da internet. Internet è prevalentemente in inglese — secondo alcune stime, il 55-60% di tutto il contenuto web è in inglese. Il contenuto in inglese è prevalentemente americano per origine e orientamento culturale. I dati di addestramento, quindi, incorporano i modelli comunicativi americani come norma statistica.
Quando il modello genera testo in portoghese, ha appreso vocabolario e grammatica portoghese da testo in lingua portoghese. Ma i modelli pragmatici — come formulare una richiesta, come calibrare la formalità, come segnalare la gerarchia — sono ponderati verso i modelli più comuni nei dati di addestramento. I modelli più comuni in un corpus prevalentemente americano sono i modelli comunicativi americani. Il modello generalizza questo modello ad altre lingue perché ha appreso che il modello “funziona” — nel senso che appare frequentemente in testo di alta qualità.
Questo non è un pregiudizio deliberato. È un artefatto statistico. Il modello apprende il modello più comune. Il modello più comune in un corpus di addestramento prevalentemente americano è il modello comunicativo americano. Il modello generalizza questo modello ad altre lingue perché ha appreso che il modello “funziona” — nel senso che appare frequentemente in testo di alta qualità.
La soluzione non è aggiungere più testo portoghese ai dati di addestramento. Più testo portoghese insegna al modello un vocabolario e una grammatica portoghesi migliori. Non insegna al modello la pragmatica culturale portoghese — perché la pragmatica culturale è raramente esplicitata nel testo. Nessuno scrive “sto usando ora il registro formale perché il mio interlocutore è un collega senior e questo è un contesto professionale”. Il registro è semplicemente usato. Il modello deve dedurre le regole pragmatiche dal testo, e la deduzione è debole quando i modelli pragmatici sono impliciti e culturalmente variabili.
La competenza culturale nei modelli IA richiederà un approccio di addestramento diverso: annotazione culturale esplicita, instruction tuning culturale, o sistemi con retrieval augmentation che accedano a basi di conoscenza culturali. Questi approcci esistono nella ricerca. Non esistono in produzione.
Fino a quando non esisteranno, ogni modello multilingue genererà testo che parla la lingua e ignora la cultura. Il problema non è la capacità linguistica del modello. Sono i dati di addestramento culturale del modello — vale a dire, il suo addestramento culturale è assente.
La conseguenza di mercato
Il divario tra multilingue e multiculturale ha una conseguenza di mercato. Le aziende che distribuiscono strumenti IA nei mercati europei la sperimentano come varianza nell’adozione che correla con la distanza culturale.
Lo stesso strumento IA distribuito nell’UE produce tassi di adozione diversi in paesi diversi. La varianza correla più fortemente con la distanza culturale dal contesto di sviluppo (tipicamente inglese americano) che con il PIL, il livello di digitalizzazione o la consapevolezza sull’IA.
Lo strumento funziona bene nei Paesi Bassi, in Danimarca e in Germania — culture a basso contesto, orientate al compito, con direttezza moderata e alta digitalizzazione. Lo strumento sottoperforma in Portogallo, Spagna, Italia e Grecia — culture a più alto contesto, più orientate alla relazione, con più alta avversione all’incertezza. La capacità linguistica dello strumento è equivalente in tutti i mercati. La calibrazione culturale è uniforme — e uniformemente americana.
Il divario di adozione non è spiegato dai fattori convenzionali. È spiegato dal divario culturale — la distanza tra le assunzioni culturali incorporate nello strumento e le aspettative culturali dell’utente.
Il principio
Multilingue è un problema risolto. I modelli parlano 95 lingue. I benchmark migliorano a ogni release. La fluenza è notevole.
Multiculturale è un problema irrisolto. I modelli parlano 95 lingue e comunicano in una sola cultura. Le assunzioni culturali del contesto di sviluppo — formalità americana, direttezza americana, gerarchia americana, temporalità americana, orientamento al compito americano — sono incorporate nei modelli comunicativi del modello ed esportate in ogni mercato.
Il divario tra multilingue e multiculturale è il divario tra parlare e comprendere. Tra tradurre e comunicare. Tra distribuire uno strumento in un mercato e servire un mercato.
La lingua è la superficie. La cultura è il sistema.
I modelli hanno padroneggiato la superficie. Non hanno iniziato il sistema.
In Bluewaves, ogni distribuzione inizia con il sistema culturale, non con la lingua. Quando distribuiamo uno strumento IA per un cliente portoghese, non partiamo dal modello linguistico portoghese. Partiamo dal contesto culturale portoghese: le aspettative di formalità, la precedenza relazionale, la tolleranza all’incertezza, l’orientamento temporale, le assunzioni gerarchiche. Progettiamo il modello di interazione per la cultura. Poi distribuiamo il modello nella lingua.
La sequenza conta. La lingua è l’ultima decisione, non la prima. La cultura è l’architettura. La lingua è l’interfaccia. Un architetto che progetta l’interfaccia prima dell’architettura produce un prodotto che sembra giusto e si comporta male.
I modelli parlano 95 lingue. Bluewaves opera in otto culture. La distinzione è la disciplina. La disciplina è la differenza tra distribuzione e distribuzione che funziona.