Flerspråkiga modeller är inte multikulturella modeller
De senaste modellreleaserna kom med ett välbekant påstående. Fler språk. Mer flyt. Fler benchmarks.
De stora modellerna hävdar nu stöd för dussintals till över hundra språk. Marknadsföringssidor betonar antalet. Antalet är imponerande. Antalet är också irrelevant för den fråga som spelar roll.
Frågan är inte: kan modellen tala portugisiska?
Frågan är: kan modellen verka i portugisisk kultur?
Språklig flyt är inte kulturell kompetens. En modell som översätter engelska till portugisiska med perfekt grammatik, korrekt ordförråd och naturligt klingande frasering har uppnått språklig flyt. En modell som översätter engelska affärspraxis till portugisisk affärskultur — som justerar formalitetsregister, anpassar hierarkiantaganden, kalibrerar direkthetsnivåer och respekterar de relationella förväntningarna i portugisisk affärskommunikation — har uppnått kulturell kompetens.
Ingen nuvarande modell gör det andra.
De fem gapen
Gapet mellan flerspråkig och multikulturell verkar över fem specifika dimensioner. Dessa är inte abstrakta — de är observerbara i varje tvärkulturell AI-distribution.
Gap 1: Formalitetsregister
Varje språk innehåller formalitetsregister — nivåer av social distans kodade i ordförråd, grammatik och ton. Registren bär kulturell mening som sträcker sig långt bortom artighet.
Portugisiska har två primära tilltalformer: “tu” (informell) och “você” (formell, fast mindre formell än tredje person “o senhor/a senhora”). Europeisk portugisiska har “você” som standard i de flesta professionella sammanhang. Brasiliansk portugisiska har “você” som universell standard men använder “tu” i vissa regioner med en grad av informalitet som saknar portugisisk motsvarighet.
Tyska har “du” (informell) och “Sie” (formell). Valet mellan dem är ett socialt kontrakt. Att använda “du” för tidigt i en tysk affärskontext är inte ett grammatiskt fel. Det är en social överträdelse — ett brott mot det implicita kontrakt som styr professionell distans.
Japanska har flera formalitetsnivåer — keigo (honorifikt språk) ensamt innehåller tre undersystem: sonkeigo (respektfullt), kenjougo (ödmjukt) och teineigo (artigt). Valet mellan dem beror på de relativa sociala positionerna hos talare och lyssnare, samtalets kontext och relationshistoriken. En chatbot som använder teineigo (den mest grundläggande artiga formen) när sonkeigo förväntas har begått ett socialt fel motsvarande att en junioranställd tilltalade VD:n som “kompis.”
Nuvarande AI-modeller hanterar formalitetsregister som en översättningsfunktion: användaren väljer “formellt” eller “informellt,” och modellen justerar sitt ordförråd. Det är kulturell kompetens på det latinska alfabetets nivå — tekniskt korrekt och strukturellt otillräckligt.
Formalitetsregister är inte inställningar. De är relationer. Det korrekta registret bestäms inte av en preferensinställning. Det bestäms av vem som talar, vem som lyssnar, vad som diskuteras och vilken kommunikationshistorik som finns mellan parterna. En modell som inte kan bedöma dessa variabler kan inte välja rätt register. Den kan bara gissa — eller be användaren välja, vilket är detsamma som att fråga “Hur viktig är du?” innan man inleder ett samtal.
Gap 2: Hierarkiantaganden
När en modell genererar affärskommunikation gör den antaganden om hierarki. Dessa antaganden är osynliga eftersom de känns naturliga — för den vars kultur delar dem.
Ett AI-verktyg som genererar ett mejl från en teamledare till en avdelningschef på engelska faller tillbaka på jämlik kommunikation: direkt, förnamn, jämbördig. “Hi Sarah, I wanted to share the Q4 results and get your thoughts.”
Samma kommunikation på japanska kräver hierarkisk positionering: erkännande av mottagarens överordnade position, användning av lämpliga honorifika, indirekt inramning av varje förfrågan och noggrann undvikande av varje formulering som kan läsas som att man förutsätter jämlikhet.
Samma kommunikation på brasiliansk portugisiska kräver värme och relationellt erkännande först — en personlig incheckning före affärsinnehållet — men med mer flexibilitet kring hierarki än japanska och mer formalitet än amerikansk engelska.
Modellen kan översätta orden. Den kan inte översätta hierarkin. Mejlet som är helt lämpligt på engelska är socialt felkalibrerat på japanska och relationellt otillräckligt på brasiliansk portugisiska.
Det här är inte ett översättningsfel. Det är ett kulturellt arkitekturfel. Modellen genererar kommunikation baserat på kommunikationsnormer den lärt sig från sin träningsdata — övervägande engelskspråkig data, övervägande amerikanska affärsnormer. När den genererar text på andra språk översätter den orden men bevarar den amerikanska kommunikationsarkitekturen.
Resultatet: perfekt flytande portugisisk text som låter som om en amerikan skrev den på portugisiska. Vilket är exakt vad som hände.
Gap 3: Direkthetskalibrering
Erin Meyers kulturkarta identifierar ett spektrum av direkthet i affärskommunikation — från Nederländerna (extremt direkt) till Japan (extremt indirekt), med de flesta kulturer någonstans mittemellan.
En direkt kommunikationskultur säger: “Det här förslaget har tre problem. Här är de.”
En indirekt kommunikationskultur säger: “Det här förslaget visar noggrant arbete. Jag undrar om det kanske finns några områden där ytterligare eftertanke skulle kunna stärka analysen.”
Båda meningarna levererar samma budskap: förslaget behöver revideras. Kodningen skiljer sig. Den kulturella förväntningen på hur negativ feedback levereras skiljer sig. De sociala konsekvenserna av att bryta mot förväntningen skiljer sig.
Nuvarande AI-modeller har en standardinställning på måttlig direkthet — ungefärligen kalibrerad mot amerikansk affärsengelska, som befinner sig i mitten av Meyers spektrum. Denna standard är oförarglig för måttligt direkta kulturer och stötande för båda extremerna.
För en holländsk användare känns modellens måttliga direkthet undvikande. “Sluta vela. Vad är fel med det?”
För en japansk användare känns modellens måttliga direkthet plump. Den negativa bedömningen är för explicit. Användaren förväntade sig att modellen skulle formulera problemen som möjligheter, inte som brister.
Kalibreringen är inte en språkfunktion. Den är en kulturfunktion. Och ingen nuvarande modell kalibrerar direkthet efter användarens kulturella kontext.
Gap 4: Temporal orientering
Hur en kultur förhåller sig till tid påverkar hur den kommunicerar om planer, deadlines, åtaganden och prioriteringar.
I monokroniska kulturer (Tyskland, Schweiz, de nordiska länderna) är tid linjär. Åtaganden är sekventiella. Deadlines är absoluta. Ett AI-verktyg som genererar en projektplan för ett tyskt team bör producera en strikt sekvens: uppgift 1 avslutas innan uppgift 2 börjar, med specifika datum och ingen tvetydighet.
I polykroniska kulturer (större delen av Medelhavsområdet, Latinamerika, stora delar av Mellanöstern) är tid flexibel. Flera aktiviteter överlappar. Deadlines är mål, inte absoluta krav. Relationer har prioritet över scheman. Ett AI-verktyg som genererar en projektplan för ett brasilianskt team bör producera ett ramverk med flexibilitet — milstolpar snarare än deadlines, parallella spår snarare än strikta sekvenser, och explicit erkännande av att planen kommer att anpassas i takt med att arbetet fortskrider.
När en flerspråkig modell genererar en projektplan på portugisiska översätter den den temporala strukturen från den engelskspråkiga projektledningstraditionens — som är monokronisk, sekventiell och deadline-absolut. Planen är språkligt portugisisk och kulturellt anglosaxisk.
En brasiliansk projektledare som tar emot denna plan tänker inte “den temporala orienteringen är fel.” De tänker “den här planen är orealistisk.” De kanske till och med tänker “det här verktyget förstår inte hur arbete faktiskt utförs.” Båda bedömningarna är korrekta — från deras kulturella position.
Gap 5: Relationell prioritet
I uppgiftsorienterade kulturer (USA, Tyskland, Nederländerna) börjar affärsinteraktioner med uppgiften. Relationen utvecklas genom arbetet. Du förtjänar förtroende genom att leverera resultat.
I relationsorienterade kulturer (större delen av Asien, Latinamerika, Mellanöstern, stora delar av Sydeuropa) börjar affärsinteraktioner med relationen. Uppgiften kan bara fortskrida när relationen är etablerad. Du förtjänar rätten att diskutera affärer genom att investera i den personliga kopplingen först.
Ett AI-verktyg är till sin natur uppgiftsorienterat. Interaktionsmodellen är: användaren presenterar en uppgift, verktyget utför den. Ingen relationell inledning. Ingen personlig koppling. Ingen investering i relationen före transaktionen.
I uppgiftsorienterade kulturer är detta effektivt. I relationsorienterade kulturer är detta abrupt. Verktyget som hoppar över relationen och går direkt till uppgiften har brutit mot det kulturella protokollet. Brottet är inte medvetet — användaren tänker inte “det här verktyget hoppade över den relationella fasen.” Användaren känner att interaktionen är kall, mekanisk och opålitlig.
Samma känsla, upplevd av miljontals användare i relationsorienterade kulturer, aggregeras till ett mätbart adoptionsgap.
Det strukturella problemet
De fem gapen delar en strukturell orsak: nuvarande AI-modeller tränas övervägande på engelskspråkig data som bäddar in engelskspråkiga kulturella normer. När dessa modeller genererar text på andra språk utför de språklig översättning och kulturell konservering — de översätter orden och bevarar de kulturella antagandena i källspråket.
Resultatet är språkligt flerspråkigt och kulturellt monokuturellt.
Ett portugisiskt affärsmejl genererat av en flerspråkig modell läses som portugisiska ord arrangerade enligt amerikanska kommunikationsnormer. Grammatiken är korrekt. Ordförrådet är lämpligt. Den kulturella arkitekturen — hierarkin, formaliteten, direktheten, den temporala orienteringen, den relationella förväntningen — är amerikansk.
Det här är inte en bugg. Det är en arkitektonisk begränsning. Modellen lärde sig kommunikationsnormer från sin träningsdata. Träningsdatans kommunikationsnormer är viktade mot amerikansk engelska. Modellen generaliserar dessa normer till alla språk eftersom den inte har lärt sig att kommunikationsnormer är kulturellt variabla.
Modellen vet att portugisiska använder andra ord än engelska. Modellen vet inte att portugisisk kultur använder andra kommunikationsregler än amerikansk kultur.
Vad kulturell kompetens kräver
En kulturellt kompetent AI-modell skulle behöva veta — och tillämpa — fem saker som ingen nuvarande modell vet:
Användarens kulturella kontext. Inte deras språk. Deras kultur. En portugisisktalande i Lissabon har andra kommunikationsförväntningar än en portugisisktalande i São Paulo. Språket är detsamma. Kulturen är det inte.
Lämpligt formalitetsregister. Baserat på användarens kulturella kontext, den specifika interaktionen (internt mejl kontra kundpropå kontra kundsvar) och relationen mellan parterna. Registret är inte en inställning. Det är ett omdöme.
Lämplig direkthetsnivå. Baserat på den kulturella kontexten och det specifika kommunikationssyftet. Positiv feedback på holländska bör vara direkt. Negativ feedback på japanska bör vara indirekt. Modellen bör veta vilken kalibrering som ska tillämpas utan att behöva bli tillsagd.
Lämplig temporal inramning. Planer, åtaganden och deadlines bör inramas enligt publikens kulturella orientering. Monokronisk inramning för monokroniska kulturer. Polykronisk inramning för polykroniska kulturer.
Lämplig relationell inledning. I relationsorienterade kulturer bör interaktionen börja med relationellt erkännande. I uppgiftsorienterade kulturer bör interaktionen börja med uppgiften. Modellen bör veta vilken som gäller.
Dessa fem förmågor är inte språkförmågor. De är kulturella förmågor. De kräver en annan typ av träning — inte på mer text på fler språk, utan på de kulturella system som styr hur text fungerar i olika samhällen.
Träningsdataproblemet
Den strukturella orsaken förtjänar en djupare granskning. Varför faller flerspråkiga modeller tillbaka på amerikanska kulturella normer?
Svaret finns i träningsdatan. Stora språkmodeller tränas på internettext. Internet är övervägande engelskspråkigt — enligt vissa uppskattningar utgör 55–60 % av allt webbinnehåll engelska. Det engelskspråkiga innehållet är övervägande amerikanskt till ursprung och kulturell orientering. Träningsdatan bäddar därför in amerikanska kommunikationsmönster som den statistiska normen.
När modellen genererar text på portugisiska har den lärt sig portugisiskt ordförråd och grammatik från portugisiskspråkig text. Men de pragmatiska mönstren — hur man formulerar en förfrågan, hur man kalibrerar formalitet, hur man signalerar hierarki — viktas mot de mönster som är vanligast i träningsdatan. De vanligaste mönstren är amerikanska engelska mönster.
Det här är inte en avsiktlig bias. Det är en statistisk artefakt. Modellen lär sig det vanligaste mönstret. Det vanligaste mönstret i en övervägande amerikansk träningskorpus är det amerikanska kommunikationsmönstret. Modellen generaliserar detta mönster till andra språk eftersom den har lärt sig att mönstret “fungerar” — i den meningen att det förekommer frekvent i högkvalitativ text.
Lösningen är inte att lägga till mer portugisisk text i träningsdatan. Mer portugisisk text lär modellen bättre portugisiskt ordförråd och grammatik. Den lär inte modellen portugisisk kulturell pragmatik — eftersom kulturell pragmatik sällan uttrycks explicit i text. Ingen skriver “Jag använder nu det formella registret eftersom min samtalspartner är en senior kollega och detta är en professionell kontext.” Registret används helt enkelt. Modellen måste härleda de pragmatiska reglerna från texten, och härledningen är svag när de pragmatiska mönstren är implicita och kulturellt variabla.
Kulturell kompetens i AI-modeller kommer att kräva ett annat träningsangrepp: explicit kulturell annotering, kulturell instruktionsjustering eller retrieval-augmented system som har tillgång till kulturella kunskapsbaser. Dessa angrepp existerar i forskningen. De existerar inte i produktion.
Tills de gör det kommer varje flerspråkig modell att generera text som talar språket och ignorerar kulturen. Problemet är inte modellens språkliga kapacitet. Det är modellens kulturella träningsdata — vilket innebär att dess kulturella träning är frånvarande.
Marknadskonsekvensen
Gapet mellan flerspråkig och multikulturell har en marknadskonsekvens. Företag som distribuerar AI-verktyg över europeiska marknader upplever det som adoptionsvarians som korrelerar med kulturellt avstånd.
Samma AI-verktyg distribuerat över EU producerar olika adoptionsgrader i olika länder. Variansen korrelerar starkare med kulturellt avstånd från utvecklingskontexten (typiskt amerikansk engelska) än med BNP, digitaliseringsnivå eller AI-medvetenhet.
Verktyget presterar väl i Nederländerna, Danmark och Tyskland — lågkontext, uppgiftsorienterade kulturer med måttlig direkthet och hög digitalisering. Verktyget underpresterar i Portugal, Spanien, Italien och Grekland — högkontextkulturer, mer relationsorienterade med högre osäkerhetsundvikande. Verktygets språkkapacitet är likvärdig över alla marknader. Den kulturella kalibreringen är enhetlig — och enhetligt amerikansk.
Adoptionsgapet förklaras inte av de konventionella faktorerna. Det förklaras av det kulturella gapet — avståndet mellan verktygets inbäddade kulturella antaganden och användarens kulturella förväntningar.
Principen
Flerspråkigt är ett löst problem. Modeller talar 95 språk. Benchmarks förbättras med varje release. Flytet är anmärkningsvärt.
Multikulturellt är ett olöst problem. Modeller talar 95 språk och kommunicerar i en kultur. De kulturella antagandena från utvecklingskontexten — amerikansk formalitet, amerikansk direkthet, amerikansk hierarki, amerikansk temporalitet, amerikansk uppgiftsorientering — är inbäddade i modellens kommunikationsmönster och exporteras till varje marknad.
Gapet mellan flerspråkig och multikulturell är gapet mellan att tala och att förstå. Mellan att översätta och att kommunicera. Mellan att distribuera ett verktyg på en marknad och att betjäna en marknad.
Språk är ytan. Kultur är systemet.
Modellerna har bemästrat ytan. De har inte påbörjat systemet.
På Bluewaves börjar varje distribution med det kulturella systemet, inte språket. När vi distribuerar ett AI-verktyg för en portugisisk klient börjar vi inte med den portugisiska språkmodellen. Vi börjar med den portugisiska kulturella kontexten: formalitetsförväntningarna, den relationella prioriteten, osäkerhetstoleransen, den temporala orienteringen, hierarkiantagandena. Vi designar interaktionsmönstret för kulturen. Sedan distribuerar vi modellen på språket.
Ordningen spelar roll. Språk är det sista beslutet, inte det första. Kultur är arkitekturen. Språk är gränssnittet. En arkitekt som designar gränssnittet före arkitekturen producerar en produkt som ser rätt ut och beter sig fel.
Modellerna talar 95 språk. Bluewaves verkar i åtta kulturer. Distinktionen är disciplinen. Disciplinen är skillnaden mellan distribution och distribution som fungerar.