Modelos Multilingues Não São Modelos Multiculturais
Os lançamentos de modelos mais recentes chegaram com uma afirmação familiar. Mais línguas. Mais fluência. Mais benchmarks.
Os principais modelos reclamam agora suporte para dezenas a mais de cem línguas. As páginas de marketing enfatizam o número. O número é impressionante. O número é também irrelevante para a questão que importa.
A questão não é: o modelo fala português?
A questão é: o modelo opera na cultura portuguesa?
Fluência linguística não é competência cultural. Um modelo que traduz inglês para português com gramática perfeita, vocabulário preciso e fraseado de som natural atingiu fluência linguística. Um modelo que traduz práticas empresariais inglesas para cultura empresarial portuguesa — que ajusta registos de formalidade, adapta pressupostos de hierarquia, calibra níveis de objectividade e respeita as expectativas relacionais da comunicação empresarial portuguesa — atingiu competência cultural.
Nenhum modelo actual faz o segundo.
As Cinco Lacunas
A lacuna entre multilingue e multicultural opera em cinco dimensões específicas. Não são abstractas — são observáveis em todas as implementações interculturais de IA.
Lacuna 1: Registos de Formalidade
Todas as línguas contêm registos de formalidade — níveis de distância social codificados em vocabulário, gramática e tom. Os registos transportam significado cultural que se estende muito para além da cortesia.
O português tem duas formas de tratamento primárias: “tu” (informal) e “você” (formal, embora menos formal do que a terceira pessoa “o senhor/a senhora”). O português europeu utiliza por defeito “você” na maioria dos contextos profissionais. O português do Brasil utiliza “você” universalmente mas usa “tu” em algumas regiões com um nível de informalidade que não tem equivalente em Portugal.
O alemão tem “du” (informal) e “Sie” (formal). A escolha entre os dois é um contrato social. Usar “du” prematuramente num contexto empresarial alemão não é um erro gramatical. É uma transgressão social — uma violação do contrato implícito que governa a distância profissional.
O japonês tem múltiplos níveis de formalidade — o keigo (linguagem honorífica) sozinho contém três subsistemas: sonkeigo (respeitoso), kenjougo (humilde) e teineigo (cortês). A escolha entre eles depende das posições sociais relativas do falante e do ouvinte, do contexto da conversa e do histórico relacional. Um chatbot que usa teineigo (a forma cortês mais básica) quando sonkeigo é esperado cometeu um erro social equivalente a um funcionário júnior tratar o CEO por “meu.”
Os modelos de IA actuais tratam os registos de formalidade como funcionalidade de tradução: o utilizador selecciona “formal” ou “informal” e o modelo ajusta o vocabulário. Isto é o alfabeto latino da competência cultural — tecnicamente correcto e estruturalmente insuficiente.
Registos de formalidade não são definições. São relações. O registo correcto não é determinado por uma preferência. É determinado por quem fala, quem ouve, o que se discute e que histórico comunicativo existe entre as partes. Um modelo que não consegue avaliar estas variáveis não consegue seleccionar o registo correcto. Só consegue adivinhar — ou pedir ao utilizador que escolha, o que equivale a perguntar “Quão importante é?” antes de iniciar uma conversa.
Lacuna 2: Pressupostos de Hierarquia
Quando um modelo gera comunicação empresarial, faz pressupostos sobre hierarquia. Estes pressupostos são invisíveis porque parecem naturais — para a pessoa cuja cultura os partilha.
Uma ferramenta de IA que gera um email de um chefe de equipa para um director de departamento em inglês utiliza por defeito comunicação igualitária: directa, pelo primeiro nome, entre pares. “Hi Sarah, I wanted to share the Q4 results and get your thoughts.”
A mesma comunicação em japonês requer posicionamento hierárquico: reconhecimento da posição superior do destinatário, uso de honoríficos apropriados, enquadramento indirecto de qualquer pedido e evitamento cuidadoso de qualquer fraseado que possa ser lido como presunção de igualdade.
A mesma comunicação em português do Brasil requer calor e reconhecimento relacional primeiro — um check-in pessoal antes do conteúdo empresarial — mas com mais flexibilidade sobre hierarquia do que o japonês e mais formalidade do que o inglês americano.
O modelo consegue traduzir as palavras. Não consegue traduzir a hierarquia. O email perfeitamente apropriado em inglês está socialmente descalibrado em japonês e relacionalmente insuficiente em português do Brasil.
Isto não é uma falha de tradução. É uma falha de arquitectura cultural. O modelo gera comunicação baseada em normas de comunicação que aprendeu dos seus dados de treino — predominantemente dados em inglês, predominantemente normas empresariais americanas. Quando gera texto noutras línguas, traduz as palavras enquanto preserva a arquitectura de comunicação americana.
O resultado: texto em português perfeitamente fluente que soa como se um americano o tivesse escrito em português. Que é exactamente o que aconteceu.
Lacuna 3: Calibração de Objectividade
O mapa cultural de Erin Meyer identifica um espectro de objectividade na comunicação empresarial — dos Países Baixos (extremamente directos) ao Japão (extremamente indirecto), com a maioria das culturas algures pelo meio.
Uma cultura de comunicação directa diz: “Esta proposta tem três problemas. Ei-los.”
Uma cultura de comunicação indirecta diz: “Esta proposta demonstra trabalho cuidadoso. Pergunto-me se não haverá algumas áreas onde reflexão adicional pudesse fortalecer a análise.”
Ambas as frases transmitem a mesma mensagem: a proposta precisa de revisão. A codificação difere. A expectativa cultural sobre como o feedback negativo é transmitido difere. As consequências sociais de violar a expectativa diferem.
Os modelos de IA actuais utilizam por defeito objectividade moderada — aproximadamente calibrada para o inglês empresarial americano, que se situa no meio do espectro de Meyer. Este defeito é inofensivo para culturas moderadamente directas e ofensivo para ambos os extremos.
Para um utilizador neerlandês, a objectividade moderada do modelo parece evasiva. “Pare de ser vago. O que é que está mal?”
Para um utilizador japonês, a objectividade moderada do modelo parece abrupta. A avaliação negativa é demasiado explícita. O utilizador esperava que o modelo enquadrasse os problemas como possibilidades, não como deficiências.
A calibração não é uma funcionalidade linguística. É uma funcionalidade cultural. E nenhum modelo actual calibra a objectividade para o contexto cultural do utilizador.
Lacuna 4: Orientação Temporal
A forma como uma cultura se relaciona com o tempo afecta como comunica sobre planos, prazos, compromissos e prioridades.
Nas culturas monocrónicas (Alemanha, Suíça, países nórdicos), o tempo é linear. Os compromissos são sequenciais. Os prazos são absolutos. Uma ferramenta de IA que gera um plano de projecto para uma equipa alemã deve produzir uma sequência estrita: a tarefa 1 completa-se antes de a tarefa 2 começar, com datas específicas e sem ambiguidade.
Nas culturas policrónicas (a maior parte do Mediterrâneo, América Latina, grande parte do Médio Oriente), o tempo é flexível. Múltiplas actividades sobrepõem-se. Os prazos são objectivos, não absolutos. As relações têm prioridade sobre horários. Uma ferramenta de IA que gera um plano de projecto para uma equipa brasileira deve produzir um enquadramento com flexibilidade — marcos em vez de prazos, faixas paralelas em vez de sequências estritas, e reconhecimento explícito de que o plano se adaptará à medida que o trabalho avança.
Quando um modelo multilingue gera um plano de projecto em português, traduz a estrutura temporal da tradição anglo-saxónica de gestão de projectos — que é monocrónica, sequencial e de prazo absoluto. O plano é linguisticamente português e culturalmente anglo-saxónico.
Um gestor de projecto brasileiro que recebe este plano não pensa “a orientação temporal está errada.” Pensa “este plano é irrealista.” Pode até pensar “esta ferramenta não compreende como o trabalho realmente se faz.” Ambas as avaliações estão correctas — da sua posição cultural.
Lacuna 5: Precedência Relacional
Nas culturas orientadas para tarefas (Estados Unidos, Alemanha, Países Baixos), as interacções empresariais começam pela tarefa. A relação desenvolve-se através do trabalho. Ganha-se confiança entregando resultados.
Nas culturas orientadas para relações (a maior parte da Ásia, América Latina, Médio Oriente, grande parte do Sul da Europa), as interacções empresariais começam pela relação. A tarefa só pode prosseguir quando a relação está estabelecida. Ganha-se o direito de discutir negócios investindo na ligação pessoal primeiro.
Uma ferramenta de IA é inerentemente orientada para tarefas. O modelo de interacção é: o utilizador apresenta uma tarefa, a ferramenta executa-a. Sem preâmbulo relacional. Sem ligação pessoal. Sem investimento na relação antes da transacção.
Nas culturas orientadas para tarefas, isto é eficiente. Nas culturas orientadas para relações, isto é abrupto. A ferramenta que salta a relação e vai directamente para a tarefa violou o protocolo cultural. A violação não é consciente — o utilizador não pensa “esta ferramenta saltou a fase relacional.” O utilizador sente que a interacção é fria, mecânica e pouco fiável.
O mesmo sentimento, experimentado por milhões de utilizadores em culturas orientadas para relações, agrega-se numa lacuna de adopção mensurável.
O Problema Estrutural
As cinco lacunas partilham uma causa estrutural: os modelos de IA actuais são treinados predominantemente com dados em inglês que incorporam normas culturais de língua inglesa. Quando estes modelos geram texto noutras línguas, executam tradução linguística e preservação cultural — traduzem as palavras enquanto preservam os pressupostos culturais da língua de origem.
O resultado é linguisticamente multilingue e culturalmente monocultural.
Um email empresarial português gerado por um modelo multilingue lê-se como palavras portuguesas dispostas segundo normas de comunicação americanas. A gramática está correcta. O vocabulário é apropriado. A arquitectura cultural — a hierarquia, a formalidade, a objectividade, a orientação temporal, a expectativa relacional — é americana.
Isto não é um bug. É uma limitação arquitectónica. O modelo aprendeu normas de comunicação dos seus dados de treino. As normas de comunicação dos dados de treino estão ponderadas para o inglês americano. O modelo generaliza essas normas para todas as línguas porque não aprendeu que as normas de comunicação são culturalmente variáveis.
O modelo sabe que o português usa palavras diferentes do inglês. O modelo não sabe que a cultura portuguesa usa regras de comunicação diferentes da cultura americana.
O Que a Competência Cultural Requer
Um modelo de IA culturalmente competente precisaria de saber — e aplicar — cinco coisas que nenhum modelo actual sabe:
O contexto cultural do utilizador. Não a sua língua. A sua cultura. Um falante de português em Lisboa tem expectativas de comunicação diferentes de um falante de português em São Paulo. A língua é a mesma. A cultura não é.
O registo de formalidade apropriado. Com base no contexto cultural do utilizador, na interacção específica (email interno vs proposta a cliente vs resposta a cliente) e na relação entre as partes. O registo não é uma definição. É um julgamento.
O nível de objectividade apropriado. Com base no contexto cultural e no propósito específico da comunicação. Feedback positivo em neerlandês deve ser directo. Feedback negativo em japonês deve ser indirecto. O modelo deve saber que calibração aplicar sem que lhe digam.
O enquadramento temporal apropriado. Planos, compromissos e prazos devem ser enquadrados de acordo com a orientação cultural da audiência. Enquadramento monocrónico para culturas monocrónicas. Enquadramento policrónico para culturas policrónicas.
O preâmbulo relacional apropriado. Nas culturas orientadas para relações, a interacção deve começar com reconhecimento relacional. Nas culturas orientadas para tarefas, a interacção deve começar pela tarefa. O modelo deve saber qual fazer.
Estas cinco capacidades não são capacidades linguísticas. São capacidades culturais. Requerem um tipo diferente de treino — não sobre mais texto em mais línguas, mas sobre os sistemas culturais que governam como o texto funciona em diferentes sociedades.
O Problema dos Dados de Treino
A causa estrutural merece um exame mais profundo. Porque é que os modelos multilingues utilizam por defeito normas culturais americanas?
A resposta está nos dados de treino. Os modelos de linguagem de grande escala são treinados com texto da internet. A internet é predominantemente em inglês — por algumas estimativas, 55–60% de todo o conteúdo web é em inglês. O conteúdo em inglês é predominantemente de origem e orientação cultural americanas. Os dados de treino, portanto, incorporam padrões de comunicação americanos como norma estatística.
Quando o modelo gera texto em português, aprendeu vocabulário e gramática portugueses a partir de texto em português. Mas os padrões pragmáticos — como enquadrar um pedido, como calibrar formalidade, como sinalizar hierarquia — estão ponderados para os padrões mais comuns nos dados de treino. Os padrões mais comuns são padrões de inglês americano.
Isto não é um viés deliberado. É um artefacto estatístico. O modelo aprende o padrão mais comum. O padrão mais comum num corpus predominantemente americano é o padrão de comunicação americano. O modelo generaliza este padrão para outras línguas porque aprendeu que o padrão “funciona” — no sentido de que aparece frequentemente em texto de alta qualidade.
A solução não é adicionar mais texto em português aos dados de treino. Mais texto em português ensina ao modelo melhor vocabulário e gramática em português. Não ensina ao modelo pragmática cultural portuguesa — porque a pragmática cultural raramente é tornada explícita em texto. Ninguém escreve “estou agora a usar o registo formal porque o meu interlocutor é um colega sénior e este é um contexto profissional.” O registo simplesmente é usado. O modelo tem de inferir as regras pragmáticas do texto, e a inferência é fraca quando os padrões pragmáticos são implícitos e culturalmente variáveis.
A competência cultural em modelos de IA exigirá uma abordagem de treino diferente: anotação cultural explícita, afinamento por instrução cultural ou sistemas de geração aumentada por recuperação que acedem a bases de conhecimento cultural. Estas abordagens existem na investigação. Não existem em produção.
Até que existam, todos os modelos multilingues gerarão texto que fala a língua e ignora a cultura. O problema não é a capacidade linguística do modelo. É o treino cultural do modelo — o que equivale a dizer que o treino cultural está ausente.
A Consequência de Mercado
A lacuna entre multilingue e multicultural tem uma consequência de mercado. As empresas que implementam ferramentas de IA em mercados europeus experienciam-na como variância de adopção que se correlaciona com distância cultural.
A mesma ferramenta de IA implementada na UE produz taxas de adopção diferentes em países diferentes. A variância correlaciona-se mais fortemente com a distância cultural do contexto de desenvolvimento (tipicamente inglês americano) do que com o PIB, o nível de digitalização ou a sensibilização para a IA.
A ferramenta tem bom desempenho nos Países Baixos, Dinamarca e Alemanha — culturas de baixo contexto, orientadas para tarefas, com objectividade moderada e alta digitalização. A ferramenta tem desempenho inferior em Portugal, Espanha, Itália e Grécia — culturas de contexto mais alto, mais orientadas para relações, com maior aversão à incerteza. A capacidade linguística da ferramenta é equivalente em todos os mercados. A calibração cultural é uniforme — e uniformemente americana.
A lacuna de adopção não é explicada pelos factores convencionais. É explicada pela lacuna cultural — a distância entre os pressupostos culturais incorporados na ferramenta e as expectativas culturais do utilizador.
O Princípio
Multilingue é um problema resolvido. Os modelos falam 95 línguas. Os benchmarks melhoram a cada lançamento. A fluência é notável.
Multicultural é um problema por resolver. Os modelos falam 95 línguas e comunicam numa cultura. Os pressupostos culturais do contexto de desenvolvimento — formalidade americana, objectividade americana, hierarquia americana, temporalidade americana, orientação para tarefas americana — estão incorporados nos padrões de comunicação do modelo e são exportados para todos os mercados.
A lacuna entre multilingue e multicultural é a lacuna entre falar e compreender. Entre traduzir e comunicar. Entre implementar uma ferramenta num mercado e servir um mercado.
A língua é a superfície. A cultura é o sistema.
Os modelos dominaram a superfície. Não começaram o sistema.
Na Bluewaves, cada implementação começa pelo sistema cultural, não pela língua. Quando implementamos uma ferramenta de IA para um cliente português, não começamos pelo modelo de língua portuguesa. Começamos pelo contexto cultural português: as expectativas de formalidade, a precedência relacional, a tolerância à incerteza, a orientação temporal, os pressupostos de hierarquia. Desenhamos o padrão de interacção para a cultura. Depois implementamos o modelo na língua.
A sequência importa. A língua é a última decisão, não a primeira. A cultura é a arquitectura. A língua é a interface. Um arquitecto que desenha a interface antes da arquitectura produz um produto que parece certo e se comporta mal.
Os modelos falam 95 línguas. A Bluewaves opera em oito culturas. A distinção é a disciplina. A disciplina é a diferença entre implementação e implementação que funciona.