Los modelos multilingües no son modelos multiculturales
Bernardo 17 de febrero de 2026

Los modelos multilingües no son modelos multiculturales

14 min de lectura

Los últimos lanzamientos de modelos llegaron con una afirmación familiar. Más idiomas. Más fluidez. Más benchmarks.

Los principales modelos afirman ahora soportar desde decenas hasta más de cien idiomas. Las páginas de marketing enfatizan el número. El número es impresionante. El número también es irrelevante para la pregunta que importa.

La pregunta no es: ¿puede el modelo hablar portugués?

La pregunta es: ¿puede el modelo operar en la cultura portuguesa?

La fluidez lingüística no es competencia cultural. Un modelo que traduce del inglés al portugués con gramática perfecta, vocabulario preciso y frases que suenan naturales ha logrado fluidez lingüística. Un modelo que traduce las prácticas empresariales anglosajonas a la cultura empresarial portuguesa — que ajusta los registros de formalidad, adapta las asunciones jerárquicas, calibra los niveles de franqueza y respeta las expectativas relacionales de la comunicación empresarial portuguesa — ha logrado competencia cultural.

Ningún modelo actual hace lo segundo.

Las cinco brechas

La brecha entre multilingüe y multicultural opera a lo largo de cinco dimensiones específicas. No son abstractas — son observables en cada despliegue intercultural de IA.

Brecha 1: Registros de formalidad

Todo idioma contiene registros de formalidad — niveles de distancia social codificados en el vocabulario, la gramática y el tono. Los registros portan significado cultural que va mucho más allá de la cortesía.

El portugués tiene dos formas principales de tratamiento: “tu” (informal) y “você” (formal, aunque menos formal que la tercera persona “o senhor/a senhora”). El portugués europeo usa “você” por defecto en la mayoría de los contextos profesionales. El portugués brasileño usa “você” de forma universal pero emplea “tu” en algunas regiones con un nivel de informalidad que no tiene equivalente en el portugués europeo.

El alemán tiene “du” (informal) y “Sie” (formal). La elección entre ambos es un contrato social. Usar “du” prematuramente en un contexto empresarial alemán no es un error gramatical. Es una transgresión social — una violación del contrato implícito que rige la distancia profesional.

El japonés tiene múltiples niveles de formalidad — solo el keigo (lenguaje honorífico) contiene tres subsistemas: sonkeigo (respetuoso), kenjougo (humilde) y teineigo (cortés). La elección entre ellos depende de las posiciones sociales relativas del hablante y el oyente, el contexto de la conversación y el historial de la relación. Un chatbot que usa teineigo (la forma cortés más básica) cuando se espera sonkeigo ha cometido un error social equivalente a que un empleado junior se dirija al CEO como “colega.”

Los modelos de IA actuales manejan los registros de formalidad como una funcionalidad de traducción: el usuario selecciona “formal” o “informal”, y el modelo ajusta su vocabulario. Esto es el alfabeto latino de la competencia cultural — técnicamente correcto y estructuralmente insuficiente.

Los registros de formalidad no son ajustes. Son relaciones. El registro correcto no lo determina un ajuste de preferencia. Lo determinan quién habla, quién escucha, de qué se habla y qué historia comunicativa existe entre las partes. Un modelo que no puede evaluar estas variables no puede seleccionar el registro correcto. Solo puede adivinar — o pedirle al usuario que elija, que es el equivalente de preguntar “¿Cómo de importante es usted?” antes de empezar una conversación.

Brecha 2: Asunciones jerárquicas

Cuando un modelo genera comunicación empresarial, hace asunciones sobre la jerarquía. Estas asunciones son invisibles porque se sienten naturales — para la persona cuya cultura las comparte.

Una herramienta de IA que genera un correo electrónico de un jefe de equipo a un director de departamento en inglés se establece por defecto en comunicación igualitaria: directa, por nombre de pila, entre iguales. “Hi Sarah, I wanted to share the Q4 results and get your thoughts.”

La misma comunicación en japonés requiere posicionamiento jerárquico: reconocimiento de la posición superior del destinatario, uso de honoríficos apropiados, encuadre indirecto de cualquier petición, y evitación cuidadosa de cualquier formulación que pueda leerse como presunción de igualdad.

La misma comunicación en portugués brasileño requiere calidez y reconocimiento relacional primero — un saludo personal antes del contenido de negocio — pero con más flexibilidad sobre la jerarquía que el japonés y más formalidad que el inglés americano.

El modelo puede traducir las palabras. No puede traducir la jerarquía. El correo que es perfectamente apropiado en inglés está socialmente descalibrado en japonés y relacionalmente insuficiente en portugués brasileño.

Esto no es un fallo de traducción. Es un fallo de arquitectura cultural. El modelo genera comunicación basándose en normas comunicativas que aprendió de sus datos de entrenamiento — predominantemente datos en inglés, predominantemente normas empresariales americanas. Cuando genera texto en otros idiomas, traduce las palabras conservando la arquitectura comunicativa americana.

El resultado: texto en portugués perfectamente fluido que suena como si lo hubiera escrito un americano en portugués. Que es exactamente lo que ocurrió.

Brecha 3: Calibración de la franqueza

El mapa cultural de Erin Meyer identifica un espectro de franqueza en la comunicación empresarial — desde los Países Bajos (extremadamente directos) hasta Japón (extremadamente indirectos), con la mayoría de las culturas en algún punto intermedio.

Una cultura de comunicación directa dice: “Esta propuesta tiene tres problemas. Aquí están.”

Una cultura de comunicación indirecta dice: “Esta propuesta muestra un trabajo cuidadoso. Me pregunto si podría haber algunas áreas donde una reflexión adicional podría fortalecer el análisis.”

Ambas frases transmiten el mismo mensaje: la propuesta necesita revisión. La codificación difiere. La expectativa cultural sobre cómo se entrega la retroalimentación negativa difiere. Las consecuencias sociales de violar la expectativa difieren.

Los modelos de IA actuales se establecen por defecto en franqueza moderada — calibrada aproximadamente al inglés empresarial americano, que se sitúa en el medio del espectro de Meyer. Este valor por defecto es inofensivo para culturas moderadamente directas y ofensivo para ambos extremos.

Para un usuario neerlandés, la franqueza moderada del modelo resulta evasiva. “Deja de andarte con rodeos. ¿Qué falla?”

Para un usuario japonés, la franqueza moderada del modelo resulta brusca. La evaluación negativa es demasiado explícita. El usuario esperaba que el modelo enmarcara los problemas como posibilidades, no como deficiencias.

La calibración no es una funcionalidad lingüística. Es una funcionalidad cultural. Y ningún modelo actual calibra la franqueza según el contexto cultural del usuario.

Brecha 4: Orientación temporal

Cómo una cultura se relaciona con el tiempo afecta a cómo comunica sobre planes, plazos, compromisos y prioridades.

En culturas monocrónicas (Alemania, Suiza, los países nórdicos), el tiempo es lineal. Los compromisos son secuenciales. Los plazos son absolutos. Una herramienta de IA que genera un plan de proyecto para un equipo alemán debería producir una secuencia estricta: la tarea 1 se completa antes de que empiece la tarea 2, con fechas específicas y sin ambigüedad.

En culturas policrónicas (la mayor parte del Mediterráneo, América Latina, gran parte de Oriente Medio), el tiempo es flexible. Múltiples actividades se solapan. Los plazos son objetivos, no absolutos. Las relaciones tienen prioridad sobre los horarios. Una herramienta de IA que genera un plan de proyecto para un equipo brasileño debería producir un marco con flexibilidad — hitos en lugar de plazos, pistas paralelas en lugar de secuencias estrictas, y reconocimiento explícito de que el plan se adaptará a medida que avance el trabajo.

Cuando un modelo multilingüe genera un plan de proyecto en portugués, traduce la estructura temporal de la tradición anglosajona de gestión de proyectos — que es monocrónica, secuencial y de plazos absolutos. El plan es lingüísticamente portugués y culturalmente anglosajón.

Un director de proyecto brasileño que recibe este plan no piensa “la orientación temporal es incorrecta.” Piensa “este plan no es realista.” Puede incluso pensar “esta herramienta no entiende cómo se hace el trabajo de verdad.” Ambas evaluaciones son correctas — desde su posición cultural.

Brecha 5: Precedencia de la relación

En culturas orientadas a la tarea (Estados Unidos, Alemania, Países Bajos), las interacciones de negocio empiezan por la tarea. La relación se desarrolla a través del trabajo. Te ganas la confianza entregando resultados.

En culturas orientadas a la relación (la mayor parte de Asia, América Latina, Oriente Medio, gran parte del sur de Europa), las interacciones de negocio empiezan por la relación. La tarea solo puede avanzar una vez que la relación está establecida. Te ganas el derecho a hablar de negocio invirtiendo primero en la conexión personal.

Una herramienta de IA es inherentemente orientada a la tarea. El modelo de interacción es: el usuario presenta una tarea, la herramienta la ejecuta. Sin preámbulo relacional. Sin conexión personal. Sin inversión en la relación antes de la transacción.

En culturas orientadas a la tarea, esto es eficiente. En culturas orientadas a la relación, esto es abrupto. La herramienta que se salta la relación y va directamente a la tarea ha violado el protocolo cultural. La violación no es consciente — el usuario no piensa “esta herramienta se saltó la fase relacional.” El usuario siente que la interacción es fría, mecánica y poco fiable.

La misma sensación, experimentada por millones de usuarios en culturas orientadas a la relación, se agrega en una brecha de adopción medible.

El problema estructural

Las cinco brechas comparten una causa estructural: los modelos de IA actuales se entrenan predominantemente con datos en inglés que incorporan normas culturales anglosajonas. Cuando estos modelos generan texto en otros idiomas, realizan traducción lingüística y conservación cultural — traducen las palabras mientras conservan las asunciones culturales del idioma de origen.

El resultado es lingüísticamente multilingüe y culturalmente monocultural.

Un correo electrónico empresarial portugués generado por un modelo multilingüe se lee como palabras portuguesas dispuestas según normas comunicativas americanas. La gramática es correcta. El vocabulario es apropiado. La arquitectura cultural — la jerarquía, la formalidad, la franqueza, la orientación temporal, la expectativa relacional — es americana.

Esto no es un defecto. Es una limitación arquitectónica. El modelo aprendió normas comunicativas de sus datos de entrenamiento. Las normas comunicativas de los datos de entrenamiento están sesgadas hacia el inglés americano. El modelo generaliza esas normas a todos los idiomas porque no ha aprendido que las normas comunicativas son culturalmente variables.

El modelo sabe que el portugués usa palabras diferentes al inglés. El modelo no sabe que la cultura portuguesa usa normas comunicativas diferentes a la cultura americana.

Qué requiere la competencia cultural

Un modelo de IA culturalmente competente necesitaría saber — y aplicar — cinco cosas que ningún modelo actual sabe:

El contexto cultural del usuario. No su idioma. Su cultura. Un hablante de portugués en Lisboa tiene expectativas comunicativas diferentes a las de un hablante de portugués en São Paulo. El idioma es el mismo. La cultura no.

El registro de formalidad apropiado. Basado en el contexto cultural del usuario, la interacción específica (correo interno frente a propuesta comercial frente a respuesta al cliente), y la relación entre las partes. El registro no es un ajuste. Es un juicio.

El nivel de franqueza apropiado. Basado en el contexto cultural y el propósito comunicativo específico. La retroalimentación positiva en neerlandés debería ser directa. La retroalimentación negativa en japonés debería ser indirecta. El modelo debería saber qué calibración aplicar sin que se lo digan.

El encuadre temporal apropiado. Los planes, compromisos y plazos deberían enmarcarse según la orientación cultural de la audiencia. Encuadre monocrónico para culturas monocrónicas. Encuadre policrónico para culturas policrónicas.

El preámbulo relacional apropiado. En culturas orientadas a la relación, la interacción debería empezar con reconocimiento relacional. En culturas orientadas a la tarea, la interacción debería empezar con la tarea. El modelo debería saber cuál de las dos opciones aplicar.

Estas cinco capacidades no son capacidades lingüísticas. Son capacidades culturales. Requieren un tipo de entrenamiento diferente — no más texto en más idiomas, sino sobre los sistemas culturales que rigen cómo funciona el texto en diferentes sociedades.

El problema de los datos de entrenamiento

La causa estructural merece un examen más profundo. ¿Por qué los modelos multilingües adoptan por defecto normas culturales americanas?

La respuesta está en los datos de entrenamiento. Los grandes modelos de lenguaje se entrenan con texto de internet. Internet es predominantemente en inglés — según algunas estimaciones, el 55–60 % de todo el contenido web está en inglés. El contenido en inglés es predominantemente de origen y orientación cultural americana. Los datos de entrenamiento, por tanto, incorporan los patrones comunicativos americanos como la norma estadística.

Cuando el modelo genera texto en portugués, ha aprendido vocabulario y gramática portuguesa de texto en portugués. Pero los patrones pragmáticos — cómo enmarcar una petición, cómo calibrar la formalidad, cómo señalar la jerarquía — están sesgados hacia los patrones más comunes en los datos de entrenamiento. Los patrones más comunes son los patrones del inglés americano.

Esto no es un sesgo deliberado. Es un artefacto estadístico. El modelo aprende el patrón más común. El patrón más común en un corpus predominantemente americano es el patrón comunicativo americano. El modelo generaliza este patrón a otros idiomas porque ha aprendido que el patrón “funciona” — en el sentido de que aparece frecuentemente en texto de alta calidad.

La solución no es añadir más texto en portugués a los datos de entrenamiento. Más texto en portugués enseña al modelo mejor vocabulario y gramática portuguesa. No le enseña pragmática cultural portuguesa — porque la pragmática cultural rara vez se explicita en el texto. Nadie escribe “Estoy usando ahora el registro formal porque mi interlocutor es un colega sénior y este es un contexto profesional.” El registro simplemente se usa. El modelo debe inferir las normas pragmáticas del texto, y la inferencia es débil cuando los patrones pragmáticos son implícitos y culturalmente variables.

La competencia cultural en los modelos de IA requerirá un enfoque de entrenamiento diferente: anotación cultural explícita, ajuste de instrucciones culturales, o sistemas aumentados por recuperación que accedan a bases de conocimiento culturales. Estos enfoques existen en la investigación. No existen en producción.

Hasta que lo hagan, todo modelo multilingüe generará texto que habla el idioma e ignora la cultura. El problema no es la capacidad lingüística del modelo. Son sus datos de entrenamiento cultural — es decir, su entrenamiento cultural está ausente.

La consecuencia de mercado

La brecha entre multilingüe y multicultural tiene una consecuencia de mercado. Las empresas que despliegan herramientas de IA en mercados europeos la experimentan como varianza de adopción que se correlaciona con la distancia cultural.

La misma herramienta de IA desplegada en la UE produce tasas de adopción diferentes en diferentes países. La varianza se correlaciona más fuertemente con la distancia cultural respecto al contexto de desarrollo (típicamente inglés americano) que con el PIB, el nivel de digitalización o el conocimiento de la IA.

La herramienta rinde bien en los Países Bajos, Dinamarca y Alemania — culturas de bajo contexto, orientadas a la tarea, con franqueza moderada y alta digitalización. La herramienta rinde por debajo en Portugal, España, Italia y Grecia — culturas de más alto contexto, más orientadas a la relación, con mayor aversión a la incertidumbre. La capacidad lingüística de la herramienta es equivalente en todos los mercados. La calibración cultural es uniforme — y uniformemente americana.

La brecha de adopción no se explica por los factores convencionales. Se explica por la brecha cultural — la distancia entre las asunciones culturales incorporadas en la herramienta y las expectativas culturales del usuario.

El principio

Multilingüe es un problema resuelto. Los modelos hablan 95 idiomas. Los benchmarks mejoran con cada lanzamiento. La fluidez es notable.

Multicultural es un problema sin resolver. Los modelos hablan 95 idiomas y comunican en una sola cultura. Las asunciones culturales del contexto de desarrollo — formalidad americana, franqueza americana, jerarquía americana, temporalidad americana, orientación a la tarea americana — están incorporadas en los patrones comunicativos del modelo y se exportan a cada mercado.

La brecha entre multilingüe y multicultural es la brecha entre hablar y entender. Entre traducir y comunicar. Entre desplegar una herramienta en un mercado y servir a un mercado.

El idioma es la superficie. La cultura es el sistema.

Los modelos han dominado la superficie. No han empezado el sistema.

En Bluewaves, cada despliegue empieza por el sistema cultural, no por el idioma. Cuando desplegamos una herramienta de IA para un cliente portugués, no empezamos por el modelo de lenguaje portugués. Empezamos por el contexto cultural portugués: las expectativas de formalidad, la precedencia de la relación, la tolerancia a la incertidumbre, la orientación temporal, las asunciones jerárquicas. Diseñamos el patrón de interacción para la cultura. Después desplegamos el modelo en el idioma.

La secuencia importa. El idioma es la última decisión, no la primera. La cultura es la arquitectura. El idioma es la interfaz. Un arquitecto que diseña la interfaz antes que la arquitectura produce un producto que parece correcto y se comporta mal.

Los modelos hablan 95 idiomas. Bluewaves opera en ocho culturas. La distinción es la disciplina. La disciplina es la diferencia entre despliegue y despliegue que funciona.

Escrito por
Bernardo
Traductor Cultural

Se asegura de que tu Gizmo no solo hable español — sino que suene español. Cuando el equipo de un cliente nórdico llama a su Gizmo por un apodo finlandés, es su trabajo el que se muestra.

← Todas las notas