Bernardo 21 de outubro de 2025

Três Pressupostos, Três Mil Milhões de Pessoas

14 min de leitura

O alfabeto latino pressupõe leitura horizontal, da esquerda para a direita, com espaços entre palavras.

Três pressupostos. Três mil milhões de pessoas para quem nenhum deles se verifica.

O Primeiro Pressuposto: Direcção

O árabe lê-se da direita para a esquerda. O hebraico lê-se da direita para a esquerda. O urdu lê-se da direita para a esquerda. O persa lê-se da direita para a esquerda. Não são escritas minoritárias. Só o árabe é o sistema de escrita de mais de 370 milhões de falantes nativos e a escrita litúrgica de 1,8 mil milhões de muçulmanos. O hebraico serve 9 milhões de falantes nativos. O urdu serve 230 milhões.

A direcção da direita para a esquerda não é um caso especial. A direcção da esquerda para a direita não é o defeito. Ambas são convenções — acidentes históricos de ângulo de pincel, posição da cana e ergonomia do escriba que solidificaram em normas ao longo de milénios. Nenhuma é mais natural do que a outra. Uma domina a indústria tecnológica. Esta dominância não é merecida. É herdada.

Todas as interfaces de IA construídas sobre o pressuposto de leitura da esquerda para a direita — todas as janelas de chat, todos os campos de texto, todos os painéis de resposta — são construídas sobre o primeiro pressuposto. O pressuposto está codificado ao nível do CSS, ao nível do motor de disposição, ao nível do padrão de interacção. “direction: ltr” é uma única linha de código. É também uma declaração cultural: esta interface foi construída por pessoas que lêem da esquerda para a direita, para pessoas que lêem da esquerda para a direita.

O custo de engenharia do suporte bidireccional não é zero. Mas o custo de engenharia de excluir mais de 600 milhões de falantes nativos de escritas da direita para a esquerda é superior — se os considerarmos de todo. A maioria das interfaces não considera.

O Segundo Pressuposto: Continuidade

Os caracteres latinos são discretos. Cada letra ocupa o seu próprio espaço. A forma de um “a” não muda com base na letra ao lado. Esta discrição é a base arquitectónica da tipografia digital: tabelas de glifos fixas, pares de kerning previsíveis, posicionamento directo do cursor.

A escrita árabe não funciona assim. Os caracteres árabes são conectados — cada letra une-se às vizinhas num fluxo contínuo, como escrita cursiva que nunca levanta a caneta. A forma de um carácter muda com base na sua posição na palavra: inicial, medial, final ou isolada. A letra “ba” (ب) tem quatro formas distintas consoante o lugar onde aparece na palavra. Isto não é uma excepção. É a regra. Cada letra do alfabeto árabe tem múltiplas formas.

O Devanagari — a escrita usada para o hindi, sânscrito, marata, nepali e dezenas de outras línguas que servem mais de 600 milhões de pessoas — tem uma lógica estrutural totalmente diferente. Os caracteres pendem de uma linha horizontal chamada shirorekha. A linha conecta caracteres dentro de uma palavra, criando uma continuidade visual que não é nem a discrição do latim nem a conexão cursiva do árabe. É um terceiro modelo totalmente distinto.

A implicação para interfaces de IA: renderização de texto, posicionamento do cursor, selecção de texto, quebra de linha e hifenização comportam-se todos de forma diferente em cada sistema de escrita. Um chatbot de IA que renderiza texto árabe usando lógica de renderização de texto latino produz texto que é tecnicamente legível mas visualmente errado — formas de letras que falham em conectar-se correctamente, fronteiras de palavras que quebram em posições incorrectas, comportamento do cursor que confunde o utilizador.

O utilizador não vê “um bug de renderização.” O utilizador vê uma interface que não compreende a sua língua. A confiança perde-se não ao nível semântico mas ao nível tipográfico — antes de uma única palavra da resposta da IA ter sido lida.

O Terceiro Pressuposto: Separação

O inglês separa palavras com espaços. O alemão separa palavras com espaços (excepto quando cria palavras compostas, que depois não são separadas — “Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz” é uma palavra). O chinês não usa espaços entre palavras. O japonês não usa espaços entre palavras. O tailandês não usa espaços entre palavras.

Na escrita chinesa, japonesa e coreana (CJK), cada carácter ocupa uma célula de largura fixa. Os caracteres são espaçados uniformemente não por fronteiras de palavras mas por fronteiras de caracteres. A segmentação de palavras — saber onde uma palavra termina e outra começa — é uma tarefa executada pelo leitor, não pela tipografia. O texto não fornece sinal explícito.

Para sistemas de IA que processam texto CJK, a segmentação de palavras é uma tarefa computacional não-trivial. A mesma sequência de caracteres chineses pode ser segmentada em palavras diferentes dependendo do contexto. A frase “下雨天留客天留我不留” pode ser lida como um convite para ficar ou um pedido para partir, dependendo de onde as fronteiras das palavras são colocadas. A ambiguidade é resolvida pelo contexto, não pela tipografia.

Quando um chatbot de IA responde em chinês, a resposta tem de ser renderizada em células de caracteres de largura fixa com espaçamento CJK correcto. Quando a mesma interface também trata texto latino — numa implementação multilingue, por exemplo — os dois sistemas de espaçamento têm de coexistir. Caracteres CJK em largura total. Caracteres latinos em largura proporcional. Regras de pontuação que diferem entre os dois sistemas (o chinês usa marcas de pontuação de largura total; o latim usa largura proporcional). Regras de quebra de linha que proíbem certos caracteres de aparecer no início ou fim de uma linha (kinsoku shori na tipografia japonesa).

Isto não é um pedido de funcionalidade. É um pré-requisito. Uma interface que falha em tratar tipografia mista CJK-latina correctamente é uma interface que não funciona para a maioria dos utilizadores do Leste Asiático que lêem ambas as escritas diariamente.

A Escala da Exclusão

Os números não são ambíguos.

Escrita árabe: 420 milhões de falantes nativos. Devanagari: 600+ milhões de utilizadores em múltiplas línguas. Caracteres chineses: 1,4 mil milhões de leitores nativos. Japonês (mistura de kanji, hiragana, katakana): 125 milhões de leitores nativos. Coreano (Hangeul): 80 milhões de leitores nativos. Escrita tailandesa: 38 milhões de leitores nativos.

Combinadas, estas escritas servem mais pessoas do que o alfabeto latino. E essa contagem exclui o cirílico (250 milhões), o bengali (230 milhões), o tâmil (80 milhões), o telugo (83 milhões) e dezenas de outras escritas que servem cada uma dezenas de milhões de pessoas.

O alfabeto latino não é o sistema de escrita do mundo. É um dos sistemas de escrita do mundo — e é o que controla os pressupostos de todas as principais interfaces de IA.

O Que “Multilingue” Realmente Significa

Todos os principais modelos de IA reclamam capacidade multilingue. A reivindicação é verdadeira ao nível da língua. GPT-4, Claude, Gemini — todos processam texto em dezenas de línguas com graus variados de competência. O modelo de linguagem compreende chinês, árabe, hindi, japonês, coreano, tailandês.

A interface não compreende.

A capacidade multilingue do modelo de linguagem é renderizada através de uma interface construída sobre pressupostos latinos: disposição da esquerda para a direita, renderização de caracteres discretos, apresentação de palavras separadas por espaços. O modelo consegue pensar em árabe. A interface não consegue apresentar árabe correctamente. O modelo consegue gerar chinês. A interface não consegue renderizar texto misto CJK-latino correctamente.

A distância entre a capacidade linguística do modelo e a capacidade tipográfica da interface é a distância entre “multilingue” e “multicultural.” O modelo fala a língua. A interface fala tipografia latina com um disfarce linguístico.

Este é o argumento da Bluewaves, reduzido à sua forma mais simples: a língua não é cultura. Tradução não é adaptação. Um modelo que gera árabe fluente através de uma interface que renderiza árabe incorrectamente atingiu competência linguística e incompetência tipográfica simultaneamente.

Os Requisitos de Engenharia

O que seria necessário para construir uma interface de IA que respeite os três mil milhões? Os requisitos são específicos, conhecidos e bem documentados nas especificações do Consórcio Unicode, nas directrizes de Internacionalização do W3C e em décadas de investigação de engenharia tipográfica.

Suporte de texto bidireccional (Bidi). O Unicode Bidirectional Algorithm (UBA) define como texto com direccionalidade mista deve ser renderizado. O algoritmo trata o caso comum: uma frase árabe contendo um nome de produto em inglês, ou um parágrafo hebraico com um URL. O UBA é um problema resolvido — implementado em todos os principais motores de navegador e sistemas operativos. O requisito não é inventar suporte bidireccional. É usar o padrão existente correctamente. A maioria das interfaces de IA não o faz.

Modelação contextual. O árabe, o siríaco, o mongol e outras escritas conectadas requerem modelação contextual — renderização de variantes de glifos diferentes com base na posição de um carácter na palavra. As funcionalidades de disposição OpenType (especificamente, as funcionalidades “init,” “medi,” “fina” e “isol”) tratam isto ao nível da fonte. O requisito é usar fontes que incluam estas funcionalidades e motores de renderização que as apliquem. O requisito não é exótico. É tipografia padrão. É frequentemente ignorado.

Espaçamento e quebra de linha CJK. Os documentos “Requirements for Japanese Text Layout” (JLReq) e “Requirements for Chinese Text Layout” (CLReq) do W3C definem as regras de espaçamento, pontuação e quebra de linha para texto CJK. Estas não são directrizes opcionais. São as convenções tipográficas que os leitores CJK esperam — o equivalente a texto alinhado à esquerda na tipografia latina. Violá-las produz texto que é legível mas errado, da mesma forma que um livro com texto inglês alinhado à direita é legível mas errado.

Renderização de escritas complexas. As escritas Devanagari, bengali, tâmil, telugo, canaresa, malaiala, tailandesa, laociana, khmer, tibetana e birmanesa requerem todas modelação complexa — reordenação de caracteres, combinação de caracteres base com marcas vocálicas e regras de posicionamento que dependem da combinação específica de caracteres. O HarfBuzz, o motor de modelação de texto open-source, trata todas estas. O requisito é integração, não invenção.

Suporte de texto vertical. O chinês tradicional, o japonês e o mongol podem ser escritos verticalmente (de cima para baixo, colunas da direita para a esquerda). Embora a escrita horizontal se tenha tornado dominante para texto digital em chinês e japonês, o texto vertical permanece importante para contextos formais, publicação literária e certos elementos de UI. O mongol é escrito verticalmente por defeito. Uma interface de IA que reclama suporte CJK mas não consegue renderizar texto vertical está a fazer um pressuposto cultural disfarçado de limitação técnica.

A Dimensão de Acessibilidade

Os três pressupostos não afectam apenas a competência cultural. Afectam a acessibilidade.

A Organização Mundial de Saúde estima que 2,2 mil milhões de pessoas globalmente têm alguma forma de deficiência visual. Os leitores de ecrã — a tecnologia assistiva que converte texto em fala para utilizadores com deficiência visual — dependem de direccionalidade de texto correcta, codificação de caracteres correcta e estrutura semântica correcta. Um leitor de ecrã que processa texto árabe num contexto da esquerda para a direita lerá os caracteres na ordem errada. O utilizador ouve disparates.

Isto não é uma preocupação de nicho. Os utilizadores de internet de língua árabe são aproximadamente 237 milhões. A intersecção de utilizadores de língua árabe e utilizadores com deficiência visual mede-se em milhões. Uma interface de IA que renderiza texto árabe num contexto da esquerda para a direita excluiu estes utilizadores da interacção — não por qualquer decisão deliberada, mas pelo pressuposto herdado de que todo o texto flui da esquerda para a direita.

A Directiva de Acessibilidade Web da UE (Directiva 2016/2102) exige que os websites e aplicações do sector público cumpram as normas WCAG 2.1 AA. O Acto Europeu de Acessibilidade (Directiva 2019/882), que se aplica a produtos e serviços do sector privado a partir de Junho de 2025, estende requisitos semelhantes a produtos comerciais. Ambas as directivas exigem tratamento correcto de texto bidireccional, marcação semântica correcta para leitores de ecrã e identificação correcta de língua no atributo HTML lang.

Uma ferramenta de IA que falha em tratar árabe, hebraico ou outras escritas RTL correctamente não é meramente culturalmente insensível. É potencialmente não conforme com a legislação de acessibilidade da UE.

O custo de engenharia da conformidade é o mesmo que o custo de engenharia da competência cultural: implementar o Unicode Bidirectional Algorithm correctamente, usar HTML semântico com atributos lang correctos e testar com leitores de ecrã em modo RTL. O custo é incorrido uma vez. A exclusão, se o custo não for incorrido, é permanente.

A Lacuna de Testes

Eis uma observação prática de anos de trabalho em design intercultural: o pressuposto de que o texto é latino persiste porque os testes são latinos.

As equipas de QA testam interfaces de IA com texto latino. Consultas em inglês, respostas em inglês, renderização em inglês. Os testes passam. O produto é lançado. O utilizador árabe, o utilizador hindi, o utilizador chinês, o utilizador tailandês descobre as falhas de renderização depois da implementação — em produção, com consultas reais, com consequências reais para a confiança.

A lacuna de testes não é acidental. É estrutural. As equipas de QA são compostas por pessoas que lêem a língua de desenvolvimento. Os casos de teste são escritos na língua de desenvolvimento. Os testes automatizados verificam funcionalidades descritas nos documentos de requisitos da língua de desenvolvimento. Testes multilingues requerem testadores multilingues — pessoas que conseguem avaliar se o texto árabe parece correcto, se o espaçamento CJK é apropriado, se as conexões de título Devanagari renderizam correctamente. Estes testadores existem. Raramente são contratados. São um segundo pensamento, se são considerados de todo.

A correcção é arquitectónica: incluir escritas não-latinas no conjunto de testes principal, não como apêndice. Todos os testes automatizados que verificam renderização de texto devem correr contra texto árabe, chinês, Devanagari e tailandês para além do inglês. Todas as passagens de QA manual devem incluir avaliação de escrita nativa por um leitor nativo. Todas as auditorias de acessibilidade devem incluir cenários RTL e de escrita complexa.

Este não é um regime de testes premium. É um regime de testes base para um produto que reclama servir uma base de utilizadores global. Um produto que testa apenas em latim e reclama suporte global não é um produto global. É um produto latino com uma página de marketing global.

A Falha de Design

A falha não é que estes requisitos são desconhecidos. Estão extensamente documentados. A Actividade de Internacionalização do W3C publicou especificações abrangentes para cada sistema de escrita principal. As especificações do Consórcio Unicode são a referência canónica para processamento de texto em todo o mundo. O HarfBuzz, o ICU e outras bibliotecas open-source implementam a lógica de renderização.

A falha é que estes requisitos são tratados como casos especiais em vez de requisitos fundacionais. A interface de IA é desenhada para texto latino. Depois o suporte para árabe é “adicionado.” Depois o suporte CJK é “adicionado.” Cada adição é uma adaptação posterior — um remendo aplicado a uma arquitectura que foi desenhada para um sistema de escrita e estendida, imperfeitamente, para acomodar outros.

A alternativa é desenhar para os três mil milhões desde o início. Tratar a disposição bidireccional, a modelação contextual, a renderização de escritas complexas e o espaçamento CJK como requisitos arquitectónicos — não funcionalidades a adicionar depois, mas fundações a estabelecer primeiro.

Isto é mais caro à partida. É menos caro no total. Cada adaptação posterior é mais dispendiosa do que a decisão de design original teria sido. E cada adaptação posterior produz imperfeições — falhas de renderização, bugs de interacção, falhas de acessibilidade — que corroem a confiança com os utilizadores que foram um segundo pensamento.

O Princípio

O alfabeto latino não é o defeito. É uma convenção — uma de muitas, adoptada por uma minoria dos leitores do mundo, elevada a dominância arquitectónica pelo acidente de qual cultura industrializou a computação primeiro.

Todas as interfaces de IA construídas sobre pressupostos latinos excluem mais pessoas do que incluem. Não por malícia. Por herança. Os pressupostos nunca foram examinados porque nunca foram visíveis — para as pessoas que os partilham.

Os três pressupostos — direcção, continuidade, separação — não são universais. São provinciais. E construir tecnologia global sobre pressupostos provinciais não é engenharia. É descuido à escala.

Três pressupostos. Três mil milhões de pessoas. Os pressupostos são opcionais. As pessoas não são.

A interface de IA construída para os três mil milhões tem aspecto diferente da interface de IA construída para o alfabeto latino. Começa com disposição bidireccional como defeito, não como segundo pensamento. Trata modelação contextual como capacidade fundacional, não como funcionalidade avançada. Trata espaçamento CJK como requisito de renderização principal, não como adenda de localização. Testa com texto árabe, Devanagari, chinês e tailandês como parte do conjunto de testes padrão, não como caso especial.

Esta interface não existe. As especificações para a construir existem. As bibliotecas para a implementar existem. A procura por ela — três mil milhões de pessoas — existe.

O que não existe é a decisão de a construir. Essa decisão não é técnica. É de atenção. É a decisão de notar os três pressupostos e de os tratar como as convenções provinciais que são, em vez das verdades universais que não são.

Três pressupostos. Três mil milhões de pessoas. A decisão é uma.

Escrito por

Bernardo

Tradutor Cultural

Garante que o seu Gizmo não fala apenas espanhol — soa a espanhol. Quando a equipa de um cliente nórdico chama ao seu Gizmo por uma alcunha finlandesa, é o trabalho dele que se vê.

← Todas as notas