O Problema da Caligrafia Árabe
O árabe não é latim da direita para a esquerda.
Esta frase contém o problema inteiro. Todas as interfaces de IA que tratam o árabe como escrita latina renderizada ao contrário falharam — não ao nível da língua, não ao nível da tradução, mas ao nível tipográfico. A falha é arquitectónica. Está incorporada no motor de renderização, na selecção de fontes, no algoritmo de disposição de texto e nos padrões de interacção.
O resultado é texto que os leitores árabes conseguem descodificar mas no qual não confiam. A descodificação é funcional. A desconfiança é cultural. E a desconfiança determina a adopção.
A Escrita Conectada
As letras latinas são discretas. Cada letra é um glifo separado, posicionado independentemente, separado pelo espaço que ocupa. A palavra “hello” são cinco formas independentes dispostas horizontalmente.
As letras árabes são conectadas. Cada letra une-se às vizinhas num fluxo contínuo. A palavra “مرحبا” (marhaba, que significa “olá”) não são cinco formas independentes. É uma única forma conectada — uma unidade caligráfica onde a forma de cada letra depende da sua posição na palavra e da sua relação com as letras adjacentes.
Esta dependência posicional é a diferença arquitectónica fundamental. Cada letra árabe tem até quatro formas distintas:
Forma isolada. A letra está sozinha, não conectada a nenhuma outra letra. Usada no final de palavras depois de letras não conectoras, ou quando a letra aparece independentemente.
Forma inicial. A letra aparece no início de uma sequência conectada. Conecta-se à letra seguinte mas não à anterior.
Forma medial. A letra aparece no meio de uma sequência conectada. Conecta-se tanto à letra anterior como à seguinte.
Forma final. A letra aparece no final de uma sequência conectada. Conecta-se à letra anterior mas não à seguinte.
A letra “ع” (ain) nas suas quatro formas tem aspecto substancialmente diferente em cada posição. A forma isolada é uma forma arredondada e autónoma. A forma inicial estende uma conexão para a direita (em direcção à próxima letra). A forma medial conecta-se em ambos os lados. A forma final conecta-se à esquerda (a partir da letra anterior) e fecha.
Isto não é uma variação estilística. É a escrita. Árabe sem modelação contextual não é árabe simplificado. É árabe partido — letras que falham em conectar-se, palavras que aparecem como fragmentos desconectados, texto que é tecnicamente composto pelos caracteres correctos mas visualmente incoerente.
O Que “Renderizar” Significa em Árabe
Na tipografia latina, renderizar é em grande parte uma questão de posicionamento: colocar cada glifo em sequência, aplicar ajustes de kerning entre certos pares, e o texto está legível. O processo é linear e previsível.
Na tipografia árabe, renderizar é um processo em múltiplas fases:
Fase 1: Análise de caracteres. O motor de renderização examina cada carácter no texto e determina a sua posição na sequência conectada — inicial, medial, final ou isolada. Esta análise depende dos vizinhos do carácter. Algumas letras árabes conectam-se em ambos os lados (conectores bidireccionais como ب, ت, ث). Outras conectam-se apenas à direita (conectores do lado direito como ا, د, ذ, ر, ز, و). O motor de renderização tem de saber quais letras conectam e quais não.
Fase 2: Selecção de glifos. Com base na análise posicional, o motor selecciona a forma de glifo correcta da fonte. Uma fonte que suporta árabe correctamente tem de conter todas as quatro formas de cada letra — mais ligaduras (formas combinadas para pares de letras comuns). A ligadura árabe “لا” (lam-alef) não são duas letras renderizadas lado a lado. É um único glifo combinado com a sua forma específica própria. A fonte tem de conter esta ligadura. O motor tem de reconhecer quando a usar.
Fase 3: Modelação contextual. As fontes OpenType usam tabelas GSUB (substituição de glifos) e GPOS (posicionamento de glifos) para tratar a modelação contextual. As funcionalidades “init,” “medi,” “fina” e “isol” executam a substituição posicional. As funcionalidades “liga” e “rlig” tratam ligaduras — ligaduras obrigatórias que têm de ser aplicadas para renderização correcta e ligaduras opcionais que melhoram a qualidade visual.
Fase 4: Posicionamento de marcas. O árabe usa sinais diacríticos — pontos, marcas vocálicas (harakat) e outras anotações que são posicionadas relativamente à letra base. O posicionamento não é fixo. Depende da forma da letra, do contexto circundante e da tradição tipográfica. A shadda (ّ) — uma marca que indica geminação — tem de ser posicionada precisamente acima da letra que modifica, ajustada para a altura e largura da letra. O posicionamento incorrecto de marcas é imediatamente visível para qualquer leitor árabe.
Fase 5: Justificação. A justificação de texto árabe não é alcançada adicionando espaços entre palavras, como na tipografia latina. A justificação árabe tradicional usa kashida — um alongamento do traço de conexão entre letras. O kashida estende a conexão horizontal sem alterar as formas das letras. É esteticamente integral à escrita. Uma interface de IA que justifica texto árabe adicionando espaços entre palavras produz texto que parece tecnicamente alinhado e visualmente errado.
Cada uma destas fases tem de ser executada correctamente para que o texto seja legível da forma que um leitor árabe espera. Uma falha em qualquer fase — forma posicional errada, ligadura em falta, sinal diacrítico mal colocado, justificação por espaçamento de palavras — produz texto que é tecnicamente descodificável mas culturalmente analfabeto.
A Tradição Caligráfica
A escrita árabe não é meramente um sistema de escrita. É uma tradição caligráfica — uma das grandes formas de arte do mundo, praticada continuamente durante catorze séculos, elevada ao mais alto estatuto na arte e arquitectura islâmicas.
Esta tradição molda expectativas. Um leitor árabe não avalia texto da forma como um leitor latino avalia texto. Um leitor latino espera regularidade, consistência e precisão mecânica. Um leitor árabe espera fluxo, conexão e proporção — qualidades herdadas de séculos de prática caligráfica.
As seis escritas canónicas da caligrafia árabe — Naskh, Thuluth, Nasta’liq, Diwani, Ruq’ah e Kufi — representam diferentes tradições estéticas, cada uma com regras específicas de proporção, conexão e composição. A tipografia árabe moderna inspira-se primariamente no Naskh (a escrita de texto padrão) e no Ruq’ah (a escrita manuscrita quotidiana), mas a sensibilidade caligráfica — a expectativa de conexão fluida, harmonia proporcional e ritmo visual — persiste em todos os contextos.
Uma interface de IA que renderiza texto árabe numa fonte Naskh básica com modelação contextual correcta produz texto legível. Uma interface de IA que renderiza texto árabe com tipografia sofisticada — ligaduras apropriadas, justificação por kashida, posicionamento correcto de marcas e espaçamento proporcional de letras — produz texto que respeita a tradição caligráfica.
A diferença é a diferença entre funcional e nativo. Entre tecnicamente correcto e culturalmente competente.
A Dimensão Nasta’liq
O problema aprofunda-se para o urdu, o pachto e o persa.
Estas línguas usam escrita árabe mas empregam o estilo caligráfico Nasta’liq — um estilo fundamentalmente incompatível com o modelo de linha de base horizontal que todos os motores de renderização baseados em latim assumem.
O Nasta’liq é escrito numa linha de base diagonal. As letras fluem do canto superior direito para o canto inferior esquerdo dentro de cada palavra. A linha de base não é horizontal. Desce. Cada palavra forma uma diagonal descendente, com a palavra seguinte a começar no canto superior direito outra vez.
Renderizar Nasta’liq com uma linha de base horizontal — que é o que a maioria das interfaces de IA faz quando encontra texto em urdu ou persa — produz texto que está tecnicamente na escrita correcta mas é visual e culturalmente errado. O efeito para um leitor de urdu é comparável a inglês renderizado numa fonte que coloca todas as letras numa linha ondulada: tecnicamente legível, esteticamente ofensivo e culturalmente alienante.
O urdu é falado por 230 milhões de pessoas. É a língua nacional do Paquistão. Renderizar urdu em Naskh horizontal em vez de Nasta’liq diagonal não é uma escolha tipográfica menor. É o equivalente a renderizar inglês numa fonte que nenhum leitor de inglês usaria voluntariamente.
O desafio técnico é real. A renderização Nasta’liq requer um motor de disposição complexo que trate linhas de base diagonais, posicionamento variável de letras e empilhamento multi-nível. Mas o desafio foi resolvido: as fontes Mehr Nastaliq e Jameel Noori Nastaleeq tratam a renderização Nasta’liq através de funcionalidades OpenType avançadas. Os motores de renderização existem. A integração em interfaces de IA não existe.
A Complexidade Bidireccional
O texto árabe raramente aparece isolado. Na utilização moderna — especialmente em contextos tecnológicos — o texto árabe é misturado com texto latino, números, URLs, excertos de código, nomes de produtos e termos técnicos. A mistura é constante e irregular.
O Unicode Bidirectional Algorithm (UBA) trata o caso geral: quando texto da direita para a esquerda contém elementos da esquerda para a direita, o algoritmo determina a ordem de visualização. Mas o caso geral não é o único caso.
Considere uma frase árabe que contém um nome de produto em inglês, um URL, um número com símbolo de moeda e um parêntesis em francês:
استخدمت (Claude AI) لتحليل البيانات من https://example.com بتكلفة €500
Esta frase contém cinco mudanças direccionais. O UBA trata a maioria delas correctamente — mas surgem casos extremos nas fronteiras entre sequências direccionais. O símbolo de moeda (€) pode ser posicionado antes ou depois do número dependendo do locale. Os parênteses podem ou não ser espelhados. O URL tem de permanecer da esquerda para a direita mesmo dentro de um contexto da direita para a esquerda.
Estes casos extremos não são teóricos. Aparecem em todas as comunicações empresariais que misturam árabe com terminologia técnica — que é quase todas as comunicações empresariais num contexto tecnológico. Uma ferramenta de IA que gera texto de direcção mista tem de tratar estes casos extremos correctamente, ou o output conterá erros subtis de ordenação que confundem o leitor e corroem a confiança.
Os erros são subtis porque parecem correctos a um não-leitor de árabe que revê a interface. O texto aparece renderizado. Os caracteres estão presentes. O algoritmo direccional processou. Mas o leitor árabe vê os erros imediatamente — um símbolo de moeda mal colocado, um parêntesis do lado errado, um número que parece pertencer à cláusula errada. Cada erro é um sinal: esta ferramenta não foi construída por alguém que lê árabe.
O Problema do Teclado
O problema de renderização começa depois de o utilizador escrever. Mas a própria escrita transporta expectativas culturais.
As disposições de teclado árabe colocam caracteres em posições que diferem dos seus equivalentes latinos. A disposição de teclado árabe padrão (ASMO 449) posiciona letras árabes de alta frequência na fila base — um design que reflecte a frequência de letras árabes, não associações de teclas latinas.
Quando uma interface de IA aceita input de texto árabe, tem de tratar: movimento do cursor da direita para a esquerda, selecção de texto da direita para a esquerda (a selecção deve estender-se para a direita quando a tecla shift-esquerda é premida, não para a esquerda), posicionamento do cursor da direita para a esquerda, e comportamento de edição da direita para a esquerda (o backspace deve apagar o carácter à direita do cursor na ordem visual, que está à esquerda na ordem lógica).
Cada uma destas interacções é a imagem espelhada do comportamento latino. Uma interface que trata input de texto usando pressupostos latinos — movimento do cursor da esquerda para a direita, selecção da esquerda para a direita, posicionamento do cursor da esquerda para a direita — produz uma experiência de edição onde a memória muscular do utilizador entra em conflito com o comportamento da interface. O utilizador carrega na seta esquerda para mover o cursor para a frente no texto. O cursor move-se para trás. A dissonância é imediata e persistente.
O Problema das Fontes
O pipeline de renderização depende da fonte. E as escolhas de fontes disponíveis para árabe na maioria das interfaces de IA são inadequadas.
A tipografia latina tem décadas de design de tipos digital por trás de si. O número de fontes latinas de alta qualidade disponíveis para renderização web mede-se em milhares. O número de fontes árabes de alta qualidade desenhadas para renderização em ecrã mede-se em dezenas.
Esta disparidade não é acidental. O design de tipos para árabe é mais difícil do que o design de tipos para latim. Uma fonte latina requer aproximadamente 200–400 glifos para cobertura completa (maiúsculas e minúsculas, numerais, pontuação, diacríticos). Uma fonte árabe com modelação contextual correcta requer aproximadamente 600–1.200 glifos (quatro formas por letra, mais ligaduras, mais combinações de sinais diacríticos, mais caracteres árabes estendidos para línguas como urdu, pachto e curdo).
A complexidade multiplica-se para fontes Nasta’liq, que requerem vários milhares de glifos para tratar a linha de base diagonal, empilhamento multi-nível e as conexões variáveis entre letras. A fonte Mehr Nastaliq contém mais de 20.000 glifos. Isto não é excesso — é o mínimo necessário para renderização Nasta’liq correcta.
A implicação económica: o design de tipos para árabe é mais caro, mais demorado e mais tecnicamente exigente do que o design de tipos para latim. Menos designers especializam-se nele. Menos fundições investem nele. O resultado é uma biblioteca menor de fontes árabes de alta qualidade para ecrã — o que significa que as interfaces de IA que implementam texto árabe têm menos boas opções e é mais provável que recorram a fontes de sistema por defeito que foram desenhadas para impressão, não para renderização em ecrã nos tamanhos de texto de chatbot.
A resposta de design: investir em tipografia árabe. Encomendar ou licenciar fontes árabes desenhadas especificamente para renderização em ecrã nos tamanhos usados em interfaces de chatbot (tipicamente 14–16px). Garantir que a fonte inclui modelação contextual completa, ligaduras obrigatórias e posicionamento correcto de sinais diacríticos. Testar a fonte nos tamanhos reais, nos ecrãs reais, com o motor de renderização real que a interface usa.
Uma resposta em árabe lindamente renderizada ganha confiança antes de uma única palavra ser lida. Uma resposta em árabe mal renderizada perde confiança antes de uma única palavra ser lida. A tipografia não é decoração. É o primeiro sinal.
O Custo da Iliteracia Cultural
O mercado de língua árabe inclui 22 países com um PIB combinado de aproximadamente 3,5 biliões de dólares. Só os estados do Conselho de Cooperação do Golfo (Arábia Saudita, EAU, Qatar, Kuwait, Barém, Omã) têm um PIB combinado superior a 2 biliões de dólares e estão a investir centenas de milhares de milhões de dólares em infraestrutura tecnológica e desenvolvimento de IA.
A Visão 2030 da Arábia Saudita inclui objectivos específicos para adopção de IA nos sectores público e privado. A Estratégia Nacional de IA 2031 dos EAU posiciona o país como líder global em IA. Estas não são declarações aspiracionais. São programas financiados com orçamentos de aquisição.
Uma ferramenta de IA que renderiza texto árabe com modelação contextual partida, ligaduras em falta, Nasta’liq horizontal e tratamento bidireccional incorrecto não está a competir por este mercado. Está a excluir-se dele. Não pelo preço. Não pelas funcionalidades. Pela tipografia.
A exclusão não é anunciada. É experimentada. O responsável de aquisições em Riade abre a ferramenta de IA, vê a renderização de texto e faz um julgamento: esta ferramenta não compreende o árabe. O julgamento é correcto. O processo de aquisição termina.
O Que “Multilingue” Requer
Para o árabe especificamente, “multilingue” requer:
Modelação contextual correcta com todas as quatro formas posicionais para cada letra. Ligaduras obrigatórias renderizadas automaticamente. Ligaduras opcionais disponíveis para contextos formais. Sinais diacríticos posicionados correctamente relativamente aos caracteres base. Justificação por kashida, não justificação por espaço entre palavras. Disposição da direita para a esquerda com tratamento bidireccional correcto para conteúdo de escrita mista. Movimento do cursor, selecção de texto e posicionamento do cursor da direita para a esquerda. Renderização Nasta’liq para texto em urdu e persa. Selecção de fontes que respeite a tradição caligráfica — não uma fonte latina com glifos árabes adicionados, mas uma fonte desenhada para árabe desde a base.
Estas não são funcionalidades premium. São a base. Uma ferramenta de IA que reclama suporte para árabe sem cumprir estes requisitos está a fazer uma afirmação que não mereceu.
O árabe não é latim da direita para a esquerda. É árabe.
A diferença é o problema inteiro. E o problema tem solução. A solução não é inventar nova tecnologia de renderização. A tecnologia existe — HarfBuzz, OpenType, o Unicode Bidirectional Algorithm, ICU, propriedades lógicas CSS. A solução é usar a tecnologia que existe, dar prioridade às escritas que servem a maioria dos leitores do mundo e parar de tratar a tipografia não-latina como caso extremo.
Três mil milhões de pessoas lêem escritas não-latinas. O caso extremo é o pressuposto de que o latim é o defeito.
O árabe é árabe. Construir para o árabe.