Bernardo 27 janvier 2026

Le problème de la calligraphie arabe

15 min de lecture

L’arabe n’est pas du latin de droite à gauche.

Cette phrase contient le problème dans son intégralité. Chaque interface IA qui traite l’arabe comme du script latin rendu à l’envers a échoué — pas au niveau linguistique, pas au niveau de la traduction, mais au niveau typographique. L’échec est architectural. Il est inscrit dans le moteur de rendu, la sélection de police, l’algorithme de mise en page du texte et les modes d’interaction.

Le résultat est du texte que les lecteurs arabes peuvent décoder mais auquel ils ne font pas confiance. Le décodage est fonctionnel. La méfiance est culturelle. Et la méfiance détermine l’adoption.

Le script connecté

Les lettres latines sont discrètes. Chaque lettre est un glyphe séparé, positionné indépendamment, séparé par l’espace qu’il occupe. Le mot « hello » est cinq formes indépendantes arrangées horizontalement.

Les lettres arabes sont connectées. Chaque lettre se joint à ses voisines dans un flux continu. Le mot « مرحبا » (marhaba, signifiant « bonjour ») n’est pas cinq formes indépendantes. C’est une forme connectée unique — une unité calligraphique où la forme de chaque lettre dépend de sa position dans le mot et de sa relation aux lettres adjacentes.

Cette dépendance positionnelle est la différence architecturale fondamentale. Chaque lettre arabe a jusqu’à quatre formes distinctes :

Forme isolée. La lettre se tient seule, non connectée à aucune autre lettre. Utilisée en fin de mot après des lettres non connectantes, ou quand la lettre apparaît indépendamment.

Forme initiale. La lettre apparaît au début d’une séquence connectée. Elle se connecte à la lettre suivante mais pas à la précédente.

Forme médiane. La lettre apparaît au milieu d’une séquence connectée. Elle se connecte aux lettres précédente et suivante.

Forme finale. La lettre apparaît à la fin d’une séquence connectée. Elle se connecte à la lettre précédente mais pas à la suivante.

La lettre « ع » (ain) dans ses quatre formes a une apparence substantiellement différente à chaque position. La forme isolée est une forme arrondie et autonome. La forme initiale étend une connexion vers la droite (vers la lettre suivante). La forme médiane se connecte des deux côtés. La forme finale se connecte à gauche (depuis la lettre précédente) et se referme.

Ce n’est pas une variation stylistique. C’est le script. L’arabe sans mise en forme contextuelle n’est pas de l’arabe simplifié. C’est de l’arabe cassé — des lettres qui ne se connectent pas, des mots qui apparaissent comme des fragments déconnectés, du texte techniquement composé des bons caractères mais visuellement incohérent.

Ce que « rendu » signifie en arabe

En typographie latine, le rendu est largement une affaire de positionnement : placer chaque glyphe en séquence, appliquer les ajustements de crénage entre certaines paires, et le texte est lisible. Le processus est linéaire et prévisible.

En typographie arabe, le rendu est un processus en plusieurs étapes :

Étape 1 : Analyse des caractères. Le moteur de rendu examine chaque caractère du texte et détermine sa position dans la séquence connectée — initiale, médiane, finale ou isolée. Cette analyse dépend des voisins du caractère. Certaines lettres arabes se connectent des deux côtés (connecteurs bidirectionnels comme ب, ت, ث). D’autres ne se connectent qu’à droite (connecteurs droits comme ا, د, ذ, ر, ز, و). Le moteur de rendu doit savoir quelles lettres se connectent et lesquelles non.

Étape 2 : Sélection de glyphes. En fonction de l’analyse positionnelle, le moteur sélectionne la forme de glyphe correcte depuis la police. Une police qui prend correctement en charge l’arabe doit contenir les quatre formes de chaque lettre — plus les ligatures (formes combinées pour les paires de lettres courantes). La ligature arabe « لا » (lam-alef) n’est pas deux lettres rendues côte à côte. C’est un glyphe combiné unique avec sa propre forme spécifique. La police doit contenir cette ligature. Le moteur doit savoir quand l’utiliser.

Étape 3 : Mise en forme contextuelle. Les polices OpenType utilisent les tables GSUB (substitution de glyphes) et GPOS (positionnement de glyphes) pour gérer la mise en forme contextuelle. Les fonctionnalités « init », « medi », « fina » et « isol » effectuent la substitution positionnelle. Les fonctionnalités « liga » et « rlig » gèrent les ligatures — les ligatures obligatoires qui doivent être appliquées pour un rendu correct et les ligatures optionnelles qui améliorent la qualité visuelle.

Étape 4 : Positionnement des marques. L’arabe utilise des marques diacritiques — des points, des marques de voyelles (harakat) et d’autres annotations positionnées relativement à la lettre de base. Le positionnement n’est pas fixe. Il dépend de la forme de la lettre, du contexte environnant et de la tradition typographique. La chadda (ّ) — une marque indiquant la gémination — doit être positionnée précisément au-dessus de la lettre qu’elle modifie, ajustée en fonction de la hauteur et de la largeur de la lettre. Un positionnement incorrect des marques est immédiatement visible pour tout lecteur arabe.

Étape 5 : Justification. La justification du texte arabe ne se fait pas en ajoutant des espaces entre les mots, comme en typographie latine. La justification arabe traditionnelle utilise le kashida — un allongement du trait de connexion entre les lettres. Le kashida étend la connexion horizontale sans changer les formes des lettres. Il fait partie intégrante de l’esthétique du script. Une interface IA qui justifie le texte arabe en ajoutant des espaces entre les mots produit un texte qui semble techniquement aligné et visuellement faux.

Chacune de ces étapes doit s’exécuter correctement pour que le texte soit lisible de la manière attendue par un lecteur arabe. Un échec à n’importe quelle étape — mauvaise forme positionnelle, ligature manquante, marque diacritique mal placée, justification par espaces entre mots — produit un texte techniquement décodable mais culturellement illettré.

La tradition calligraphique

Le script arabe n’est pas simplement un système d’écriture. C’est une tradition calligraphique — l’une des grandes formes d’art du monde, pratiquée sans interruption depuis quatorze siècles, élevée au plus haut rang dans l’art et l’architecture islamiques.

Cette tradition façonne les attentes. Un lecteur arabe n’évalue pas le texte de la même manière qu’un lecteur latin. Un lecteur latin attend de la régularité, de la cohérence et de la précision mécanique. Un lecteur arabe attend du flux, de la connexion et de la proportion — des qualités héritées de siècles de pratique calligraphique.

Les six scripts canoniques de la calligraphie arabe — Naskh, Thuluth, Nasta’liq, Diwani, Ruq’ah et Kufi — représentent des traditions esthétiques différentes, chacune avec des règles spécifiques de proportion, de connexion et de composition. La typographie arabe moderne s’inspire principalement du Naskh (le script de texte standard) et du Ruq’ah (le script d’écriture quotidienne), mais la sensibilité calligraphique — l’attente de connexion fluide, d’harmonie proportionnelle et de rythme visuel — persiste dans tous les contextes.

Une interface IA qui rend le texte arabe dans une police Naskh basique avec une mise en forme contextuelle correcte produit un texte lisible. Une interface IA qui rend le texte arabe avec une typographie sophistiquée — ligatures appropriées, justification par kashida, positionnement correct des marques et espacement proportionnel des lettres — produit un texte qui respecte la tradition calligraphique.

La différence est la différence entre fonctionnel et natif. Entre techniquement correct et culturellement compétent.

La dimension Nasta’liq

Le problème s’approfondit pour l’ourdou, le pachtoune et le persan.

Ces langues utilisent le script arabe mais emploient le style calligraphique Nasta’liq — un style fondamentalement incompatible avec le modèle de ligne de base horizontale que tous les moteurs de rendu basés sur le latin présupposent.

Le Nasta’liq s’écrit sur une ligne de base diagonale. Les lettres coulent du haut à droite vers le bas à gauche au sein de chaque mot. La ligne de base n’est pas horizontale. Elle descend. Chaque mot forme une diagonale descendante, le mot suivant reprenant en haut à droite.

Rendre le Nasta’liq avec une ligne de base horizontale — ce que font la plupart des interfaces IA quand elles rencontrent du texte ourdou ou persan — produit un texte techniquement dans le bon script mais visuellement et culturellement faux. L’effet pour un lecteur ourdou est comparable à de l’anglais rendu dans une police qui placerait toutes les lettres sur une ligne ondulée : techniquement lisible, esthétiquement offensant et culturellement aliénant.

L’ourdou est parlé par 230 millions de personnes. C’est la langue nationale du Pakistan. Rendre l’ourdou en Naskh horizontal au lieu du Nasta’liq diagonal n’est pas un choix typographique mineur. C’est l’équivalent de rendre l’anglais dans une police qu’aucun lecteur anglophone n’utiliserait volontairement.

Le défi technique est réel. Le rendu Nasta’liq nécessite un moteur de mise en page complexe qui gère les lignes de base diagonales, le positionnement variable des lettres et l’empilement multi-niveaux. Mais le défi a été résolu : les polices Mehr Nastaliq et Jameel Noori Nastaleeq gèrent le rendu Nasta’liq via des fonctionnalités OpenType avancées. Les moteurs de rendu existent. L’intégration dans les interfaces IA n’existe pas.

La complexité bidirectionnelle

Le texte arabe apparaît rarement seul. En usage moderne — particulièrement dans les contextes technologiques — le texte arabe est mélangé avec du texte latin, des chiffres, des URL, des extraits de code, des noms de produits et des termes techniques. Le mélange est constant et irrégulier.

L’algorithme bidirectionnel Unicode (UBA) gère le cas général : quand du texte de droite à gauche contient des éléments de gauche à droite, l’algorithme détermine l’ordre d’affichage. Mais le cas général n’est pas le seul cas.

Considérez une phrase arabe contenant un nom de produit en anglais, une URL, un nombre avec un symbole monétaire, et une parenthèse en français :

استخدمت (Claude AI) لتحليل البيانات من https://example.com بتكلفة €500

Cette phrase contient cinq changements directionnels. L’UBA gère la plupart d’entre eux correctement — mais des cas limites surgissent aux frontières entre les passages directionnels. Le symbole monétaire (€) peut être positionné avant ou après le nombre selon la locale. Les parenthèses peuvent être miroir ou non. L’URL doit rester de gauche à droite même dans un contexte de droite à gauche.

Ces cas limites ne sont pas théoriques. Ils apparaissent dans chaque communication d’affaires mélangeant arabe et terminologie technique — c’est-à-dire presque chaque communication d’affaires dans un contexte technologique. Un outil d’IA qui génère du texte à directionnalité mixte doit gérer ces cas limites correctement, ou l’output contiendra des erreurs d’ordonnancement subtiles qui perturbent le lecteur et érodent la confiance.

Les erreurs sont subtiles parce qu’elles semblent correctes à un non-arabophone examinant l’interface. Le texte semble rendu. Les caractères sont présents. L’algorithme directionnel a traité. Mais le lecteur arabe voit les erreurs immédiatement — un symbole monétaire mal placé, une parenthèse du mauvais côté, un nombre qui semble appartenir à la mauvaise proposition. Chaque erreur est un signal : cet outil n’a pas été construit par quelqu’un qui lit l’arabe.

Le problème du clavier

Le problème de rendu commence après que l’utilisateur tape. Mais la saisie elle-même porte des attentes culturelles.

Les dispositions de clavier arabes placent les caractères à des positions différentes de leurs équivalents latins. La disposition standard du clavier arabe (ASMO 449) positionne les lettres arabes à haute fréquence sur la rangée d’accueil — un design qui reflète la fréquence des lettres arabes, pas les associations de touches latines.

Quand une interface IA accepte une entrée en texte arabe, elle doit gérer : le mouvement du curseur de droite à gauche, la sélection de texte de droite à gauche (la sélection doit s’étendre vers la droite quand la touche maj-gauche est pressée, pas vers la gauche), le positionnement du caret de droite à gauche, et le comportement d’édition de droite à gauche (la touche retour arrière doit supprimer le caractère à droite du caret dans l’ordre visuel, qui est à gauche dans l’ordre logique).

Chacune de ces interactions est l’image miroir du comportement latin. Une interface qui gère l’entrée de texte avec des présupposés latins — mouvement du curseur de gauche à droite, sélection de gauche à droite, positionnement du caret de gauche à droite — produit une expérience d’édition où la mémoire musculaire de l’utilisateur entre en conflit avec le comportement de l’interface. L’utilisateur presse la touche flèche gauche pour avancer le caret dans le texte. Le caret recule. La dissonance est immédiate et persistante.

Le problème de police

Le pipeline de rendu dépend de la police. Et les choix de polices disponibles pour l’arabe dans la plupart des interfaces IA sont inadéquats.

La typographie latine a des décennies de design de caractères numériques derrière elle. Le nombre de polices latines de haute qualité disponibles pour le rendu web se mesure en milliers. Le nombre de polices arabes de haute qualité conçues pour le rendu écran se mesure en dizaines.

Cette disparité n’est pas accidentelle. Le design de caractères pour l’arabe est plus difficile que le design de caractères pour le latin. Une police latine nécessite environ 200 à 400 glyphes pour une couverture complète (majuscules et minuscules, chiffres, ponctuation, diacritiques). Une police arabe avec une mise en forme contextuelle correcte nécessite environ 600 à 1 200 glyphes (quatre formes par lettre, plus les ligatures, plus les combinaisons de marques diacritiques, plus les caractères arabes étendus pour des langues comme l’ourdou, le pachtoune et le kurde).

La complexité se multiplie pour les polices Nasta’liq, qui nécessitent plusieurs milliers de glyphes pour gérer la ligne de base diagonale, l’empilement multi-niveaux et les connexions variables entre lettres. La police Mehr Nastaliq contient plus de 20 000 glyphes. Ce n’est pas un excès — c’est le minimum requis pour un rendu Nasta’liq correct.

L’implication économique : le design de caractères pour l’arabe est plus coûteux, plus chronophage et plus techniquement exigeant que le design de caractères pour le latin. Moins de designers s’y spécialisent. Moins de fonderies y investissent. Le résultat est une bibliothèque plus restreinte de polices arabes de haute qualité pour écran — ce qui signifie que les interfaces IA déployant du texte arabe ont moins de bonnes options et sont plus susceptibles de recourir aux polices système par défaut, conçues pour l’impression et non pour le rendu écran aux tailles de texte de chatbot.

La réponse design : investir dans la typographie arabe. Commander ou licencier des polices arabes conçues spécifiquement pour le rendu écran aux tailles utilisées dans les interfaces de chatbot (typiquement 14-16 px). S’assurer que la police inclut une mise en forme contextuelle complète, les ligatures obligatoires et un positionnement correct des marques diacritiques. Tester la police aux tailles réelles, sur les écrans réels, avec le moteur de rendu réel que l’interface utilise.

Une réponse arabe joliment rendue gagne la confiance avant qu’un seul mot ne soit lu. Une réponse arabe mal rendue perd la confiance avant qu’un seul mot ne soit lu. La typographie n’est pas de la décoration. C’est le premier signal.

Le coût de l’illettrisme culturel

Le marché arabophone comprend 22 pays avec un PIB combiné d’environ 3 500 milliards de dollars. Les seuls États du Conseil de Coopération du Golfe (Arabie saoudite, Émirats arabes unis, Qatar, Koweït, Bahreïn, Oman) ont un PIB combiné dépassant 2 000 milliards de dollars et investissent des centaines de milliards de dollars dans l’infrastructure technologique et le développement de l’IA.

La Vision 2030 de l’Arabie saoudite inclut des objectifs spécifiques pour l’adoption de l’IA dans les secteurs public et privé. La Stratégie Nationale IA 2031 des Émirats arabes unis positionne le pays comme un leader mondial de l’IA. Ce ne sont pas des déclarations aspirationnelles. Ce sont des programmes financés avec des budgets d’approvisionnement.

Un outil d’IA qui rend le texte arabe avec une mise en forme contextuelle cassée, des ligatures manquantes, du Nasta’liq horizontal et une gestion bidirectionnelle incorrecte ne rivalise pas pour ce marché. Il s’en exclut. Pas par le prix. Pas par les fonctionnalités. Par la typographie.

L’exclusion n’est pas annoncée. Elle est vécue. Le responsable des achats à Riyad ouvre l’outil d’IA, voit le rendu du texte, et forme un jugement : cet outil ne comprend pas l’arabe. Le jugement est correct. Le processus d’approvisionnement s’arrête.

Ce que « multilingue » requiert

Pour l’arabe spécifiquement, « multilingue » requiert :

Une mise en forme contextuelle correcte avec les quatre formes positionnelles pour chaque lettre. Les ligatures obligatoires rendues automatiquement. Les ligatures optionnelles disponibles pour les contextes formels. Les marques diacritiques positionnées correctement par rapport aux caractères de base. La justification par kashida, pas par espaces entre mots. Une mise en page de droite à gauche avec une gestion bidirectionnelle correcte pour le contenu multi-script. Le mouvement de curseur de droite à gauche, la sélection de texte et le positionnement du caret. Le rendu Nasta’liq pour le texte ourdou et persan. Une sélection de police qui respecte la tradition calligraphique — pas une police latine avec des glyphes arabes ajoutés, mais une police conçue pour l’arabe depuis le départ.

Ce ne sont pas des fonctionnalités premium. C’est la base. Un outil d’IA qui revendique la prise en charge de l’arabe sans satisfaire ces exigences fait une affirmation qu’il n’a pas méritée.

L’arabe n’est pas du latin de droite à gauche. C’est de l’arabe.

La différence est le problème dans son intégralité. Et le problème a une solution. La solution n’est pas d’inventer une nouvelle technologie de rendu. La technologie existe — HarfBuzz, OpenType, l’algorithme bidirectionnel Unicode, ICU, les propriétés logiques CSS. La solution est d’utiliser la technologie qui existe, de prioriser les scripts qui servent la majorité des lecteurs du monde, et de cesser de traiter la typographie non latine comme un cas marginal.

Trois milliards de personnes lisent des scripts non latins. Le cas marginal est le présupposé que le latin est le standard.

L’arabe est de l’arabe. Construisez pour l’arabe.

Écrit par

Bernardo

Traducteur Culturel

Il fait en sorte que votre Gizmo ne parle pas seulement espagnol — il sonne espagnol. Quand l'équipe d'un client nordique appelle son Gizmo par un surnom finnois, c'est son travail qui parle.

← Toutes les notes