Het Arabische kalligrafieprobleem
Bernardo 27 januari 2026

Het Arabische kalligrafieprobleem

12 min leestijd

Arabisch is niet rechts-naar-links Latijn.

Deze zin bevat het hele probleem. Elke AI-interface die Arabisch behandelt als Latijns schrift omgekeerd gerenderd, heeft gefaald — niet op taalniveau, niet op vertaalniveau, maar op typografisch niveau. Het falen is architecturaal. Het zit ingebakken in de rendering engine, de fontkeuze, het tekstlayout-algoritme en de interactiepatronen.

Het resultaat is tekst die Arabische lezers kunnen decoderen maar niet vertrouwen. Het decoderen is functioneel. Het wantrouwen is cultureel. En het wantrouwen bepaalt adoptie.

Het verbonden schrift

Latijnse letters zijn discreet. Elke letter is een afzonderlijke glyph, onafhankelijk gepositioneerd, gescheiden door de ruimte die het inneemt. Het woord “hello” is vijf onafhankelijke vormen horizontaal gerangschikt.

Arabische letters zijn verbonden. Elke letter sluit aan op zijn buren in een doorlopende stroom. Het woord “مرحبا” (marhaba, “hallo”) is niet vijf onafhankelijke vormen. Het is een enkele verbonden vorm — een kalligrafische eenheid waar de vorm van elke letter afhangt van zijn positie in het woord en zijn relatie tot aangrenzende letters.

Deze positieafhankelijkheid is het fundamentele architecturale verschil. Elke Arabische letter heeft tot vier onderscheiden vormen:

Geïsoleerde vorm. De letter staat alleen, niet verbonden met een andere letter. Gebruikt aan het einde van woorden na niet-verbindende letters, of wanneer de letter onafhankelijk verschijnt.

Initiële vorm. De letter verschijnt aan het begin van een verbonden reeks. Hij verbindt met de volgende letter maar niet met de voorgaande.

Mediale vorm. De letter verschijnt in het midden van een verbonden reeks. Hij verbindt met zowel de voorgaande als de volgende letter.

Finale vorm. De letter verschijnt aan het einde van een verbonden reeks. Hij verbindt met de voorgaande letter maar niet met de volgende.

De letter “ع” (ain) in zijn vier vormen ziet er in elke positie wezenlijk anders uit. De geïsoleerde vorm is een afgeronde, op zichzelf staande vorm. De initiële vorm strekt een verbinding uit naar rechts (richting de volgende letter). De mediale vorm verbindt aan beide kanten. De finale vorm verbindt naar links (vanaf de voorgaande letter) en sluit.

Dit is geen stilistische variatie. Dit is het schrift. Arabisch zonder contextuele vormgeving is niet vereenvoudigd Arabisch. Het is gebroken Arabisch — letters die niet verbinden, woorden die verschijnen als losgekoppelde fragmenten, tekst die technisch bestaat uit de juiste tekens maar visueel incoherent is.

Wat “renderen” betekent in het Arabisch

In Latijnse typografie is renderen grotendeels een kwestie van positionering: plaats elke glyph in volgorde, pas kerning-aanpassingen toe tussen bepaalde paren, en de tekst is leesbaar. Het proces is lineair en voorspelbaar.

In Arabische typografie is renderen een meerstaps-proces:

Stap 1: Tekenanalyse. De rendering engine onderzoekt elk teken in de tekst en bepaalt zijn positie in de verbonden reeks — initieel, mediaal, finaal of geïsoleerd. Deze analyse hangt af van de buren van het teken. Sommige Arabische letters verbinden aan beide kanten (bidirectionele verbinders zoals ب, ت, ث). Andere verbinden alleen naar rechts (rechts-verbinders zoals ا, د, ذ, ر, ز, و). De rendering engine moet weten welke letters verbinden en welke niet.

Stap 2: Glyphselectie. Op basis van de positieanalyse selecteert de engine de juiste glyphvorm uit het font. Een font dat Arabisch correct ondersteunt moet alle vier vormen van elke letter bevatten — plus ligaturen (gecombineerde vormen voor veelvoorkomende letterparen). De Arabische ligatuur “لا” (lam-alef) is niet twee letters naast elkaar gerenderd. Het is een enkele gecombineerde glyph met zijn eigen specifieke vorm. Het font moet deze ligatuur bevatten. De engine moet herkennen wanneer die gebruikt moet worden.

Stap 3: Contextuele vormgeving. OpenType-fonts gebruiken GSUB (glyph substitution) en GPOS (glyph positioning) tabellen voor contextuele vormgeving. De “init,” “medi,” “fina,” en “isol” features voeren de positiesubstitutie uit. De “liga” en “rlig” features behandelen ligaturen — verplichte ligaturen die toegepast moeten worden voor correcte rendering en optionele ligaturen die de visuele kwaliteit verbeteren.

Stap 4: Markpositionering. Arabisch gebruikt diakritische tekens — punten, klinkermarkeringen (harakat) en andere annotaties die gepositioneerd worden relatief aan de basisletter. De positionering is niet vast. Die hangt af van de lettervorm, de omringende context en de typografische traditie. De shadda (ّ) — een teken dat gemination aangeeft — moet precies boven de letter worden gepositioneerd die het modificeert, aangepast voor de hoogte en breedte van de letter. Incorrecte markpositionering is onmiddellijk zichtbaar voor elke Arabische lezer.

Stap 5: Uitvulling. Arabische tekstuitvulling wordt niet bereikt door spaties toe te voegen tussen woorden, zoals in Latijnse typografie. Traditionele Arabische uitvulling gebruikt kashida — een verlenging van de verbindingsstreek tussen letters. De kashida verlengt de horizontale verbinding zonder de lettervormen te veranderen. Het is esthetisch integraal aan het schrift. Een AI-interface die Arabische tekst uitvult door woordspaties toe te voegen produceert tekst die er technisch uitgelijnd uitziet en visueel fout is.

Elk van deze stappen moet correct worden uitgevoerd om de tekst leesbaar te maken op de manier die een Arabische lezer verwacht. Een fout in welke stap dan ook — verkeerde positievorm, ontbrekende ligatuur, verkeerd geplaatst diakritisch teken, woordspatie-uitvulling — produceert tekst die technisch decodeerbaar maar cultureel ongeletterd is.

De kalligrafische traditie

Arabisch schrift is niet slechts een schrijfsysteem. Het is een kalligrafische traditie — een van de grote kunstvormen ter wereld, veertien eeuwen lang onafgebroken beoefend, verheven tot de hoogste status in islamitische kunst en architectuur.

Deze traditie vormt verwachtingen. Een Arabische lezer beoordeelt tekst niet op de manier waarop een Latijnse lezer tekst beoordeelt. Een Latijnse lezer verwacht regelmaat, consistentie en mechanische precisie. Een Arabische lezer verwacht stroming, verbinding en proportie — kwaliteiten die geërfd zijn uit eeuwen van kalligrafische praktijk.

De zes canonieke schriftstijlen van Arabische kalligrafie — Naskh, Thuluth, Nasta’liq, Diwani, Ruq’ah en Kufi — vertegenwoordigen verschillende esthetische tradities, elk met specifieke regels voor proportie, verbinding en compositie. Moderne Arabische typografie put voornamelijk uit Naskh (het standaard tekstschrift) en Ruq’ah (het alledaagse handschrift), maar de kalligrafische sensibiliteit — de verwachting van vloeiende verbinding, proportionele harmonie en visueel ritme — houdt stand in alle contexten.

Een AI-interface die Arabische tekst rendert in een basis Naskh-font met correcte contextuele vormgeving produceert leesbare tekst. Een AI-interface die Arabische tekst rendert met verfijnde typografie — gepaste ligaturen, kashida-uitvulling, juiste markpositionering en proportionele letterafstand — produceert tekst die de kalligrafische traditie respecteert.

Het verschil is het verschil tussen functioneel en native. Tussen technisch correct en cultureel competent.

De Nasta’liq-dimensie

Het probleem wordt dieper voor Urdu, Pasjtoe en Perzisch.

Deze talen gebruiken Arabisch schrift maar hanteren de Nasta’liq kalligrafische stijl — een stijl die fundamenteel onverenigbaar is met het horizontale basislijnmodel dat alle op Latijn gebaseerde rendering engines veronderstellen.

Nasta’liq wordt geschreven op een diagonale basislijn. Letters stromen van rechtsboven naar linksonder binnen elk woord. De basislijn is niet horizontaal. Die loopt naar beneden. Elk woord vormt een dalende diagonaal, waarbij het volgende woord weer rechtsboven begint.

Nasta’liq renderen met een horizontale basislijn — wat de meeste AI-interfaces doen wanneer ze Urdu- of Perzische tekst tegenkomen — produceert tekst die technisch in het juiste schrift staat maar visueel en cultureel fout is. Het effect voor een Urdu-lezer is vergelijkbaar met Engels gerenderd in een font dat alle letters op een golvende lijn plaatst: technisch leesbaar, esthetisch aanstootgevend en cultureel vervreemdend.

Urdu wordt gesproken door 230 miljoen mensen. Het is de nationale taal van Pakistan. Urdu renderen in horizontaal Naskh in plaats van diagonaal Nasta’liq is geen kleine typografische keuze. Het is het equivalent van Engels renderen in een font dat geen enkele Engelse lezer vrijwillig zou gebruiken.

De technische uitdaging is reëel. Nasta’liq-rendering vereist een complexe layout-engine die diagonale basislijnen, variabele letterpositionering en meerniveau-stapeling verwerkt. Maar de uitdaging is opgelost: de Mehr Nastaliq en Jameel Noori Nastaleeq fonts verwerken Nasta’liq-rendering via geavanceerde OpenType-features. De rendering engines bestaan. De integratie in AI-interfaces niet.

De bidirectionele complexiteit

Arabische tekst verschijnt zelden alleen. In modern gebruik — vooral in technologiecontexten — wordt Arabische tekst gemengd met Latijnse tekst, cijfers, URL’s, codefragmenten, productnamen en technische termen. Het mengen is constant en onregelmatig.

Het Unicode Bidirectional Algorithm (UBA) verwerkt het algemene geval: wanneer rechts-naar-links tekst links-naar-rechts elementen bevat, bepaalt het algoritme de weergavevolgorde. Maar het algemene geval is niet het enige geval.

Neem een Arabische zin die een Engelse productnaam, een URL, een getal met een valutasymbool en een parenthetische opmerking in het Frans bevat:

استخدمت (Claude AI) لتحليل البيانات من https://example.com بتكلفة €500

Deze zin bevat vijf richtingswisselingen. Het UBA verwerkt de meeste correct — maar randgevallen ontstaan op de grenzen tussen directionele runs. Het valutasymbool (€) kan voor of na het getal gepositioneerd worden afhankelijk van de locale. De haakjes kunnen wel of niet gespiegeld worden. De URL moet links-naar-rechts blijven zelfs binnen een rechts-naar-links context.

Deze randgevallen zijn niet theoretisch. Ze verschijnen in elke zakelijke communicatie die Arabisch mengt met technische terminologie — dat is vrijwel elke zakelijke communicatie in een technologiecontext. Een AI-tool die gemengd-directionele tekst genereert moet deze randgevallen correct verwerken, anders bevat de output subtiele volgordefouten die de lezer verwarren en het vertrouwen ondermijnen.

De fouten zijn subtiel omdat ze er correct uitzien voor een niet-Arabische lezer die de interface beoordeelt. De tekst lijkt gerenderd. De tekens zijn aanwezig. Het directionele algoritme heeft verwerkt. Maar de Arabische lezer ziet de fouten onmiddellijk — een verkeerd geplaatst valutasymbool, een haakje aan de verkeerde kant, een getal dat bij de verkeerde bijzin lijkt te horen. Elke fout is een signaal: dit hulpmiddel is niet gebouwd door iemand die Arabisch leest.

Het toetsenbordprobleem

Het renderingprobleem begint nadat de gebruiker typt. Maar het typen zelf draagt culturele verwachtingen.

Arabische toetsenbordindelingen plaatsen tekens op posities die afwijken van hun Latijnse equivalenten. De standaard Arabische toetsenbordindeling (ASMO 449) positioneert hoogfrequente Arabische letters op de thuisrij — een ontwerp dat de Arabische letterfrequentie weerspiegelt, niet Latijnse toetsassociaties.

Wanneer een AI-interface Arabische tekstinvoer accepteert, moet die verwerken: rechts-naar-links cursorbeweging, rechts-naar-links tekstselectie (selectie moet naar rechts uitbreiden wanneer shift-links wordt ingedrukt, niet naar links), rechts-naar-links caretpositionering, en rechts-naar-links bewerkingsgedrag (backspace moet het teken rechts van de caret verwijderen in de visuele volgorde, wat links is in de logische volgorde).

Elk van deze interacties is het spiegelbeeld van het Latijnse gedrag. Een interface die tekstinvoer verwerkt met Latijnse aannames — links-naar-rechts cursorbeweging, links-naar-rechts selectie, links-naar-rechts caretpositionering — produceert een bewerkingservaring waar het spiergeheugen van de gebruiker conflicteert met het gedrag van de interface. De gebruiker drukt de linkerpijltoets in om de caret vooruit te bewegen in de tekst. De caret beweegt achteruit. De dissonantie is onmiddellijk en aanhoudend.

Het fontprobleem

De renderingpijplijn hangt af van het font. En de fontkeuzes die beschikbaar zijn voor Arabisch in de meeste AI-interfaces zijn ontoereikend.

Latijnse typografie heeft decennia van digitaal typeontwerp achter zich. Het aantal kwalitatief hoogwaardige Latijnse fonts beschikbaar voor webrendering telt in de duizenden. Het aantal kwalitatief hoogwaardige Arabische fonts ontworpen voor schermrendering telt in de tientallen.

Deze discrepantie is niet toevallig. Typeontwerp voor Arabisch is moeilijker dan typeontwerp voor Latijn. Een Latijns font vereist ongeveer 200-400 glyphs voor volledige dekking (hoofd- en kleine letters, cijfers, interpunctie, diakritische tekens). Een Arabisch font met juiste contextuele vormgeving vereist ongeveer 600-1.200 glyphs (vier vormen per letter, plus ligaturen, plus diakritische tekencombinaties, plus uitgebreide Arabische tekens voor talen als Urdu, Pasjtoe en Koerdisch).

De complexiteit vermenigvuldigt voor Nasta’liq-fonts, die meerdere duizenden glyphs vereisen voor het verwerken van de diagonale basislijn, meerniveau-stapeling en de variabele verbindingen tussen letters. Het Mehr Nastaliq-font bevat meer dan 20.000 glyphs. Dit is geen overmaat — het is het minimum dat vereist is voor correcte Nasta’liq-rendering.

De economische implicatie: typeontwerp voor Arabisch is duurder, tijdrovender en technisch veeleisender dan typeontwerp voor Latijn. Minder ontwerpers specialiseren zich erin. Minder foundries investeren erin. Het resultaat is een kleinere bibliotheek van kwalitatief hoogwaardige Arabische schermfonts — wat betekent dat AI-interfaces die Arabische tekst uitrollen minder goede opties hebben en eerder terugvallen op systeemstandaarden die ontworpen zijn voor print, niet voor schermrendering op chatbot-tekstgroottes.

De ontwerprespons: investeer in Arabische typografie. Geef opdracht voor of licensieer Arabische fonts die specifiek ontworpen zijn voor schermrendering op de groottes die gebruikt worden in chatbot-interfaces (doorgaans 14-16px). Zorg dat het font volledige contextuele vormgeving, verplichte ligaturen en juiste diakritische markpositionering bevat. Test het font op de werkelijke groottes, op de werkelijke schermen, met de werkelijke rendering engine die de interface gebruikt.

Een prachtig gerenderd Arabisch antwoord verdient vertrouwen voordat er een enkel woord gelezen is. Een slecht gerenderd Arabisch antwoord verliest vertrouwen voordat er een enkel woord gelezen is. Typografie is geen decoratie. Het is het eerste signaal.

De kosten van culturele ongeletterdheid

De Arabisch-sprekende markt omvat 22 landen met een gecombineerd BBP van ongeveer $3,5 biljoen. De staten van de Gulf Cooperation Council alleen (Saudi-Arabië, VAE, Qatar, Koeweit, Bahrein, Oman) hebben een gecombineerd BBP van meer dan $2 biljoen en investeren honderden miljarden dollars in technologische infrastructuur en AI-ontwikkeling.

Saudi-Arabië’s Vision 2030 omvat specifieke doelstellingen voor AI-adoptie over overheids- en privésectoren. De National AI Strategy 2031 van de VAE positioneert het land als wereldwijd AI-leider. Dit zijn geen aspirationele verklaringen. Het zijn gefinancierde programma’s met aanbestedingsbudgetten.

Een AI-tool die Arabische tekst rendert met gebroken contextuele vormgeving, ontbrekende ligaturen, horizontaal Nasta’liq en incorrecte bidirectionele verwerking concurreert niet voor deze markt. Die sluit zichzelf ervan uit. Niet via prijsstelling. Niet via features. Via typografie.

De uitsluiting wordt niet aangekondigd. Die wordt ervaren. De inkoopfunctionaris in Riyad opent de AI-tool, ziet de tekstrendering en maakt een oordeel: dit hulpmiddel begrijpt Arabisch niet. Het oordeel is correct. Het aanbestedingsproces eindigt.

Wat “meertalig” vereist

Specifiek voor Arabisch vereist “meertalig”:

Correcte contextuele vormgeving met alle vier positievormen voor elke letter. Verplichte ligaturen automatisch gerenderd. Optionele ligaturen beschikbaar voor formele contexten. Diakritische tekens correct gepositioneerd ten opzichte van basistekens. Kashida-uitvulling, niet woordspatie-uitvulling. Rechts-naar-links layout met correcte bidirectionele verwerking voor gemengd-schrift content. Rechts-naar-links cursorbeweging, tekstselectie en caretpositionering. Nasta’liq-rendering voor Urdu- en Perzische tekst. Fontselectie die de kalligrafische traditie respecteert — niet een Latijns font met Arabische glyphs erbij geplakt, maar een font dat van de grond af ontworpen is voor Arabisch.

Dit zijn geen premium features. Dit is de basislijn. Een AI-tool die Arabische ondersteuning claimt zonder aan deze vereisten te voldoen maakt een claim die niet verdiend is.

Arabisch is niet rechts-naar-links Latijn. Het is Arabisch.

Het verschil is het hele probleem. En het probleem heeft een aanpak. De aanpak is niet het uitvinden van nieuwe renderingtechnologie. De technologie bestaat — HarfBuzz, OpenType, het Unicode Bidirectional Algorithm, ICU, CSS logical properties. De aanpak is de bestaande technologie gebruiken, prioriteit geven aan de schriftsystemen die de meerderheid van de wereldlezers bedienen, en stoppen met niet-Latijnse typografie als randgeval te behandelen.

Drie miljard mensen lezen niet-Latijnse schriften. Het randgeval is de veronderstelling dat Latijn de standaard is.

Arabisch is Arabisch. Bouw voor Arabisch.

Geschreven door
Bernardo
Cultureel Vertaler

Hij zorgt ervoor dat jouw Gizmo niet alleen Spaans spreekt — maar ook Spaans klinkt. Als het team van een Noordse klant hun Gizmo een Finse bijnaam geeft, is dat zijn werk.

← Alle notities