Il problema della calligrafia araba
Bernardo 27 gennaio 2026

Il problema della calligrafia araba

13 min di lettura

L’arabo non è latino da destra a sinistra.

Questa frase contiene l’intero problema. Ogni interfaccia IA che tratta l’arabo come scrittura latina resa al contrario ha fallito — non a livello linguistico, non a livello di traduzione, ma a livello tipografico. Il fallimento è architetturale. È incorporato nel motore di rendering, nella selezione dei font, nell’algoritmo di layout del testo e nei modelli di interazione.

Il risultato è testo che i lettori arabi possono decodificare ma di cui non si fidano. La decodifica è funzionale. La sfiducia è culturale. E la sfiducia determina l’adozione.

La scrittura connessa

Le lettere latine sono discrete. Ogni lettera è un glifo separato, posizionato indipendentemente, separato dallo spazio che occupa. La parola “hello” è cinque forme indipendenti disposte orizzontalmente.

Le lettere arabe sono connesse. Ogni lettera si unisce alle vicine in un flusso continuo. La parola “مرحبا” (marhaba, che significa “ciao”) non è cinque forme indipendenti. È una singola forma connessa — un’unità calligrafica dove la forma di ogni lettera dipende dalla sua posizione nella parola e dalla sua relazione con le lettere adiacenti.

Questa dipendenza posizionale è la differenza architetturale fondamentale. Ogni lettera araba ha fino a quattro forme distinte:

Forma isolata. La lettera sta da sola, non connessa a nessun’altra lettera. Usata alla fine delle parole dopo lettere non connettive, o quando la lettera appare indipendentemente.

Forma iniziale. La lettera appare all’inizio di una sequenza connessa. Si connette alla lettera seguente ma non alla precedente.

Forma mediale. La lettera appare nel mezzo di una sequenza connessa. Si connette sia alla lettera precedente che a quella seguente.

Forma finale. La lettera appare alla fine di una sequenza connessa. Si connette alla lettera precedente ma non alla seguente.

La lettera “ع” (ain) nelle sue quattro forme appare sostanzialmente diversa in ogni posizione. La forma isolata è una forma arrotondata, autocontenuta. La forma iniziale estende una connessione verso destra (verso la lettera successiva). La forma mediale si connette su entrambi i lati. La forma finale si connette a sinistra (dalla lettera precedente) e si chiude.

Questa non è una variazione stilistica. È la scrittura. L’arabo senza shaping contestuale non è arabo semplificato. È arabo rotto — lettere che non si connettono, parole che appaiono come frammenti disconnessi, testo tecnicamente composto dai caratteri corretti ma visivamente incoerente.

Cosa significa “rendering” in arabo

Nella tipografia latina, il rendering è in gran parte una questione di posizionamento: collocare ogni glifo in sequenza, applicare regolazioni di kerning tra certe coppie, e il testo è leggibile. Il processo è lineare e prevedibile.

Nella tipografia araba, il rendering è un processo a più stadi:

Stadio 1: Analisi dei caratteri. Il motore di rendering esamina ogni carattere nel testo e determina la sua posizione nella sequenza connessa — iniziale, mediale, finale o isolata. Questa analisi dipende dai caratteri vicini. Alcune lettere arabe si connettono su entrambi i lati (connettori bidirezionali come ب, ت, ث). Altre si connettono solo a destra (connettori del lato destro come ا, د, ذ, ر, ز, و). Il motore di rendering deve sapere quali lettere si connettono e quali no.

Stadio 2: Selezione del glifo. In base all’analisi posizionale, il motore seleziona la forma di glifo corretta dal font. Un font che supporta l’arabo correttamente deve contenere tutte e quattro le forme di ogni lettera — più le legature (forme combinate per coppie di lettere comuni). La legatura araba “لا” (lam-alef) non è due lettere rese fianco a fianco. È un singolo glifo combinato con la sua forma specifica. Il font deve contenere questa legatura. Il motore deve riconoscere quando usarla.

Stadio 3: Shaping contestuale. I font OpenType usano tabelle GSUB (sostituzione glifi) e GPOS (posizionamento glifi) per gestire lo shaping contestuale. Le funzionalità “init”, “medi”, “fina” e “isol” eseguono la sostituzione posizionale. Le funzionalità “liga” e “rlig” gestiscono le legature — legature obbligatorie che devono essere applicate per un rendering corretto e legature opzionali che migliorano la qualità visiva.

Stadio 4: Posizionamento dei segni. L’arabo usa segni diacritici — punti, segni vocalici (harakat) e altre annotazioni posizionate relativamente alla lettera base. Il posizionamento non è fisso. Dipende dalla forma della lettera, dal contesto circostante e dalla tradizione tipografica. La shadda (ّ) — un segno che indica geminazione — deve essere posizionata precisamente sopra la lettera che modifica, adeguata per l’altezza e la larghezza della lettera. Un posizionamento scorretto dei segni è immediatamente visibile a qualsiasi lettore arabo.

Stadio 5: Giustificazione. La giustificazione del testo arabo non si ottiene aggiungendo spazi tra le parole, come nella tipografia latina. La giustificazione araba tradizionale usa la kashida — un allungamento del tratto di connessione tra le lettere. La kashida estende la connessione orizzontale senza cambiare le forme delle lettere. È esteticamente integrale alla scrittura. Un’interfaccia IA che giustifica il testo arabo aggiungendo spazi tra le parole produce testo che sembra tecnicamente allineato e visivamente sbagliato.

Ciascuno di questi stadi deve essere eseguito correttamente perché il testo sia leggibile nel modo in cui un lettore arabo se lo aspetta. Un fallimento in qualsiasi stadio — forma posizionale sbagliata, legatura mancante, segno diacritico mal posizionato, giustificazione con spazi tra le parole — produce testo tecnicamente decodificabile ma culturalmente analfabeta.

La tradizione calligrafica

La scrittura araba non è meramente un sistema di scrittura. È una tradizione calligrafica — una delle grandi forme d’arte del mondo, praticata ininterrottamente per quattordici secoli, elevata al più alto status nell’arte e nell’architettura islamica.

Questa tradizione modella le aspettative. Un lettore arabo non valuta il testo come lo valuta un lettore latino. Un lettore latino si aspetta regolarità, coerenza e precisione meccanica. Un lettore arabo si aspetta flusso, connessione e proporzione — qualità ereditate da secoli di pratica calligrafica.

Le sei scritture canoniche della calligrafia araba — Naskh, Thuluth, Nasta’liq, Diwani, Ruq’ah e Kufi — rappresentano tradizioni estetiche diverse, ciascuna con regole specifiche di proporzione, connessione e composizione. La tipografia araba moderna attinge principalmente dal Naskh (la scrittura standard per il testo) e dal Ruq’ah (la scrittura quotidiana a mano), ma la sensibilità calligrafica — l’aspettativa di connessione fluente, armonia proporzionale e ritmo visivo — persiste in tutti i contesti.

Un’interfaccia IA che rende testo arabo in un font Naskh basilare con shaping contestuale corretto produce testo leggibile. Un’interfaccia IA che rende testo arabo con tipografia sofisticata — legature appropriate, giustificazione con kashida, posizionamento corretto dei segni e spaziatura proporzionale delle lettere — produce testo che rispetta la tradizione calligrafica.

La differenza è la differenza tra funzionale e nativo. Tra tecnicamente corretto e culturalmente competente.

La dimensione Nasta’liq

Il problema si approfondisce per urdu, pashto e persiano.

Queste lingue usano la scrittura araba ma impiegano lo stile calligrafico Nasta’liq — uno stile fondamentalmente incompatibile con il modello di base orizzontale che tutti i motori di rendering basati sul latino assumono.

Il Nasta’liq è scritto su una base diagonale. Le lettere fluiscono dall’alto a destra verso il basso a sinistra all’interno di ogni parola. La base non è orizzontale. Scende verso il basso. Ogni parola forma una diagonale discendente, con la parola successiva che ricomincia in alto a destra.

Rendere il Nasta’liq con una base orizzontale — che è ciò che la maggior parte delle interfacce IA fa quando incontra testo urdu o persiano — produce testo tecnicamente nella scrittura corretta ma visivamente e culturalmente sbagliato. L’effetto per un lettore urdu è paragonabile all’inglese reso in un font che mette tutte le lettere su una linea ondulata: tecnicamente leggibile, esteticamente offensivo e culturalmente alienante.

L’urdu è parlato da 230 milioni di persone. È la lingua nazionale del Pakistan. Rendere l’urdu in Naskh orizzontale invece che in Nasta’liq diagonale non è una scelta tipografica marginale. È l’equivalente di rendere l’inglese in un font che nessun lettore inglese userebbe volontariamente.

La sfida tecnica è reale. Il rendering Nasta’liq richiede un motore di layout complesso che gestisca basi diagonali, posizionamento variabile delle lettere e impilamento multi-livello. Ma la sfida è stata risolta: i font Mehr Nastaliq e Jameel Noori Nastaleeq gestiscono il rendering Nasta’liq attraverso funzionalità OpenType avanzate. I motori di rendering esistono. L’integrazione nelle interfacce IA no.

La complessità bidirezionale

Il testo arabo appare raramente da solo. Nell’uso moderno — specialmente nei contesti tecnologici — il testo arabo è mescolato con testo latino, numeri, URL, frammenti di codice, nomi di prodotti e termini tecnici. Il mescolamento è costante e irregolare.

L’Algoritmo Bidirezionale Unicode (UBA) gestisce il caso generale: quando testo da destra a sinistra contiene elementi da sinistra a destra, l’algoritmo determina l’ordine di visualizzazione. Ma il caso generale non è l’unico caso.

Considerate una frase araba che contiene un nome di prodotto inglese, un URL, un numero con un simbolo di valuta e una parentetica in francese:

استخدمت (Claude AI) لتحليل البيانات من https://example.com بتكلفة €500

Questa frase contiene cinque cambi direzionali. L’UBA gestisce la maggior parte di essi correttamente — ma casi limite sorgono ai confini tra segmenti direzionali. Il simbolo di valuta (€) può essere posizionato prima o dopo il numero a seconda della locale. Le parentesi possono essere specchiate o meno. L’URL deve rimanere da sinistra a destra anche in un contesto da destra a sinistra.

Questi casi limite non sono teorici. Appaiono in ogni comunicazione d’affari che mescola arabo con terminologia tecnica — che è quasi ogni comunicazione d’affari in un contesto tecnologico. Uno strumento IA che genera testo a direzione mista deve gestire questi casi limite correttamente, o l’output conterrà sottili errori di ordine che confondono il lettore e erodono la fiducia.

Gli errori sono sottili perché sembrano corretti a un non-lettore arabo che rivede l’interfaccia. Il testo appare reso. I caratteri sono presenti. L’algoritmo direzionale ha elaborato. Ma il lettore arabo vede gli errori immediatamente — un simbolo di valuta fuori posto, una parentesi dal lato sbagliato, un numero che sembra appartenere alla clausola sbagliata. Ogni errore è un segnale: questo strumento non è stato costruito da qualcuno che legge arabo.

Il problema della tastiera

Il problema del rendering inizia dopo che l’utente digita. Ma la digitazione stessa porta aspettative culturali.

I layout delle tastiere arabe posizionano i caratteri in posizioni diverse dai loro equivalenti latini. Il layout standard della tastiera araba (ASMO 449) posiziona le lettere arabe ad alta frequenza sulla riga base — un design che riflette la frequenza delle lettere arabe, non le associazioni dei tasti latini.

Quando un’interfaccia IA accetta input testuale arabo, deve gestire: movimento del cursore da destra a sinistra, selezione del testo da destra a sinistra (la selezione dovrebbe estendersi verso destra quando il tasto shift-sinistra è premuto, non verso sinistra), posizionamento del caret da destra a sinistra, e comportamento di editing da destra a sinistra (backspace dovrebbe cancellare il carattere alla destra del caret nell’ordine visivo, che è alla sinistra nell’ordine logico).

Ciascuna di queste interazioni è l’immagine speculare del comportamento latino. Un’interfaccia che gestisce l’input testuale usando assunzioni latine — movimento del cursore da sinistra a destra, selezione da sinistra a destra, posizionamento del caret da sinistra a destra — produce un’esperienza di editing dove la memoria muscolare dell’utente confligge con il comportamento dell’interfaccia. L’utente preme il tasto freccia sinistra per muovere il caret avanti nel testo. Il caret si muove indietro. La dissonanza è immediata e persistente.

Il problema dei font

La pipeline di rendering dipende dal font. E le scelte di font disponibili per l’arabo nella maggior parte delle interfacce IA sono inadeguate.

La tipografia latina ha decenni di design tipografico digitale alle spalle. Il numero di font latini di alta qualità disponibili per il rendering web si misura in migliaia. Il numero di font arabi di alta qualità progettati per il rendering su schermo si misura in decine.

Questa disparità non è accidentale. Il design tipografico per l’arabo è più difficile del design tipografico per il latino. Un font latino richiede circa 200-400 glifi per una copertura completa (maiuscole e minuscole, numeri, punteggiatura, diacritici). Un font arabo con shaping contestuale corretto richiede circa 600-1.200 glifi (quattro forme per lettera, più legature, più combinazioni di segni diacritici, più caratteri arabi estesi per lingue come urdu, pashto e curdo).

La complessità si moltiplica per i font Nasta’liq, che richiedono diverse migliaia di glifi per gestire la base diagonale, l’impilamento multi-livello e le connessioni variabili tra le lettere. Il font Mehr Nastaliq contiene oltre 20.000 glifi. Questo non è eccesso — è il minimo richiesto per un rendering Nasta’liq corretto.

L’implicazione economica: il design tipografico per l’arabo è più costoso, richiede più tempo ed è più tecnicamente impegnativo del design tipografico per il latino. Meno designer si specializzano in esso. Meno fonderie vi investono. Il risultato è una libreria più piccola di font arabi di alta qualità per schermo — il che significa che le interfacce IA che distribuiscono testo arabo hanno meno buone opzioni e hanno più probabilità di ripiegare su default di sistema progettati per la stampa, non per il rendering su schermo alle dimensioni di testo dei chatbot.

La risposta di design: investire nella tipografia araba. Commissionare o acquisire in licenza font arabi progettati specificamente per il rendering su schermo alle dimensioni usate nelle interfacce chatbot (tipicamente 14-16px). Assicurarsi che il font includa shaping contestuale completo, legature obbligatorie e posizionamento corretto dei segni diacritici. Testare il font alle dimensioni effettive, sugli schermi effettivi, con il motore di rendering effettivo che l’interfaccia usa.

Un testo arabo reso magnificamente guadagna fiducia prima che una singola parola venga letta. Un testo arabo reso male perde fiducia prima che una singola parola venga letta. La tipografia non è decorazione. È il primo segnale.

Il costo dell’analfabetismo culturale

Il mercato arabofono comprende 22 paesi con un PIL combinato di circa 3,5 trilioni di dollari. I soli stati del Consiglio di Cooperazione del Golfo (Arabia Saudita, Emirati Arabi Uniti, Qatar, Kuwait, Bahrain, Oman) hanno un PIL combinato che supera i 2 trilioni di dollari e stanno investendo centinaia di miliardi di dollari in infrastruttura tecnologica e sviluppo dell’IA.

La Vision 2030 dell’Arabia Saudita include obiettivi specifici per l’adozione dell’IA nei settori pubblico e privato. La Strategia Nazionale IA 2031 degli Emirati Arabi Uniti posiziona il paese come leader globale nell’IA. Queste non sono dichiarazioni aspirazionali. Sono programmi finanziati con budget di approvvigionamento.

Uno strumento IA che rende testo arabo con shaping contestuale rotto, legature mancanti, Nasta’liq orizzontale e gestione bidirezionale scorretta non sta competendo per questo mercato. Si sta escludendo da esso. Non attraverso il prezzo. Non attraverso le funzionalità. Attraverso la tipografia.

L’esclusione non viene annunciata. Viene sperimentata. Il responsabile acquisti a Riyadh apre lo strumento IA, vede il rendering del testo e formula un giudizio: questo strumento non capisce l’arabo. Il giudizio è corretto. Il processo di approvvigionamento finisce.

Cosa richiede “multilingue”

Per l’arabo specificamente, “multilingue” richiede:

Shaping contestuale corretto con tutte e quattro le forme posizionali per ogni lettera. Legature obbligatorie rese automaticamente. Legature opzionali disponibili per contesti formali. Segni diacritici posizionati correttamente rispetto ai caratteri base. Giustificazione con kashida, non giustificazione con spazi tra le parole. Layout da destra a sinistra con gestione bidirezionale corretta per contenuto a scrittura mista. Movimento del cursore, selezione del testo e posizionamento del caret da destra a sinistra. Rendering Nasta’liq per testo urdu e persiano. Selezione di font che rispetti la tradizione calligrafica — non un font latino con glifi arabi aggiunti, ma un font progettato per l’arabo dalle fondamenta.

Queste non sono funzionalità premium. Sono la base. Uno strumento IA che dichiara supporto arabo senza soddisfare questi requisiti sta facendo un’affermazione che non si è guadagnato.

L’arabo non è latino da destra a sinistra. È arabo.

La differenza è l’intero problema. E il problema ha una soluzione. La soluzione non è inventare nuova tecnologia di rendering. La tecnologia esiste — HarfBuzz, OpenType, l’Algoritmo Bidirezionale Unicode, ICU, le proprietà logiche CSS. La soluzione è usare la tecnologia che esiste, dare priorità alle scritture che servono la maggioranza dei lettori del mondo, e smettere di trattare la tipografia non latina come un caso limite.

Tre miliardi di persone leggono scritture non latine. Il caso limite è l’assunzione che il latino sia il default.

L’arabo è arabo. Costruire per l’arabo.

Scritto da
Bernardo
Traduttore Culturale

Si assicura che il tuo Gizmo non parli solo spagnolo — ma suoni spagnolo. Quando il team di un cliente nordico chiama il proprio Gizmo con un soprannome finlandese, è merito suo.

← Tutte le note