Lateinische Schrift verzeiht viel. Im Arabischen wird aus jedem Layout eine Präzisionsaufgabe, sobald verbundene Buchstaben, vier Formvarianten und ein eigener Zeilenausgleich ins Spiel kommen.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenDie arabische Typografie stellt Frontend-Teams vor Probleme, die im lateinischen Schriftsatz nie auftreten. Buchstaben verbinden sich zu durchgehenden Wörtern, jede Form hängt von der Position ab, und der Zeilenausgleich läuft nicht über Wortabstände, sondern über das Strecken der Buchstaben selbst. Ein technischer Essay führt durch diese Mechanik und zeigt, warum so viele mehrsprachige Websites genau an dieser Stelle brechen.
Das Wichtigste in Kürze
- Arabisch ist eine verbundene Schrift: Jeder Buchstabe nimmt je nach Position bis zu vier verschiedene Formen an.
- Der Zeilenausgleich erfolgt über Kashida, also das Strecken der Verbindungslinie innerhalb eines Wortes, nicht über breitere Wortabstände.
- Veraltete Unicode-Zeichen und der Bidi-Algorithmus sorgen bis heute für Fehler in PDFs, Formularen und Suchfunktionen.
Warum reicht ein lateinisches Layout-Modell nicht?

Verbundene Schrift. Arabische Buchstaben stehen nicht einzeln nebeneinander, sondern verbinden sich zu fließenden Wörtern. Dieselbe Letter sieht am Wortanfang anders aus als in der Mitte, am Ende oder allein stehend. Diese vier Formen wählt der Renderer beim sogenannten Shaping anhand der Nachbarzeichen aus. Ein Layout, das nur Zeichen aneinanderreiht, scheitert an dieser Logik.
Was macht den Zeilenumbruch so kompliziert?

Kashida statt Wortabstand. Eine Zeile lateinischen Texts wird durch breitere Lücken zwischen den Wörtern gefüllt. Arabischer Text dehnt stattdessen die Buchstaben selbst, indem an passenden Verbindungsstellen eine Kashida eingefügt wird. Welche Stelle sich dafür eignet, hängt von der jeweiligen Glyphe ab. Umbruch und Streckung müssen daher gemeinsam berechnet werden, was die Sache deutlich aufwendiger macht als einen simplen Wortumbruch.
Mehrsprachigkeit ist kein Feature, das man am Ende dranschraubt. Bei Schriften wie Arabisch oder Hebräisch entscheidet sie über die Qualität des gesamten Frontends.
— Michael Dobler, Herausgeber Dr. Web
Welche Lehren ziehen Webentwickler daraus?

Bidi und Altlasten. Der Bidi-Algorithmus nach UAX #9 regelt, wie sich Schreibrichtungen mischen, etwa wenn lateinische Markennamen in arabischem Fließtext stehen. Daneben existieren veraltete Unicode-Zeichen für jede einzelne Buchstabenform, die nur aus Kompatibilitätsgründen erhalten blieben. Viele PDF-Extraktoren erzeugen genau diese Zeichen, was beim Kopieren und Durchsuchen zu schwer auffindbaren Fehlern führt.
Sauber umsetzen. Setzen Sie auf logisches dir="rtl" und CSS-Logical-Properties statt auf feste links/rechts-Angaben, und prüfen Sie Formulare mit gemischtem Text früh im Projekt. Eine geordnete Checkliste vor dem Go-live fängt solche Fälle ab, bevor sie produktiv gehen. Den vollständigen technischen Streifzug stellt der Autor frei auf lr0.org bereit.