Vor einiger Zeit wurde ich angesprochen, wie man am besten eine Seite auf kyrillisch erstellen könne. Die Person hatte schon jeden erdenklichen Charset ausprobiert gehabt. Eigentlich müsste es ja charset=windows-1251 sein. Wollte aber nicht klappen. Also habe ich ihm ein kleines Skript geschrieben, das jedes kyrillische Zeichen mit der Funktion str_replace() in seinen entsprechenden Unicode umwandelt. Den Kauderwelsch, der dabei entsteht, muss man dann nur noch kopieren und in sein HTML-Dokument einfügen. Et voilà, man eine kyrillische Seite. Das Skript nenne ich den Russ-O-Mat. Ist keine welterneuernde Formel, war aber in diesem Fall eine ganz fiese Copy-Paste-Fummelarbeit, galt es doch 64 zu „übersetzen“. *puhh*
Aus aktuellem Anlass habe ich dann auch noch den Türk-O-Mat geschrieben. Ist um Längen kürzer (12 Zeichen), funktioniert gleich, ersetzt aber die Sonderzeichen nicht nur in Unicode, sondern auch in die entsprechenden HTML-Entities – sofern vorhanden.
Bei den russischen Texten habe ich Vorlagen aus dem Internet kopiert, um das Skript zu testen. Klappt. Bei den türkischen Texten hatte ich ein Word-Dokument vorliegen. Ich habe den Word-Text auch mal 1:1 in ein HTML-Dokument mit charset=windows-1254 eingesetzt. Das funktionierte wunderbar auf dem Mac in allen guten Browsern. Nur als ich es mir mit dem Blöd-IE auf einer Dose angeschaut habe, wollte er einen türkischen Zeichensatz installieren. Nene, Meister, so nicht. Also dann doch lieber die Unicode-/Entities-Lösung. X-(
Danach kam bei mir die Frage auf, ob so ein Text auch barrierefrei im Sinne von lesbar für Screenreader ist. Dazu habe ich bei BIK angefragt und eine positive Antwort erhalten. Es ging jetzt nicht um russische oder türkische Seiten, sondern generell um den Einsatz von HTML-Entities und/ oder Unicode. Die freundliche Antwort war hier: Was auf dem Bildschirm zu sehen ist, wird auch so richtig vorgelesen, egal was im Quelltext steht. Allein bei einigen Sonderfällen gibt es kleine Problemchen. Die Entitie > (>) kann man sich z.B. als „größer als“ oder „spitze Klammer zu“ vorlesen lassen. Danke noch einmal für die Antwort.
Eine Übersicht über Entities und Unicode gibt es bei den e-workers. Den Türk-O-Mat und den Russ-O-Mat kann sich, wer will, hier runterladen. Ein Test auf dem Apache, der mit jedem Mac mitkommt, verlief negativ, da dieser nicht richtig konfiguriert ist. Keine Ahnung, was da fehlt. Auf einem „normalen“ Alltags-Apache, wie man ihn bei einem Hoster bekommt, sollte es jedoch klappen.