Japanisch

Aus ELVIS-Wiki
Zur Navigation springenZur Suche springen

Bei der Umsetzung japanischer Studienmaterialien können einige Probleme auftreten, deren Lösungen auf dieser Seite gesammelt werden (sollten).

Kodierung

Das einfachste ist es natürlich, japanische Zeichen (Kanji und Kana) direkt zu kodieren; im Falle von HTML wäre es demgegenüber bspw. möglich, die Unicodecodepoints anzugeben und sich so Kodierungsprobleme zu ersparen. Das bereitet letzten Endes jedoch vermutlich deutlich mehr Ärger als dadurch gelöst werden soll.

Um Kanji und Kana direkt in den Zieldateien der Umsetzung verwenden zu können, sollte die Kodierung der Datei auf UTF-8 gestellt werden – sowohl im verwendeten Editor als auch innerhalb der Datei, soweit möglich. Ersteres hängt vom Editor selbst ab (sollte bei allen modernen Editoren jedoch voreingestellter Standard sein), letzteres vom Dateiformat. Bei HTML gibt es mehrere Möglichkeiten, zwei davon sind:

  • Ein meta-charset-Tag im Header: <meta charset='utf8' />
  • Ein meta-http-equiv-Tag im Header: <meta http-equiv='content-type' content='text/html; charset=utf-8' />

Beide zu verwenden kann nicht schaden.

Japanisch wird am Computer normalerweise von links nach rechts und von oben nach unten geschrieben, also wie auf dem lateinischen Alphabet basierende Sprachen auch. Hier gibt es also nichts besonderes zu beachten.

Primär interessant für sehbehinderte nicht-blinde Studenten ist die Festlegung der Sprache. 漢字 (Kanji) heißt wörtlich „chinesische Zeichen“, sie stammen also den chinesischen Hanzi ab. Einander entsprechenden Kanji und Hanzi wurde häufig ein einziger Unicodecodepoint zugewiesen, obwohl sie leicht unterschiedlich geschrieben werden. Dies kann dazu führen, dass einige Kanji leicht falsch dargestellt werden, wenn die Sprache des Dokuments nicht explizit auf Japanisch festgelegt ist (weil dann häufig Chinesisch angenommen wird). Ein Beispiel (das je nach Browser und installierten Schrifarten mehr oder weniger Erfolg erzielt):

  • Chinesisch: 平、漢
  • Japanisch: 平、漢

Daher kann es zu empfehlen sein, die Sprache des Zieldokuments auf Japanisch festzulegen, sollte dieses keine Probleme mit Screenreadern etc. bereiten. In HTML bspw. geschieht dies direkt im Top-Level-html-Tag:

  • <html lang='ja'>

Für blinde Studenten hat dies jedoch keine Auswirkungen, insofern sollte dies nur bei Bedarf verwendet werden.

Eingabe

Um Kanji und Kana verwenden zu können, bedarf es natürlich auch einer Methode, diese effizient eingeben zu können. Normalerweise wird hierzu ein IME (Input Method Editor) verwendet, unter X11/Linux eignet sich bspw. fcitx mit dem Modul fcitx-mozc (Stand 2014). Dieser wandelt die Eingabe von Lautschrift (Romaji) in Kana um, für die Kanjidarstellung bietet der IME dann eine Liste an, aus der die richtige Schreibung manuell ausgewählt werden muss.

Da dieser Teil nicht spezifisch für die Umsetzung von Studienmaterialien ist sondern jeden betrifft, der Japanisch am Computer eingeben möchte, sei hier primär auf die diversen Suchmaschinen verwiesen.

Theoretisch könnte man auch Romaji (also Lautschrift) anstelle von Kana und Kanji für die Umsetzung verwenden, dies würde die Probleme bei Eingabe, Kodierung und Ausgabe automatisch beseitigen. Andererseits ist dies für sehbehinderte (also nicht blinde) Studenten auf keinen Fall eine geeignete Umsetzung; und auch blinde Studenten sollten vermutlich eher Material mit Kana und Kanji erhalten, da dies auch die Form ist, in der Originalmaterial (bspw. im WWW) verfügbar ist.

Ausgabe auf einer Braillezeile

Die japanische Brailleschrift ist eine Silbenschrift und unterscheidet sich somit einerseits deutlich von der deutschen Brailleschrift (wichtig für blinde Studenten) als auch ist sie direkt nur für die Darstellung von Kana geeignet. Zwischen Hiragana und Katakana wird nicht unterschieden, daher sollte auch nicht immer nur eine Art von Kana verwendet werden, sondern im Idealfall immer die an der jeweiligen Stelle im Originaltext benutzte.

Andererseits ist es auch nicht nötig, nur Kana zu verwenden. Programme zur Darstellung von japanischen Zeichen auf einer Braillezeile sind selbstständig in der Lage, die Lesungen von Kanji als Kana darzustellen. Deshalb ist es auch hier wieder zu empfehlen, dem Originaltext zu folgen. Auch die Verwendung japanischer Satzzeichen ist möglich (bspw. 「、。」).

Den Wechsel zwischen japanischen und lateinischen Zeichen sollten diese Programme selbstständig übernehmen. Allerdings sind sie häufig nicht in der Lage, mit Sonderzeichen umzugehen. Existieren im Originaltext also bspw. deutsche Umlaute zusammen mit japanischen Zeichen, so sollten die Umlaute umschrieben werden (ä = ae, ß = ss, etc. pp.), gleiches gilt für andere nicht-ASCII-Zeichen. Ansonsten kann es zum Beispiel dazu kommen, dass sämtliche Worte mit Umlauten einfach vollständig gar nicht dargestellt werden.

Umsetzung

Im einfachsten Fall erlaubt die Quelldatei für die Umsetzung ein direktes Kopieren und Einfügen; in diesem Fall entfällt sogar das Problem der Eingabe japanischer Zeichen.

In jedem anderen Fall wird es nötig sein, Japanisch zu lesen. Nicht nur deshalb sollten Bearbeiter von japanischen Lehrmaterialien immer über Grundkenntnisse der Schrift verfügen.

Während Kana keine großen Probleme beim Lesen bereiten sollten, sind Kanji häufig ein deutlich größeres Problem. Doch auch hier gibt es Lösungen: Zum einen existieren digitale Wörterbücher wie Tagaini Jisho, die sämtliche praktisch verwendeten Kanji enthalten und in denen man anhand von Teilen (Komponenten und Radikalen) suchen kann. Als Beispiel sei das Kanji 滅 (ほろ、メツ) genannt. Komponenten eines Kanji sind einfach Teile eines Kanji; das Radikal ist im Prinzip das primäre Primitiv eines Kanji, es steht im Normalfall links oder (seltener) oben. In diesem Fall ist das Radikal also 氵 (von 水, Wasser). Damit öffnet man im Wörterbuch (hier am Beispiel von Tagaini) nun den Kanjiteil und sucht dort dieses Radikal heraus:

Tagaini-1.png

Die Liste ist (wie Kanji und ihre Komponenten generell) nach der Anzahl der verwendeten Striche geordnet. Tagaini liefert nun 661 Ergebnisse (bei einem so häufigen Radikal nicht verwunderlich), die zu durchsuchen ziemlich beschwerlich ist. Um die Ergebnisliste zu verkürzen, kann auch die Anzahl der Striche im Kanji links eingegeben werden (oder alternativ ein Bereich, wenn man sich nicht sicher ist) – die richtige Anzahl „13“ liefert nur noch 50 Ergebnisse (mit dem gesuchten Kanji an vierter Stelle). Kennt man das Kanji allerdings nicht, so ist es häufig schwierig, die korrekte Strichzahl zu schätzen, deshalb wird dieser Weg hier außen vor gelassen. Tagaini enthält sehr viele Kanji, häufig trifft man jedoch nur auf die 2145 Jōyō-Kanji (Stand 2014), die für den allgemeinen Gebrauch zugelassen sind. Einschränken der Ergebnisse auf diese Kanji:

Tagaini-2.png

führt zu nur noch 119 Ergebnissen. Trotzdem ist dies in diesem Fall noch zu viel, also müssen jetzt Komponenten gefunden werden. Je mehr man sich mit Kanji auskennt, desto einfacher wird dies; es kann aber auch zum Glücksspiel ausarten. Auswahl der vermutlich auffälligsten Komponente:

Tagaini-3.png

liefert sechs Ergebnisse, in denen das gesuchte Kanji schnell gefunden ist:

Tagaini-4.png

Jetzt, da die Lesungen des Kanji bekannt sind (oder es einfach aus Tagaini kopiert werden kann), kann es in die Zieldatei der Umsetzung eingefügt werden.

Wie man sieht, kann sich die Suche nach Kanji sehr zeitaufwändig gestalten. Die Alternative zur Nutzung von Wörterbüchern ist die Erkennung von gezeichneten Kanji mit Hilfe von bspw. Webseiten wie bspw. kanji.sljfaq.org (Alternativen findet man über die Suche nach "Kanji recognition"):

Sljfaq.png

Kanji auf diese Art und Weise zu finden kann deutlich schneller sein, muss es aber nicht, da die Strichreihenfolge und -richtung beim Zeichnen entscheidend für die Erkennung ist. Schon allein falsche Strichreihenfolgen können dazu führen, dass man das Ergebnis nicht findet. Es gilt also: Ausprobieren und selbst entscheiden, was am besten funktioniert.

Außerdem sollte offenbar sein, dass es wirklich von großem Vorteil ist, die Kanji aus dem Originaltext kopieren zu können (wenn man nicht gerade in der Lage ist, alle Kanji zu lesen oder wenigstens sofort in einem Wörterbuch anhand ihrer Bedeutung nachschlagen kann), da manuelle Suche nach unbekannten Kanji tatsächlich meist sehr zeitaufwändig wird.

Zusammenfassung

Die Umsetzung japanischer Schriftzeichen sollte in UTF-8 erfolgen, dabei ist darauf zu achten, dass das Zieldokument entsprechend gekennzeichnet wird, sollte dies erforderlich sein.

Neben Hiragana können und sollten auch Katakana, Kanji und japanische Satzzeichen möglichst originalgetreu verwendet werden. Andere nicht-ASCII-Zeichen (u. a. deutsche Umlaute) sollten vermieden werden.

Die manuelle Suche von unbekannten Kanji ist zeitaufwändig und daher ist es unbedingt anzustreben, entweder einer SHK habhaft zu werden, die zumindest die Bedeutung sämtlicher Jōyō-Kanji kennt (oder noch besser, alle lesen kann), oder zumindest eine Version des Originaldokuments zu erlangen, die das Kopieren von Kanji erlaubt.