Derzeit benötigen TeX- und LaTeX-Quelltexte in deutscher Sprache verschiedene Auszeichnungen:
\/ "| | zur Korrektur falscher Ligaturen: Auf"|lage |
s: u. a. | zur Unterscheidung von langem und rundem s in gebrochenen Schriften: aus:setzen |
"ck | für die richtige Trennung von ck in der traditionellen Rechtschreibung: dru"cken |
"ff "ll u. a. | für die richtige Trennung von Dreifachkonsonanten mit folgendem Vokal in der traditionellen Rechtschreibung: Meta"llegierung |
Für die Dokumentenerstellung mit TeX ergeben sich dadurch die folgenden Nachteile:
Idealerweise sollte ein Quelltext möglichst wenige physische Auszeichnungen enthalten. Es handelt sich hier um ein Mustererkennungsproblem ähnlich der Worttrennung. Denkbar ist eine Verallgemeinerung des Silbentrennalgorithmus, mit welcher diese Fälle ohne Eingriffe im Quelltext erkannt und richtig behandelt werden können: Vor oder während des Absatzumbruchs wird der Text mit entsprechenden zusätzlichen Mustern durchsucht. Je nachdem, welche Muster einen Treffer landen, wird die gefundene Stelle im Wort dementsprechend behandelt.