Inhalte aus Word & Co in den Rich-Text-Editor kopieren

Häufig tritt das Problem auf, dass Texte auf der Website ziemlich wüst aussehen. Andere Farben, Schriftarten, Größen. Oftmals sogar mehrfach wechselnd. Das sieht nicht nur oft einfach mies aus, bringt auch so einige Probleme mit sich. Unter Umständen zerhaut es einem die Website, wenn man unvollständigen oder fehlerhaften HTML-Code kopiert. Dann ist die Website unbenutzbar und die Aufregung in der Regel groß.

Die Ursache

Zu bestimmt 90% kann man die Ursache des Problems konkret benennen: Microsoft Word oder Microsoft Outlook (das ja gerne mal Word als Editor nutzt). Kopiert man nämlich Texte direkt aus Word, wird gleichzeitig ein Wust an Angaben mitkopiert, die der Redakteur erstmal gar nicht sieht. Diese Angaben sind nicht nur unnötig, sondern auch teilweise haarsträubend. Abstandsangaben in cm – auf einer Website! Dazu gesellt sich das Problem, dass Microsoft sich natürlich wenig an geltenden Standards orientiert. Aber auch das kopieren von Inhalten von anderen Websites kann die gleichen Ursachen hervorrufen. Nicht jede Website trennt strikt den Inhalt von der Gestaltung oder auch dort hat ein Redakteur versehentlich wunderbaren Microsoft-Code auf die Website geklatscht.

Hat mit HTML wenig zu tun und auf einer Website gar nichts zu suchen

Betroffen sind davon solche Inhalte, in denen ein Rich-Text-Editor verfügbar ist, der eine erweiterte Formatierung der Inhalte zulässt. Zwar ist dieser bereits so programmiert, dass er den gröbsten Unfug filtert – aber oft rutscht trotzdem etwas durch.

Der Rich-Text-Editor (kurz: RTE) in TYPO3

Lösungsansätze

Um das Problem zu Umgehen, gibt es mehrere Lösungsansätze. Die zwei gängisten beschreibe ich hier.

Umweg über den Editor

Viele Redakteure wählen den Weg über einen Editor, der keine Formatierungen zulässt. In Windows ist das der z.B. der mitgelieferte Editor, der in der Regel unter Start » Zubehör » Programme zu finden ist. Einmal den gesamten Text in den Editor kopieren, wieder alles markieren und kopieren – schon sind wir alle Formatierungen los. Dafür leider auch solche logischen Auszeichnungen wie Aufzählungen und Überschriften, die nun per Hand nachgetragen werden müssen.

Eigene Säuberungsfunktion des RTE

Der zweite Anatz nutzt eine bereits im TYPO3-RTE vorhandene Funktion zur Säuberung des Codes. Dazu wird der Text direkt aus Word, Outlook und Co. direkt in den RTE eingefügt. Danach muss die Option Formatierungen entfernen ausgewählt werden, in der Symbolleiste passenderweise durch einen Besen symbolisiert.

Der Besen markiert die Funktion "Formatierungen entfernen"

Im darauf erscheinden Pop-Up wählen wir HTML-Formatierungen (im Beispiel nicht markiert) und MS-Word-Formatierungen aus, sowie dass die Säuberung im gesamten Bereich durchgeführt werden soll.

Das PopUp-Fenster mit weiteren Informationen

In den meisten Fällen führt das zum gewünschten Ergebnis, wenn nicht hilft entweder nur der oben beschriebene Weg über den Editor oder eine Säuberung per Hand, wenn man den Editor auf den HTML-Modus umschaltet.

Erkennen ob ungewollte Formatierungen vorliegen

Aber wie erkennt man, ob die Säuberung erfolgreich war oder überhaupt eine nötig ist? Wenn man die gröbsten Schnitzer nicht sofort erkennt (rote Schrift in Comic Sans), hilft uns die Statuszeile von TYPO3 weiter. Hier wird angezeigt, in welchem HTML-Element wir uns gerade befinden. Das p steht dabei für Paragraph, also einen Absatz.

Die Statusleiste des TYPO3-RTE befindet sich am Ende des Editor-Feldes

Die im Beispiel angezeigte Klasse MsoNormal ist allerdings ein klares Indiz für Formatierungen aus dem Hause Mircrosoft. Auch Font-Tags haben im Editor nichts zu suchen und sollten entsprechend bereinigt werden.

Kommentieren