E-Books mit freier Software (Teil 1)
Neben dem traditionellen Druck gewinnt der Vertrieb von Büchern in digitaler Form eine immer grössere Bedeutung. Was freie Software in Sachen E-Books zu bieten hat, fasst der PUBLISHER in einer kleinen Artikelreihe zusammen.
Ein traditionelles, auf säurefreiem Papier gedrucktes Buch ist nach wie vor die nicht nur aus Sicht der Langzeitarchivierung beste Publikationsform von Texten, sondern auch gänzlich unabhängig von Strom und Elektronik. Schliesslich kann man ein gedrucktes Buch auch bei Kerzenlicht lesen. Spätestens wenn es an die Zusammenstellung des Urlaubsgepäcks geht, gewinnt jedoch das Lesegerät. Hinzu kommen Erleichterungen wie digitale Lesezeichen oder (auf PCs und Laptops) die Möglichkeit, Texte einfach zitieren zu können. Die meisten Buchverlage und Autoren müssen sich daher anpassen, wenn das Bücherregal ganz oder teilweise durch ein Lesegerät ersetzt wird.
E-Books aus technischer Sicht
Aus technischer Sicht bewegen sich E-Books zwischen layouttreuen, aber inflexiblen Formaten wie PostScript einerseits und dem modernen HTML-4-Standard andererseits. Wer die Veröffentlichung eines Buchs von vornherein auch als E-Book plant, sollte sich daher über mögliche Stolperfallen im Klaren sein. Hier sind zunächst der Textfluss und das Seitenlayout zu nennen. Will man beides beibehalten, kann das zu Darstellungsproblemen und zum Verlust einiger Vorteile beim elektronischen Buch führen. Im Gegenzug bleibt die Zitierfähigkeit aber gewährleistet, weil auch die Seitenumbrüche des Originals übernommen werden. Entscheidet man sich hingegen für einen flexiblen Ansatz, erhält man eine E-Book- Datei, die auf jedem Reader und anderen Geräten lesbar ist, dafür aber die Zitierfähigkeit verliert und ausserdem das Verrutschen von Grafiken riskiert.
Das offene Format: EPUB
Wie in vielen anderen Bereichen der digitalen Wirtschaft herrscht bei EBook-Formaten ein Durcheinander, teilweise bedingt durch das grundsätzlich berechtigte Interesse von Autoren und Verlagen, Raubkopien zu verhindern, teilweise aber auch wegen der scheinbar unvermeidbaren Tendenz von Grosskonzernen, für die eigene Plattform ein Monopol zu schaffen. Das Nachsehen hat, wie so häufig, der Kunde.
Folglich kann es geschehen, dass für manches in gutem Glauben gekaufte E-Book heute keine Unterstützung mehr existiert, entweder weil sich der Reader-Anbieter aus dem Geschäft zurückgezogen hat, oder weil sich Konzerne die Entscheidung vorbehalten, wer bezahlte elektronische Bücher wo, wann und unter welchen Bedingungen lesen darf.
Das offene EPUB-Format setzt hingegen auf bestehende Standards und ist ein ZIP- Container, der alle Daten eines Buchs (Texte, Grafiken, sonstige Multimediadateien, Fonts usw.), Metadaten und Strukturinformationen enthält. Textinformationen sind durchweg in XML-Dateien gespeichert. Eine EPUB- Datei muss mindestens zwei Verzeichnisse enthalten, nämlich META-INF und OEPBS. Im ersten Ordner befindet sich die Datei «container.xml», die, wie der Name verrät, das Containerformat beschreibt.
XML, wohin man blickt
Welche Ordnernamen man unterhalb von OEPBS für verschiedene Inhalte wählt, ist nicht festgelegt. Entscheidend ist nur, dass sich direkt unter OEPBS zwei XML- Dateien befinden, nämlich «content.opf» und «toc.ncx». In «content.opf» müssen alle im E-Book verwendeten Dateien mit ihrem korrekten Pfad aufgelistet sein, wobei die Reihenfolge egal ist. Bei «toc.ncx» ist dies nicht der Fall, denn in dieser Datei befinden sich die für die Leser sichtbaren Kapitelüberschriften sowie die entsprechenden «Navigationspunkte». Hier hilft die korrekte Reihenfolge, unnötige Verwirrung zu vermeiden.
Die eigentlichen Texte müssen in einem Format gespeichert werden, das eine Untermenge des HTML-Standards darstellt, nämlich XHTML. Diese Dateien eignen sich besonders für strukturierte Inhalte und müssen den Anforderungen an eine gültige XML-Datei entsprechen. Aktuelle XHTML-Dateien enthalten keine Formatierungsanweisung mehr und verwenden zu diesem Zweck CSS. Auch EPUB geht diesen Weg. Glücklicherweise gibt es nützliche Helfer, die einem viel Arbeit abnehmen.
LibreOffice Writer
Bei der freien Office-Suite LibreOffice erfolgte der Export nach EPUB einige Jahre mithilfe eines installierten Plugins. Inzwischen ist der EPUB-Exporter komplett in das Programm integriert und kann über Exportieren als angewählt werden. Leider unterstützt LibreOffice nur die Versionen 2.0 und 3.0 des Standards, während die Erweiterungen der aktuellen Version 3.2 noch nicht genutzt werden können.
Der Exportdialog erscheint auf den ersten Blick eher dürftig, aber da es in LibreOffice Writer leicht ist, strukturierte Textdokumente zu erstellen, dürften die Optionen für viele Autoren ausreichen. Als Trennmethoden stehen Überschrift und Seitenumbruch zur Verfügung, als Layout-Optionen, flexibel oder fest. Weiterhin kann man ein Titelbild und ein Medienverzeichnis auswählen sowie Metadaten eingeben.
Grafiken werden von LibreOffice beim Export grundsätzlich in PNG-Dateien umgewandelt, was nicht zu beanstanden ist. Will man datenbasierte Diagramme einbinden, ist ein kleiner Umweg erforderlich, denn falls solche in einem Textdokument enthalten sind, verweigert LibreOffice den Export als EPUB. Man kann das Programm aber überlisten, indem man das Diagramm in die Zwischenablage kopiert, das Grafikmodul LibreOffice Draw öffnet und mit Bearbeiten > Inhalte einfügen entweder eine Vektor- oder eine Pixeldatei erzeugt. Diese kopiert man dann ins Textdokument zurück, und die Ausgabe erfolgt ohne Probleme.
Die reine Lehre: Sigil
Im Gegensatz zu LibreOffice ist der Open- Source-Editor Sigil auf nichts anderes als EPUB spezialisiert. Ähnlich wie entspre- chende Programme zum Bearbeiten und Erzeugen von Websites im Quelltext bietet Sigil die entsprechenden Funktionen für EPUB-Dateien an, d.h. es ist im wesentlichen ein XML- und XHTML-Editor.
In Sigil ist es nur möglich, ein neues E-Book- Projekt anzulegen – anderes kommt nicht in Frage, obwohl das Programm auch HTML- und Textdateien öffnen kann. In einem neuen Projekt legt Sigil automatisch eine komplette Verzeichnisstruktur für eine EPUB-Datei an, was einem viel Arbeit erspart. Darüber hinaus kann man existierende EPUB-Dateien öffnen, bearbeiten und auf Standardkonformität überprüfen lassen. Die letztgenannte Eigenschaft gehört zu den wertvollsten von Sigil, denn Fehler werden mit grosser Sicherheit erkannt.
Von der spartanisch wirkenden Benutzeroberfläche sollte man sich dabei nicht täuschen lassen, denn viele nützliche Eigenschaften verbergen sich in den Menüs. Tastaturkürzel lassen sich in den Einstellungen anpassen, sodass man das Programm auch fast ohne den Griff zur Maus bedienen kann.
Begrüssenswert ist auch die Vorschau, die hier parallel zur Quelltextbearbeitung per F10 zugeschaltet werden kann, denn so entfällt das lästige Umschalten zwischen Code und Ergebnis. Wenn es etwas zu kritisieren gibt, dann ist es die voreingestellte winzige Schriftgrösse für die Quelltexte, die auf fast jedem Monitor nachjustiert werden muss.
Die bucklige Verwandtschaft: PageEdit
Wem das Bearbeiten von XHMTL-Dateien im Quellcode nicht behagt, kann sich einmal das Unterprojekt von Sigil, PageEdit, anschauen. PageEdit ist eine Merkwürdigkeit, denn es kann weder E-Books öffnen, noch können neue Dateien angelegt werden. Es erlaubt lediglich, OPF- und (X)HTML- Dateien zu öffnen, im WYSIWYG-Modus zu bearbeiten und wieder zu speichern.
Plug-ins
Sigil kann man mit vielen Plug-ins von Drittherstellern erweitern, etwa um auch die Bearbeitung von anderen Formaten oder den Export in dieselben zu ermöglichen. Eine Auflistung findet man unter mobileread.com/ forums/showthread.php?t=247431
Ausblick
Nachdem wir uns in dieser Ausgabe ausschliesslich auf das EPUB-Format konzentriert haben, werfen wir im zweiten Teil einen Blick auf den Tausendsassa unter den freien E-Book-Programmen: Calibre.
-
Autor
Christoph Schäfer
- Rubrik Publishing
- Dossier: Publisher 5-2020
- Thema Software, Digitales Publishing, E-Books
Kommentieren