1. Lizenzrechte ermitteln und verwalten –
Softwarelösung für große Datenmengen
| Griesheim | Banja Luka | Sevilla | Nashik
Anwendungsfall
Inbound/Outbound
Datenschutz
Rechnungswesen
Hosting
IT Admin
Mailroom ERP
APPs
Social Media/
Digital Marketing
Korrektorat/
Lektorat
Digitalisierung
Big Data
LogistikCRM
Kunde
Webshop & Page
ECMIT SicherheitDateneingabe
SW-Development
Verlage stehen vor einer Aufgabe, wenn es um Lizenzrechte geht. Gleichgültig, ob es um die Rechte
eines Fotografen in einem Bildband, ein Bild in einem Schulbuch oder einem Do-it-yourself-Buch
geht: Der Fotograf hat jederzeit das Recht zu wissen, in welchem Buch seine Bilder wie verwendet
wurden. Das gleiche gilt für die Verwendung von Texten. Auch diese müssen lizenzrechtlich erfasst
werden – auch, damit gegenüber den Inhabern der Rechte eine Abrechnung erfolgen kann.
Deshalb brauchen Verlage eine entsprechende Rechtedatenbank oder eine Rechtemanagement-
software, in der diese Angaben erfasst werden. In vielen Fällen wurden diese Rechte ohne solche
Lösungen verwaltet, z.B. in Excel, oder auch gar nicht. Darüber hinaus ist dies immer dann auch ein
Thema, wenn Verlage andere Verlage übernehmen und die Verwaltung mittels unterschiedlicher
Methoden vorgenommen wurde. Die Rechte wurden in den meisten Fällen jedoch in den Quellen-
nachweisen vermerkt. In dem vorliegenden Fall liegen die Quellennachweise in mehr als 20.000
Büchern vor und die Aufgabe ist, aus diesen Quellennachweisen die Rechte der Rechteinhaber zu
ermitteln und in eine strukturierte Form zu bringen. Von Hand eine schier unüberwindbare
Aufgabe.
Hinzu kommt, dass die Quellennachweise in den Büchern nicht einheitlich dargestellt werden und
sich nicht immer an der gleichen Stelle im Buch befinden. Manche Quellennachweise finden sich am
Anfang des Buches, oft aber ist den Nachweisen ein eigenes Kapitel am Ende des Buches gewidmet.
Für die Darstellung der Quellennachweise gibt es keine einheitliche Regelung, sie sehen teilweise
unterschiedlich aus, auch wenn prinzipiell die gleichen Informationen enthalten sind.
Ähnliche Aufgabenstellungen gibt es bei den Verträgen mit den Rechteinhabern. Diese Verträge
sind über viele Jahre gewachsen und erweitert worden. So kamen z.B. Rechte für Sprachen, Filme,
eBooks und ähnliches hinzu. Um auch hier aus den vielleicht vielen zehntrausenden von Verträgen
alle Rechte und deren Konditionen herauszufiltern, ist eine Lösung mittels manueller Erfassung
quasi unmöglich.
Gefragt ist deshalb eine Softwarelösung, die die Aufgabe Schritt für Schritt erledigt und so viel wie
möglich automatisiert abarbeitet.
Software-Tools für schnellere Bearbeitung
Die tool-e-byte GmbH hat hier eine spezielle Lösung erarbeitet, die aus drei verschiedenen
Software-Tools besteht und für einen Verlag bereits erfolgreich umgesetzt wurde. Auch hier stand
am Anfang eine manuelle Bearbeitung: Eine festgelegte Anzahl von Büchern wurde manuell
analysiert, um herauszufinden, wo die Informationen in den jeweiligen Büchern stehen, wie sie
benannt sind und nach welchen Regeln die Informationen aufbereitet sind. Bestimmte Code- bzw.
Stichwörter wurden in die Software eingebaut. Von Anfang an wurde darauf geachtet, dass die Liste
ständig um neue Stichworte erweitert werden kann, um die Zukunftssicherheit der Software zu
gewährleisten.
Hinzu kam eine zweite Liste, die sogenannte Positivliste mit den bereits erfassten Rechteinhabern.
Schnell wurde aber deutlich, dass im Zuge der Bearbeitung weitere Rechteinhaber neu erfasst
werden mussten. Diese Negativliste wurde von den Mitarbeitern von tool-e-byte neu erstellt und
darin alle neu auftauchenden Rechteinhaber vermerkt.
Das erste Tool lädt und öffnet PDFs und erkennt Stichwörter wie z.B. die Begriffe „Bildquellen“,
„Bildquellenverzeichnis“ oder „Textquellenverzeichnis“. Alle Seiten, die relevante Stichwörter
enthalten, werden in eine Datenbank geladen.
Quellennachweise
Autorenrechte
Rechteinhaber
Extration
Lizenzrechte
2. Anwendungsfall
Abbildung 1 Tool 1 - PDF Page Finder findet retlevante Seiten mit Rechteinhabern basierend auf Schlüsselwörtern
Abbildung 2 Tool 1 - Bearbeitung des extrahierten Textes, Bestimmung der Struktur
Die Bearbeiter bei tool-e-byte haben an dieser Stelle die Möglichkeit, die Übernahme des Textes im
PDF zu überprüfen und beispielsweise das Inhaltsverzeichnis zu entfernen. Wenn hier der Begriff
„Bildquelle“ steht, ist das ein reiner Verweis auf die entsprechende Seite (die von der Software gelad-
en wurde).
Das Tool erkennt außerdem die Struktur des Dokumentes und die Gesetzmäßigkeiten, die bei der
Beschreibung der Quellenangaben verwendet wurden. Zwischen einzelne Quellen werden Separa-
toren gesetzt.
Sollte unerwarteterweise von der Software keine Seite im PDF erkannt werden, die in die Datenbank
geladen wird, dann wird das Buch über OCR erfasst und die Auswertung dann erstellt.
Nach diesem Arbeitsschritt beginnt das zweite Tool, der „Relevant Item Finder“ seine Arbeit. Die
Bücher werden geladen, das Tool erkennt Text und Separator und bestimmt automatisch die soge-
nannten Itemstrings, also die Namen der Rechteinhaber sowie die Seitenangabe. Dabei erkennt sie
einzelne Codierungen (Muster) und arbeitet mithilfe der sogenannten „regulären Ausdrücke“
weiter. Hier werden bestimmte Zeichenketten (Pattern) erkannt, die Informationen extrahiert und
geordnet. Die Zeichenketten werden auseinandergenommen, beispielsweise auch, um mehrere
Rechteinhaber innerhalb einer Kette zu erkennen. Abschließend werden alle gewonnen Informa-
tionen von der Software automatisch in die Datenbank eingespeist.
Quellennachweise
Autorenrechte
Rechteinhaber
Extration
Lizenzrechte
| Griesheim | Banja Luka | Sevilla | Nashik
3. Anwendungsfall
Abbildung 3 Tool 3 - Relevant Item Finder - Automatische Verarbeitung basierend auf den Ergebnissen von Tool 1
Abbildung 4 Tool 2 - manuelle Nachkorrektur der automatischen Verarbeitung
Im nächsten Schritt erfolgt – diesmal manuell – die Nachkorrektur der automatischen Verarbeitung.
Das ist z.B. deswegen nötig, weil die Namen der Rechteinhaber vom Eintrag in der Datenbank abwe-
ichen können.
Das letzte Tool schließlich, der Right Owner Finder, löst einzelne Rechteinhaber aus den Itemstrings
heraus und verknüpft sie mit einer sogenannten Positivliste. In dieser Liste finden sich alle Rechtein-
haber, die bereits angelegt wurden. Auch hier erfolgt eine manuelle Nachbearbeitung.
Quellennachweise
Autorenrechte
Rechteinhaber
Extration
Lizenzrechte
| Griesheim | Banja Luka | Sevilla | Nashik
4. Anwendungsfall
Abbildung 5 Tool 3 - Right Owner Finder - automatische Verarbeitung der Ergebnisse aus Tool 2
Abbildung 6 Tool 3 - manuelle Zuordnung der Rechteinhaber zu den Ergebnissen aus Tool 2
Sollte ein Rechteinhaber in einem Buch auftauchen, der bisher nicht in der Liste zu finden ist, dann
wird er manuell der Liste hinzugefügt.
Quellennachweise
Autorenrechte
Rechteinhaber
Extration
Lizenzrechte
| Griesheim | Banja Luka | Sevilla | Nashik
5. Anwendungsfall
Abbildung 7 Tool 3 - Anlegen eines neuen Rechteinhabers in der Negativliste
Abbildung 8 Tool 3 - Bestimmung der Rechteanzahl (Usage Count)
Da die Verlage die Datenbank als Abrechnungsbasis nutzen wollen, müssen in einem letzten Schritt
die Rechte eines Inhabers zusammengefasst werden. Damit sieht der zuständige Mitarbeiter im
Verlag auf einen Blick, wie viele Rechte ein bestimmter Autor oder Fotograf in allen Büchern des
Verlages hat.
Damit profitiert der Verlag mehrfach: Zum einen zählt die Geschwindigkeit, mit der sich große
Mengen an Büchern abbilden lassen. Statt intern viel Personal über einen langen Zeitraum zu
beschäftigen wird jetzt in die Software investiert und der Extraktionsprozess erheblich
beschleunigt. Durch das Softwaredesign ist außerdem die Zukunftsfähigkeit garantiert: Jedes neue
Buch kann beim Erscheinen gleich erfasst und die Informationen in der Datenbank ergänzt werden.
Damit ergeben sich für den Verlag auch neue Möglichkeiten, die digitalen Informationen zu
verwenden. So ist z.B. vorstellbar, dass mit Rechteinhabern, auf die der Verlag häufig zurückgreift
(wie große Bilddatenbanken) Rahmenverträge geschlossen werden oder dass die Informationen
aus den Büchern mit dem Abrechnungssystem verknüpft werden. All das sind Szenarien die ohne
die digitale Erfassung nicht realisierbar wären.
info@tool-e-byte.eu+49 (0) 6155 - 5226
tool-e-byte GmbH, D-64347 Griesheim, Martin-Luther-str. 15
Quellennachweise
Autorenrechte
Rechteinhaber
Extration
Lizenzrechte