SlideShare ist ein Scribd-Unternehmen logo
Lizenzrechte ermitteln und verwalten –
Softwarelösung für große Datenmengen
| Griesheim | Banja Luka | Sevilla | Nashik
Anwendungsfall
Inbound/Outbound
Datenschutz
Rechnungswesen
Hosting
IT Admin
Mailroom ERP
APPs
Social Media/
Digital Marketing
Korrektorat/
Lektorat
Digitalisierung
Big Data
LogistikCRM
Kunde
Webshop & Page
ECMIT SicherheitDateneingabe
SW-Development
Verlage stehen vor einer Aufgabe, wenn es um Lizenzrechte geht. Gleichgültig, ob es um die Rechte
eines Fotografen in einem Bildband, ein Bild in einem Schulbuch oder einem Do-it-yourself-Buch
geht: Der Fotograf hat jederzeit das Recht zu wissen, in welchem Buch seine Bilder wie verwendet
wurden. Das gleiche gilt für die Verwendung von Texten. Auch diese müssen lizenzrechtlich erfasst
werden – auch, damit gegenüber den Inhabern der Rechte eine Abrechnung erfolgen kann.
Deshalb brauchen Verlage eine entsprechende Rechtedatenbank oder eine Rechtemanagement-
software, in der diese Angaben erfasst werden. In vielen Fällen wurden diese Rechte ohne solche
Lösungen verwaltet, z.B. in Excel, oder auch gar nicht. Darüber hinaus ist dies immer dann auch ein
Thema, wenn Verlage andere Verlage übernehmen und die Verwaltung mittels unterschiedlicher
Methoden vorgenommen wurde. Die Rechte wurden in den meisten Fällen jedoch in den Quellen-
nachweisen vermerkt. In dem vorliegenden Fall liegen die Quellennachweise in mehr als 20.000
Büchern vor und die Aufgabe ist, aus diesen Quellennachweisen die Rechte der Rechteinhaber zu
ermitteln und in eine strukturierte Form zu bringen. Von Hand eine schier unüberwindbare
Aufgabe.
Hinzu kommt, dass die Quellennachweise in den Büchern nicht einheitlich dargestellt werden und
sich nicht immer an der gleichen Stelle im Buch befinden. Manche Quellennachweise finden sich am
Anfang des Buches, oft aber ist den Nachweisen ein eigenes Kapitel am Ende des Buches gewidmet.
Für die Darstellung der Quellennachweise gibt es keine einheitliche Regelung, sie sehen teilweise
unterschiedlich aus, auch wenn prinzipiell die gleichen Informationen enthalten sind.
Ähnliche Aufgabenstellungen gibt es bei den Verträgen mit den Rechteinhabern. Diese Verträge
sind über viele Jahre gewachsen und erweitert worden. So kamen z.B. Rechte für Sprachen, Filme,
eBooks und ähnliches hinzu. Um auch hier aus den vielleicht vielen zehntrausenden von Verträgen
alle Rechte und deren Konditionen herauszufiltern, ist eine Lösung mittels manueller Erfassung
quasi unmöglich.
Gefragt ist deshalb eine Softwarelösung, die die Aufgabe Schritt für Schritt erledigt und so viel wie
möglich automatisiert abarbeitet.
Software-Tools für schnellere Bearbeitung
Die tool-e-byte GmbH hat hier eine spezielle Lösung erarbeitet, die aus drei verschiedenen
Software-Tools besteht und für einen Verlag bereits erfolgreich umgesetzt wurde. Auch hier stand
am Anfang eine manuelle Bearbeitung: Eine festgelegte Anzahl von Büchern wurde manuell
analysiert, um herauszufinden, wo die Informationen in den jeweiligen Büchern stehen, wie sie
benannt sind und nach welchen Regeln die Informationen aufbereitet sind. Bestimmte Code- bzw.
Stichwörter wurden in die Software eingebaut. Von Anfang an wurde darauf geachtet, dass die Liste
ständig um neue Stichworte erweitert werden kann, um die Zukunftssicherheit der Software zu
gewährleisten.
Hinzu kam eine zweite Liste, die sogenannte Positivliste mit den bereits erfassten Rechteinhabern.
Schnell wurde aber deutlich, dass im Zuge der Bearbeitung weitere Rechteinhaber neu erfasst
werden mussten. Diese Negativliste wurde von den Mitarbeitern von tool-e-byte neu erstellt und
darin alle neu auftauchenden Rechteinhaber vermerkt.
Das erste Tool lädt und öffnet PDFs und erkennt Stichwörter wie z.B. die Begriffe „Bildquellen“,
„Bildquellenverzeichnis“ oder „Textquellenverzeichnis“. Alle Seiten, die relevante Stichwörter
enthalten, werden in eine Datenbank geladen.
Quellennachweise
Autorenrechte
Rechteinhaber
Extration
Lizenzrechte
Anwendungsfall
Abbildung 1 Tool 1 - PDF Page Finder findet retlevante Seiten mit Rechteinhabern basierend auf Schlüsselwörtern
Abbildung 2 Tool 1 - Bearbeitung des extrahierten Textes, Bestimmung der Struktur
Die Bearbeiter bei tool-e-byte haben an dieser Stelle die Möglichkeit, die Übernahme des Textes im
PDF zu überprüfen und beispielsweise das Inhaltsverzeichnis zu entfernen. Wenn hier der Begriff
„Bildquelle“ steht, ist das ein reiner Verweis auf die entsprechende Seite (die von der Software gelad-
en wurde).
Das Tool erkennt außerdem die Struktur des Dokumentes und die Gesetzmäßigkeiten, die bei der
Beschreibung der Quellenangaben verwendet wurden. Zwischen einzelne Quellen werden Separa-
toren gesetzt.
Sollte unerwarteterweise von der Software keine Seite im PDF erkannt werden, die in die Datenbank
geladen wird, dann wird das Buch über OCR erfasst und die Auswertung dann erstellt.
Nach diesem Arbeitsschritt beginnt das zweite Tool, der „Relevant Item Finder“ seine Arbeit. Die
Bücher werden geladen, das Tool erkennt Text und Separator und bestimmt automatisch die soge-
nannten Itemstrings, also die Namen der Rechteinhaber sowie die Seitenangabe. Dabei erkennt sie
einzelne Codierungen (Muster) und arbeitet mithilfe der sogenannten „regulären Ausdrücke“
weiter. Hier werden bestimmte Zeichenketten (Pattern) erkannt, die Informationen extrahiert und
geordnet. Die Zeichenketten werden auseinandergenommen, beispielsweise auch, um mehrere
Rechteinhaber innerhalb einer Kette zu erkennen. Abschließend werden alle gewonnen Informa-
tionen von der Software automatisch in die Datenbank eingespeist.
Quellennachweise
Autorenrechte
Rechteinhaber
Extration
Lizenzrechte
| Griesheim | Banja Luka | Sevilla | Nashik
Anwendungsfall
Abbildung 3 Tool 3 - Relevant Item Finder - Automatische Verarbeitung basierend auf den Ergebnissen von Tool 1
Abbildung 4 Tool 2 - manuelle Nachkorrektur der automatischen Verarbeitung
Im nächsten Schritt erfolgt – diesmal manuell – die Nachkorrektur der automatischen Verarbeitung.
Das ist z.B. deswegen nötig, weil die Namen der Rechteinhaber vom Eintrag in der Datenbank abwe-
ichen können.
Das letzte Tool schließlich, der Right Owner Finder, löst einzelne Rechteinhaber aus den Itemstrings
heraus und verknüpft sie mit einer sogenannten Positivliste. In dieser Liste finden sich alle Rechtein-
haber, die bereits angelegt wurden. Auch hier erfolgt eine manuelle Nachbearbeitung.
Quellennachweise
Autorenrechte
Rechteinhaber
Extration
Lizenzrechte
| Griesheim | Banja Luka | Sevilla | Nashik
Anwendungsfall
Abbildung 5 Tool 3 - Right Owner Finder - automatische Verarbeitung der Ergebnisse aus Tool 2
Abbildung 6 Tool 3 - manuelle Zuordnung der Rechteinhaber zu den Ergebnissen aus Tool 2
Sollte ein Rechteinhaber in einem Buch auftauchen, der bisher nicht in der Liste zu finden ist, dann
wird er manuell der Liste hinzugefügt.
Quellennachweise
Autorenrechte
Rechteinhaber
Extration
Lizenzrechte
| Griesheim | Banja Luka | Sevilla | Nashik
Anwendungsfall
Abbildung 7 Tool 3 - Anlegen eines neuen Rechteinhabers in der Negativliste
Abbildung 8 Tool 3 - Bestimmung der Rechteanzahl (Usage Count)
Da die Verlage die Datenbank als Abrechnungsbasis nutzen wollen, müssen in einem letzten Schritt
die Rechte eines Inhabers zusammengefasst werden. Damit sieht der zuständige Mitarbeiter im
Verlag auf einen Blick, wie viele Rechte ein bestimmter Autor oder Fotograf in allen Büchern des
Verlages hat.
Damit profitiert der Verlag mehrfach: Zum einen zählt die Geschwindigkeit, mit der sich große
Mengen an Büchern abbilden lassen. Statt intern viel Personal über einen langen Zeitraum zu
beschäftigen wird jetzt in die Software investiert und der Extraktionsprozess erheblich
beschleunigt. Durch das Softwaredesign ist außerdem die Zukunftsfähigkeit garantiert: Jedes neue
Buch kann beim Erscheinen gleich erfasst und die Informationen in der Datenbank ergänzt werden.
Damit ergeben sich für den Verlag auch neue Möglichkeiten, die digitalen Informationen zu
verwenden. So ist z.B. vorstellbar, dass mit Rechteinhabern, auf die der Verlag häufig zurückgreift
(wie große Bilddatenbanken) Rahmenverträge geschlossen werden oder dass die Informationen
aus den Büchern mit dem Abrechnungssystem verknüpft werden. All das sind Szenarien die ohne
die digitale Erfassung nicht realisierbar wären.
info@tool-e-byte.eu+49 (0) 6155 - 5226
tool-e-byte GmbH, D-64347 Griesheim, Martin-Luther-str. 15
Quellennachweise
Autorenrechte
Rechteinhaber
Extration
Lizenzrechte

Weitere ähnliche Inhalte

Ähnlich wie Lizenzrechteermittlung mittels software

Lernen Im Social Semantic Web
Lernen Im Social Semantic WebLernen Im Social Semantic Web
Lernen Im Social Semantic Web
Andreas Blumauer
 
Per CMS Websites problemlos pflegen
Per CMS Websites problemlos pflegenPer CMS Websites problemlos pflegen
Per CMS Websites problemlos pflegen
msoeth
 

Ähnlich wie Lizenzrechteermittlung mittels software (9)

Suche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur DatenintegrationSuche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur Datenintegration
 
Advanced Keyword-Recherche Suchmaschinen Kampagnen
Advanced Keyword-Recherche Suchmaschinen KampagnenAdvanced Keyword-Recherche Suchmaschinen Kampagnen
Advanced Keyword-Recherche Suchmaschinen Kampagnen
 
Social Media Lexikon für Personaler und Mittelstand
Social Media Lexikon für Personaler und MittelstandSocial Media Lexikon für Personaler und Mittelstand
Social Media Lexikon für Personaler und Mittelstand
 
notarXpert Folder
notarXpert FoldernotarXpert Folder
notarXpert Folder
 
Lernen Im Social Semantic Web
Lernen Im Social Semantic WebLernen Im Social Semantic Web
Lernen Im Social Semantic Web
 
Data-driven Technical SEO: Logfile Auditing - SEOkomm 2018
Data-driven Technical SEO: Logfile Auditing - SEOkomm 2018Data-driven Technical SEO: Logfile Auditing - SEOkomm 2018
Data-driven Technical SEO: Logfile Auditing - SEOkomm 2018
 
FotoWare Digital Asset Management - Broschüre
FotoWare Digital Asset Management - BroschüreFotoWare Digital Asset Management - Broschüre
FotoWare Digital Asset Management - Broschüre
 
eStrategy Magazin 02 / 2014
eStrategy Magazin 02 / 2014eStrategy Magazin 02 / 2014
eStrategy Magazin 02 / 2014
 
Per CMS Websites problemlos pflegen
Per CMS Websites problemlos pflegenPer CMS Websites problemlos pflegen
Per CMS Websites problemlos pflegen
 

Lizenzrechteermittlung mittels software

  • 1. Lizenzrechte ermitteln und verwalten – Softwarelösung für große Datenmengen | Griesheim | Banja Luka | Sevilla | Nashik Anwendungsfall Inbound/Outbound Datenschutz Rechnungswesen Hosting IT Admin Mailroom ERP APPs Social Media/ Digital Marketing Korrektorat/ Lektorat Digitalisierung Big Data LogistikCRM Kunde Webshop & Page ECMIT SicherheitDateneingabe SW-Development Verlage stehen vor einer Aufgabe, wenn es um Lizenzrechte geht. Gleichgültig, ob es um die Rechte eines Fotografen in einem Bildband, ein Bild in einem Schulbuch oder einem Do-it-yourself-Buch geht: Der Fotograf hat jederzeit das Recht zu wissen, in welchem Buch seine Bilder wie verwendet wurden. Das gleiche gilt für die Verwendung von Texten. Auch diese müssen lizenzrechtlich erfasst werden – auch, damit gegenüber den Inhabern der Rechte eine Abrechnung erfolgen kann. Deshalb brauchen Verlage eine entsprechende Rechtedatenbank oder eine Rechtemanagement- software, in der diese Angaben erfasst werden. In vielen Fällen wurden diese Rechte ohne solche Lösungen verwaltet, z.B. in Excel, oder auch gar nicht. Darüber hinaus ist dies immer dann auch ein Thema, wenn Verlage andere Verlage übernehmen und die Verwaltung mittels unterschiedlicher Methoden vorgenommen wurde. Die Rechte wurden in den meisten Fällen jedoch in den Quellen- nachweisen vermerkt. In dem vorliegenden Fall liegen die Quellennachweise in mehr als 20.000 Büchern vor und die Aufgabe ist, aus diesen Quellennachweisen die Rechte der Rechteinhaber zu ermitteln und in eine strukturierte Form zu bringen. Von Hand eine schier unüberwindbare Aufgabe. Hinzu kommt, dass die Quellennachweise in den Büchern nicht einheitlich dargestellt werden und sich nicht immer an der gleichen Stelle im Buch befinden. Manche Quellennachweise finden sich am Anfang des Buches, oft aber ist den Nachweisen ein eigenes Kapitel am Ende des Buches gewidmet. Für die Darstellung der Quellennachweise gibt es keine einheitliche Regelung, sie sehen teilweise unterschiedlich aus, auch wenn prinzipiell die gleichen Informationen enthalten sind. Ähnliche Aufgabenstellungen gibt es bei den Verträgen mit den Rechteinhabern. Diese Verträge sind über viele Jahre gewachsen und erweitert worden. So kamen z.B. Rechte für Sprachen, Filme, eBooks und ähnliches hinzu. Um auch hier aus den vielleicht vielen zehntrausenden von Verträgen alle Rechte und deren Konditionen herauszufiltern, ist eine Lösung mittels manueller Erfassung quasi unmöglich. Gefragt ist deshalb eine Softwarelösung, die die Aufgabe Schritt für Schritt erledigt und so viel wie möglich automatisiert abarbeitet. Software-Tools für schnellere Bearbeitung Die tool-e-byte GmbH hat hier eine spezielle Lösung erarbeitet, die aus drei verschiedenen Software-Tools besteht und für einen Verlag bereits erfolgreich umgesetzt wurde. Auch hier stand am Anfang eine manuelle Bearbeitung: Eine festgelegte Anzahl von Büchern wurde manuell analysiert, um herauszufinden, wo die Informationen in den jeweiligen Büchern stehen, wie sie benannt sind und nach welchen Regeln die Informationen aufbereitet sind. Bestimmte Code- bzw. Stichwörter wurden in die Software eingebaut. Von Anfang an wurde darauf geachtet, dass die Liste ständig um neue Stichworte erweitert werden kann, um die Zukunftssicherheit der Software zu gewährleisten. Hinzu kam eine zweite Liste, die sogenannte Positivliste mit den bereits erfassten Rechteinhabern. Schnell wurde aber deutlich, dass im Zuge der Bearbeitung weitere Rechteinhaber neu erfasst werden mussten. Diese Negativliste wurde von den Mitarbeitern von tool-e-byte neu erstellt und darin alle neu auftauchenden Rechteinhaber vermerkt. Das erste Tool lädt und öffnet PDFs und erkennt Stichwörter wie z.B. die Begriffe „Bildquellen“, „Bildquellenverzeichnis“ oder „Textquellenverzeichnis“. Alle Seiten, die relevante Stichwörter enthalten, werden in eine Datenbank geladen. Quellennachweise Autorenrechte Rechteinhaber Extration Lizenzrechte
  • 2. Anwendungsfall Abbildung 1 Tool 1 - PDF Page Finder findet retlevante Seiten mit Rechteinhabern basierend auf Schlüsselwörtern Abbildung 2 Tool 1 - Bearbeitung des extrahierten Textes, Bestimmung der Struktur Die Bearbeiter bei tool-e-byte haben an dieser Stelle die Möglichkeit, die Übernahme des Textes im PDF zu überprüfen und beispielsweise das Inhaltsverzeichnis zu entfernen. Wenn hier der Begriff „Bildquelle“ steht, ist das ein reiner Verweis auf die entsprechende Seite (die von der Software gelad- en wurde). Das Tool erkennt außerdem die Struktur des Dokumentes und die Gesetzmäßigkeiten, die bei der Beschreibung der Quellenangaben verwendet wurden. Zwischen einzelne Quellen werden Separa- toren gesetzt. Sollte unerwarteterweise von der Software keine Seite im PDF erkannt werden, die in die Datenbank geladen wird, dann wird das Buch über OCR erfasst und die Auswertung dann erstellt. Nach diesem Arbeitsschritt beginnt das zweite Tool, der „Relevant Item Finder“ seine Arbeit. Die Bücher werden geladen, das Tool erkennt Text und Separator und bestimmt automatisch die soge- nannten Itemstrings, also die Namen der Rechteinhaber sowie die Seitenangabe. Dabei erkennt sie einzelne Codierungen (Muster) und arbeitet mithilfe der sogenannten „regulären Ausdrücke“ weiter. Hier werden bestimmte Zeichenketten (Pattern) erkannt, die Informationen extrahiert und geordnet. Die Zeichenketten werden auseinandergenommen, beispielsweise auch, um mehrere Rechteinhaber innerhalb einer Kette zu erkennen. Abschließend werden alle gewonnen Informa- tionen von der Software automatisch in die Datenbank eingespeist. Quellennachweise Autorenrechte Rechteinhaber Extration Lizenzrechte | Griesheim | Banja Luka | Sevilla | Nashik
  • 3. Anwendungsfall Abbildung 3 Tool 3 - Relevant Item Finder - Automatische Verarbeitung basierend auf den Ergebnissen von Tool 1 Abbildung 4 Tool 2 - manuelle Nachkorrektur der automatischen Verarbeitung Im nächsten Schritt erfolgt – diesmal manuell – die Nachkorrektur der automatischen Verarbeitung. Das ist z.B. deswegen nötig, weil die Namen der Rechteinhaber vom Eintrag in der Datenbank abwe- ichen können. Das letzte Tool schließlich, der Right Owner Finder, löst einzelne Rechteinhaber aus den Itemstrings heraus und verknüpft sie mit einer sogenannten Positivliste. In dieser Liste finden sich alle Rechtein- haber, die bereits angelegt wurden. Auch hier erfolgt eine manuelle Nachbearbeitung. Quellennachweise Autorenrechte Rechteinhaber Extration Lizenzrechte | Griesheim | Banja Luka | Sevilla | Nashik
  • 4. Anwendungsfall Abbildung 5 Tool 3 - Right Owner Finder - automatische Verarbeitung der Ergebnisse aus Tool 2 Abbildung 6 Tool 3 - manuelle Zuordnung der Rechteinhaber zu den Ergebnissen aus Tool 2 Sollte ein Rechteinhaber in einem Buch auftauchen, der bisher nicht in der Liste zu finden ist, dann wird er manuell der Liste hinzugefügt. Quellennachweise Autorenrechte Rechteinhaber Extration Lizenzrechte | Griesheim | Banja Luka | Sevilla | Nashik
  • 5. Anwendungsfall Abbildung 7 Tool 3 - Anlegen eines neuen Rechteinhabers in der Negativliste Abbildung 8 Tool 3 - Bestimmung der Rechteanzahl (Usage Count) Da die Verlage die Datenbank als Abrechnungsbasis nutzen wollen, müssen in einem letzten Schritt die Rechte eines Inhabers zusammengefasst werden. Damit sieht der zuständige Mitarbeiter im Verlag auf einen Blick, wie viele Rechte ein bestimmter Autor oder Fotograf in allen Büchern des Verlages hat. Damit profitiert der Verlag mehrfach: Zum einen zählt die Geschwindigkeit, mit der sich große Mengen an Büchern abbilden lassen. Statt intern viel Personal über einen langen Zeitraum zu beschäftigen wird jetzt in die Software investiert und der Extraktionsprozess erheblich beschleunigt. Durch das Softwaredesign ist außerdem die Zukunftsfähigkeit garantiert: Jedes neue Buch kann beim Erscheinen gleich erfasst und die Informationen in der Datenbank ergänzt werden. Damit ergeben sich für den Verlag auch neue Möglichkeiten, die digitalen Informationen zu verwenden. So ist z.B. vorstellbar, dass mit Rechteinhabern, auf die der Verlag häufig zurückgreift (wie große Bilddatenbanken) Rahmenverträge geschlossen werden oder dass die Informationen aus den Büchern mit dem Abrechnungssystem verknüpft werden. All das sind Szenarien die ohne die digitale Erfassung nicht realisierbar wären. info@tool-e-byte.eu+49 (0) 6155 - 5226 tool-e-byte GmbH, D-64347 Griesheim, Martin-Luther-str. 15 Quellennachweise Autorenrechte Rechteinhaber Extration Lizenzrechte