SlideShare ist ein Scribd-Unternehmen logo
1 von 40
Von Textwüsten zu
Forschungsdaten-
infrastrukturen
mit Text Mining
Dr. Ricardo Usbeck
Data Science, Universität Paderborn
Immer mehr Daten...
Immer mehr Daten...
Quelle: http://arxiv.org
...immer weniger Wissen.
Das Problem - Maschinelles Verstehen
Knowledge Graphs - Linked Data/RDF
Quelle: https://5stardata.info/en/
Knowledge Graphs - Linked Data/RDF
1. Graph-basiertes RDF-Model besteht aus Triplen (Subjekt, Prädikat, Objekt)
https://www.
th-wildau.de/
Knowledge Graphs - Linked Data/RDF
1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object)
TH_Wildau
Knowledge Graphs - Linked Data/RDF
1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object)
TH_Wildau
http://dbpedia.org/ontology/
veranstaltet
Knowledge Graphs - Linked Data/RDF
1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object)
TH_Wildau
veranstaltet
Knowledge Graphs - Linked Data/RDF
1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object)
Wildauer
Bibliothekssymposium
TH_Wildau
veranstaltet
Knowledge Graphs - Linked Data/RDF
1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object)
Wildauer
Bibliothekssymposium
TH_Wildau
Ricardo Usbeck
Alexander Mühle
Matthias Razum
veranstaltet
trägt vor
Knowledge Graphs - Linked Data/RDF
1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object)
Wildauer
Bibliothekssymposium
TH_Wildau
wikidata:Wildau
veranstaltet
befindet sich
trägt vor
https://orcid.org/0000-0002-019
1-7211
wikipedia:TextMining
orcidID
diskutiert
Ricardo Usbeck
Alexander Mühle
Matthias Razum
Knowledge Graphs - Linked Data/RDF
1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object)
2. Publikation im Web oder in einem Intranet für 5-Sterne-Level
Wildauer
Bibliothekssymposium
TH_Wildau
wikidata:Wildau
veranstaltet
befindet sich
trägt vor
https://orcid.org/0000-0002-019
1-7211
wikipedia:TextMining
orcidID
diskutiert
Ricardo Usbeck
Alexander Mühle
Matthias Razum
Knowledge Graphs - Für Forschungsdaten
Quelle: Auer et al., 2018, Towards an Open Research Knowledge Graph
1. Idee: Eine Maschine, die für uns liest
Quelle: http://aksw.org/Projects/AGDISTIS.html
1. Idee: Eine Maschine, die für uns liest
Quelle: http://aksw.org/Projects/AGDISTIS.html
1. Idee: Eine Maschine, die für uns liest
Quelle: http://aksw.org/Projects/AGDISTIS.html
1. Idee: Eine Maschine, die für uns liest
Quelle: http://aksw.org/Projects/AGDISTIS.html
1. Idee: Eine Maschine, die für uns liest
Quelle: http://aksw.org/Projects/AGDISTIS.html
1. Idee: Eine Maschine, die für uns liest
Quelle: http://aksw.org/Projects/AGDISTIS.html
2. Idee: Automatische Zusammenfassungen
Quelle: https://s2.exynize.com/ ScholarBrew
2. Idee: Automatische Zusammenfassungen
1. Extraktive Zusammenfassungen - Der Textmarker
Computing semantic relatedness for natural language processing (NLP) tasks, e.g. Entity
Linking (EL) and Question Answering (QA) using Semantic Web data. We pre-compute
semantic relatedness between the instances, relations, and classes of an ontology.
Quelle: https://s2.exynize.com/ ScholarBrew
2. Idee: Automatische Zusammenfassungen
2. Abstractive Zusammenfassungen - Der Bleistift
In 2016, the authors described an approach for calculating semantic relatedness using
Semantic Web data for resources, properties and classes to be used in real-time. They see
applications in areas such as Entity Linking or Question Answering.
Quelle: https://s2.exynize.com/ ScholarBrew
3. Idee: Argumente sammeln (lassen)
Quelle: Katarzyna (Kasia) Budzynska & Serena Villata,
http://www.i3s.unice.fr/~villata/tutorialIJCAI2016.html
3. Idee: Argumente sammeln (lassen)
Quelle: Katarzyna (Kasia) Budzynska & Serena Villata,
http://www.i3s.unice.fr/~villata/tutorialIJCAI2016.html
3. Idee: Argumente sammeln (lassen)
Quelle: Katarzyna (Kasia) Budzynska & Serena Villata,
http://www.i3s.unice.fr/~villata/tutorialIJCAI2016.html
3. Idee: Argumente sammeln (lassen)
Quelle: http://args.me
3. Idee: Argumente sammeln (lassen)
Quelle: http://www.research.ibm.com/artificial-intelligence/project-debater/
4. Idee: Suchen
Quelle: https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=CRISPR
4. Idee: Suchen Finden
Quelle: Auer et al., 2018, Towards an Open Research Knowledge Graph
4. Idee: Suchen Finden
Quelle: Dennis Diefenbach, http://wdaqua.eu/qa
4. Idee: Suchen Finden
Quelle: Athreya & Usbeck, http://chat.dbpedia.org/
Realitätscheck
Realitätscheck - Daten besser finden
Quelle: https://www.blog.google/products/search/making-it-easier-discover-datasets/
Realitätscheck - Verknüpftes Wissen
Quelle: http://researchgraph.org/
Realitätscheck- Verknüpftes Wissen
Quelle: http://researchgraph.org/
Realitätscheck- Zitatbewertung
Quelle: https://twitter.com/verumanalytics
Welche Fragen haben Sie?
DILS conference @ TIB Hannover,
20-21. November 2018,
https://events.tib.eu/dils2018/progra
mme/post-conference/
http://dice.cs.uni-paderborn.de/
https://github.com/dice-group/
http://dice-research.org/

Weitere ähnliche Inhalte

Ähnlich wie Von Textwüsten zu Forschungsdateninfrastrukturen mit Wissensgraphen

Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenLydiaU
 
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Björn Muschall
 
Semantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktischSemantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktischkostaedt
 
Semantisches und vernetztes Wissensmanagement für Forschung und Wissenschaft
Semantisches und vernetztes Wissensmanagement für Forschung und WissenschaftSemantisches und vernetztes Wissensmanagement für Forschung und Wissenschaft
Semantisches und vernetztes Wissensmanagement für Forschung und WissenschaftKatrin Weller
 
Wissenstechnologie 2007- III
Wissenstechnologie 2007- IIIWissenstechnologie 2007- III
Wissenstechnologie 2007- IIIpscheir
 
Linked Open Data in der Praxis, Kerstin Arnold
Linked Open Data in der Praxis, Kerstin ArnoldLinked Open Data in der Praxis, Kerstin Arnold
Linked Open Data in der Praxis, Kerstin ArnoldKerstin Arnold
 
16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und RepositorienPascal-Nicolas Becker
 
20080822barcamp Traunkirchen
20080822barcamp Traunkirchen20080822barcamp Traunkirchen
20080822barcamp TraunkirchenAndreas Blumauer
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltAdrian Pohl
 
Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf...
Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf...Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf...
Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf...LydiaU
 
2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Datakostaedt
 
Sitzung 11
Sitzung 11Sitzung 11
Sitzung 11scuy
 
6 - Sprachen des Semantic Web - RDF(S) Frameworks
6 - Sprachen des Semantic Web - RDF(S) Frameworks6 - Sprachen des Semantic Web - RDF(S) Frameworks
6 - Sprachen des Semantic Web - RDF(S) FrameworksSteffen Schloenvoigt
 
Web-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeWeb-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeChristoph Lange
 
Einführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenEinführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenMartin Voigt
 
20100913 dokumente dekonstruieren
20100913 dokumente dekonstruieren20100913 dokumente dekonstruieren
20100913 dokumente dekonstruierenStefan Gradmann
 
Einführung in das Semantic Web
Einführung in das Semantic WebEinführung in das Semantic Web
Einführung in das Semantic WebJakob .
 

Ähnlich wie Von Textwüsten zu Forschungsdateninfrastrukturen mit Wissensgraphen (20)

Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
 
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
 
Semantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktischSemantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktisch
 
Semantisches und vernetztes Wissensmanagement für Forschung und Wissenschaft
Semantisches und vernetztes Wissensmanagement für Forschung und WissenschaftSemantisches und vernetztes Wissensmanagement für Forschung und Wissenschaft
Semantisches und vernetztes Wissensmanagement für Forschung und Wissenschaft
 
Wissenstechnologie 2007- III
Wissenstechnologie 2007- IIIWissenstechnologie 2007- III
Wissenstechnologie 2007- III
 
1 - Einfuehrung
1 - Einfuehrung1 - Einfuehrung
1 - Einfuehrung
 
Bit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-webBit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-web
 
Linked Open Data in der Praxis, Kerstin Arnold
Linked Open Data in der Praxis, Kerstin ArnoldLinked Open Data in der Praxis, Kerstin Arnold
Linked Open Data in der Praxis, Kerstin Arnold
 
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAF
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAFWiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAF
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAF
 
16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien
 
20080822barcamp Traunkirchen
20080822barcamp Traunkirchen20080822barcamp Traunkirchen
20080822barcamp Traunkirchen
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der Bibliothekswelt
 
Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf...
Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf...Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf...
Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf...
 
2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data
 
Sitzung 11
Sitzung 11Sitzung 11
Sitzung 11
 
6 - Sprachen des Semantic Web - RDF(S) Frameworks
6 - Sprachen des Semantic Web - RDF(S) Frameworks6 - Sprachen des Semantic Web - RDF(S) Frameworks
6 - Sprachen des Semantic Web - RDF(S) Frameworks
 
Web-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeWeb-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-Gruppe
 
Einführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenEinführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in Massendaten
 
20100913 dokumente dekonstruieren
20100913 dokumente dekonstruieren20100913 dokumente dekonstruieren
20100913 dokumente dekonstruieren
 
Einführung in das Semantic Web
Einführung in das Semantic WebEinführung in das Semantic Web
Einführung in das Semantic Web
 

Von Textwüsten zu Forschungsdateninfrastrukturen mit Wissensgraphen

  • 1. Von Textwüsten zu Forschungsdaten- infrastrukturen mit Text Mining Dr. Ricardo Usbeck Data Science, Universität Paderborn
  • 3. Immer mehr Daten... Quelle: http://arxiv.org
  • 5. Das Problem - Maschinelles Verstehen
  • 6. Knowledge Graphs - Linked Data/RDF Quelle: https://5stardata.info/en/
  • 7. Knowledge Graphs - Linked Data/RDF 1. Graph-basiertes RDF-Model besteht aus Triplen (Subjekt, Prädikat, Objekt) https://www. th-wildau.de/
  • 8. Knowledge Graphs - Linked Data/RDF 1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object) TH_Wildau
  • 9. Knowledge Graphs - Linked Data/RDF 1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object) TH_Wildau http://dbpedia.org/ontology/ veranstaltet
  • 10. Knowledge Graphs - Linked Data/RDF 1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object) TH_Wildau veranstaltet
  • 11. Knowledge Graphs - Linked Data/RDF 1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object) Wildauer Bibliothekssymposium TH_Wildau veranstaltet
  • 12. Knowledge Graphs - Linked Data/RDF 1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object) Wildauer Bibliothekssymposium TH_Wildau Ricardo Usbeck Alexander Mühle Matthias Razum veranstaltet trägt vor
  • 13. Knowledge Graphs - Linked Data/RDF 1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object) Wildauer Bibliothekssymposium TH_Wildau wikidata:Wildau veranstaltet befindet sich trägt vor https://orcid.org/0000-0002-019 1-7211 wikipedia:TextMining orcidID diskutiert Ricardo Usbeck Alexander Mühle Matthias Razum
  • 14. Knowledge Graphs - Linked Data/RDF 1. Graph-basiertes RDF-Model besteht aus Triplen (subject, predicate, object) 2. Publikation im Web oder in einem Intranet für 5-Sterne-Level Wildauer Bibliothekssymposium TH_Wildau wikidata:Wildau veranstaltet befindet sich trägt vor https://orcid.org/0000-0002-019 1-7211 wikipedia:TextMining orcidID diskutiert Ricardo Usbeck Alexander Mühle Matthias Razum
  • 15. Knowledge Graphs - Für Forschungsdaten Quelle: Auer et al., 2018, Towards an Open Research Knowledge Graph
  • 16. 1. Idee: Eine Maschine, die für uns liest Quelle: http://aksw.org/Projects/AGDISTIS.html
  • 17. 1. Idee: Eine Maschine, die für uns liest Quelle: http://aksw.org/Projects/AGDISTIS.html
  • 18. 1. Idee: Eine Maschine, die für uns liest Quelle: http://aksw.org/Projects/AGDISTIS.html
  • 19. 1. Idee: Eine Maschine, die für uns liest Quelle: http://aksw.org/Projects/AGDISTIS.html
  • 20. 1. Idee: Eine Maschine, die für uns liest Quelle: http://aksw.org/Projects/AGDISTIS.html
  • 21. 1. Idee: Eine Maschine, die für uns liest Quelle: http://aksw.org/Projects/AGDISTIS.html
  • 22. 2. Idee: Automatische Zusammenfassungen Quelle: https://s2.exynize.com/ ScholarBrew
  • 23. 2. Idee: Automatische Zusammenfassungen 1. Extraktive Zusammenfassungen - Der Textmarker Computing semantic relatedness for natural language processing (NLP) tasks, e.g. Entity Linking (EL) and Question Answering (QA) using Semantic Web data. We pre-compute semantic relatedness between the instances, relations, and classes of an ontology. Quelle: https://s2.exynize.com/ ScholarBrew
  • 24. 2. Idee: Automatische Zusammenfassungen 2. Abstractive Zusammenfassungen - Der Bleistift In 2016, the authors described an approach for calculating semantic relatedness using Semantic Web data for resources, properties and classes to be used in real-time. They see applications in areas such as Entity Linking or Question Answering. Quelle: https://s2.exynize.com/ ScholarBrew
  • 25. 3. Idee: Argumente sammeln (lassen) Quelle: Katarzyna (Kasia) Budzynska & Serena Villata, http://www.i3s.unice.fr/~villata/tutorialIJCAI2016.html
  • 26. 3. Idee: Argumente sammeln (lassen) Quelle: Katarzyna (Kasia) Budzynska & Serena Villata, http://www.i3s.unice.fr/~villata/tutorialIJCAI2016.html
  • 27. 3. Idee: Argumente sammeln (lassen) Quelle: Katarzyna (Kasia) Budzynska & Serena Villata, http://www.i3s.unice.fr/~villata/tutorialIJCAI2016.html
  • 28. 3. Idee: Argumente sammeln (lassen) Quelle: http://args.me
  • 29. 3. Idee: Argumente sammeln (lassen) Quelle: http://www.research.ibm.com/artificial-intelligence/project-debater/
  • 30. 4. Idee: Suchen Quelle: https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=CRISPR
  • 31. 4. Idee: Suchen Finden Quelle: Auer et al., 2018, Towards an Open Research Knowledge Graph
  • 32. 4. Idee: Suchen Finden Quelle: Dennis Diefenbach, http://wdaqua.eu/qa
  • 33. 4. Idee: Suchen Finden Quelle: Athreya & Usbeck, http://chat.dbpedia.org/
  • 35. Realitätscheck - Daten besser finden Quelle: https://www.blog.google/products/search/making-it-easier-discover-datasets/
  • 36. Realitätscheck - Verknüpftes Wissen Quelle: http://researchgraph.org/
  • 37. Realitätscheck- Verknüpftes Wissen Quelle: http://researchgraph.org/
  • 39.
  • 40. Welche Fragen haben Sie? DILS conference @ TIB Hannover, 20-21. November 2018, https://events.tib.eu/dils2018/progra mme/post-conference/ http://dice.cs.uni-paderborn.de/ https://github.com/dice-group/ http://dice-research.org/