During recent years, the traditional pulp and papermaking business in Europe has been striving to find new viable applications for wood fibres. The target has been to improve the value and properties of traditional fibres and fibre products and to find new applications for wood fibres that would support much-needed growth in the industry. However, the natural properties of the fibres limit their use in many applications. Fibre functionalization by bonding of new compounds to the fibres is a method to produce fibres with altered properties.
An interesting option is targeted modification of fibre surface lignin via enzymatic radical formation with oxidative enzymes. The reactive radicals generated on the fibre surface can be utilised in the bonding of new compounds. In order to exploit the laccase-based functionalization method, deep understanding of factors affecting the formation of phenoxy radicals in fibres is needed. The main aim of this thesis was to elucidate the effects of laccase treatments on softwood TMPs and their fractions. Furthermore, potential utilisation of the radicals formed by laccase-catalysed oxidation in fibre functionalization was assessed.
Ontologies are used in numerous research disciplines and commercial applications to uniformly and semantically annotate real-world objects. Often there are multiple interrelated ontologies in a domain, and repositories such as BioPortal already provide mappings (links) between these ontologies. Especially manually verified mappings can be reused 1) to create new mappings between so far unconnected sources, and 2) to avoid an expensive re-identification, e.g. when the underlying ontologies change.
New ontology mappings can be determined by reusing and composing previously determined mappings that involve intermediate ontologies. The composition of mappings is very efficient and can achieve mappings of very high quality especially for valuable intermediate ontologies. Moreover, due to a rapid development of application domains, ontologies are frequently changed to include up-to-date knowledge. These changes dramatically influence dependent data as well as applications like ontology mappings and ontology-based annotations. Thus existing mappings may become invalid and need to be migrated to the most recent ontology versions, such that users and dependent applications can consume up-to-date mappings.
In this talk, I will give a brief introduction to ontology mappings and provide an overview on reuse-based approaches for mapping creation and maintenance, currently studied at the Database Group at Leipzig University.
Protein expression and purification services from creative biomartAnne Ehlert
Creative BioMart is committed to providing advanced tools for protein expression and purification. As a leading supplier for reagents in the biotechnology field, we understand the importance of convenient and easy-to-use systems for high level expression and sample purification. We invite you to review our growing range of expression systems resulting from our experience in cloning, overexpression and purification.
Soluble protein expression optimizationBiologicsCorp
In many cases, expression of recombinant proteins often results in insoluble and/or nonfunctional proteins. Here, factors in soluble protein expression optimization and several strategies to improve the solubility of the expressed protein are reviewed.
During recent years, the traditional pulp and papermaking business in Europe has been striving to find new viable applications for wood fibres. The target has been to improve the value and properties of traditional fibres and fibre products and to find new applications for wood fibres that would support much-needed growth in the industry. However, the natural properties of the fibres limit their use in many applications. Fibre functionalization by bonding of new compounds to the fibres is a method to produce fibres with altered properties.
An interesting option is targeted modification of fibre surface lignin via enzymatic radical formation with oxidative enzymes. The reactive radicals generated on the fibre surface can be utilised in the bonding of new compounds. In order to exploit the laccase-based functionalization method, deep understanding of factors affecting the formation of phenoxy radicals in fibres is needed. The main aim of this thesis was to elucidate the effects of laccase treatments on softwood TMPs and their fractions. Furthermore, potential utilisation of the radicals formed by laccase-catalysed oxidation in fibre functionalization was assessed.
Ontologies are used in numerous research disciplines and commercial applications to uniformly and semantically annotate real-world objects. Often there are multiple interrelated ontologies in a domain, and repositories such as BioPortal already provide mappings (links) between these ontologies. Especially manually verified mappings can be reused 1) to create new mappings between so far unconnected sources, and 2) to avoid an expensive re-identification, e.g. when the underlying ontologies change.
New ontology mappings can be determined by reusing and composing previously determined mappings that involve intermediate ontologies. The composition of mappings is very efficient and can achieve mappings of very high quality especially for valuable intermediate ontologies. Moreover, due to a rapid development of application domains, ontologies are frequently changed to include up-to-date knowledge. These changes dramatically influence dependent data as well as applications like ontology mappings and ontology-based annotations. Thus existing mappings may become invalid and need to be migrated to the most recent ontology versions, such that users and dependent applications can consume up-to-date mappings.
In this talk, I will give a brief introduction to ontology mappings and provide an overview on reuse-based approaches for mapping creation and maintenance, currently studied at the Database Group at Leipzig University.
Protein expression and purification services from creative biomartAnne Ehlert
Creative BioMart is committed to providing advanced tools for protein expression and purification. As a leading supplier for reagents in the biotechnology field, we understand the importance of convenient and easy-to-use systems for high level expression and sample purification. We invite you to review our growing range of expression systems resulting from our experience in cloning, overexpression and purification.
Soluble protein expression optimizationBiologicsCorp
In many cases, expression of recombinant proteins often results in insoluble and/or nonfunctional proteins. Here, factors in soluble protein expression optimization and several strategies to improve the solubility of the expressed protein are reviewed.
Recombinant protein expression in E.coliajithnandanam
Recombinant Protein expression in E.coli, Best suitable strains for protein expression, advantages of using E.coli for choosing the host for protein expression
Medizinische Berichte werden meistens als Freitext erstellt, da dies schnell geht und in jeder Situation eine hohe Flexibilität hat. Werden allerdings Daten oder Dokumente in medizinischen Systemen zwischen mehreren Partnern geteilt kann auch eine maschinelle Auswertung helfen, vor allen wenn es um sehr große Datenmengen geht. Auch standardisierte Benutzung von Abkürzungen und generellen Begriffen kann die Verständlichkeit der Texte erhöhen.
In der Radiologie ist die RadLex Terminologie vor allem für das Schreiben von Radiologieberichten erstellt worden. RadLex hilft, die benutzen Worte verschiedenen Personen vergleichbarer zu machen und sowohl Synonyme als auch andere Verwandtschaften von Begriffen analysieren zu können. RadLex existiert in Englisch und Deutsch, es können also damit auch deutsche Begriffe benutzt werden, um z.B. in englischen Dokumenten zu suchen. Durch templates im DICOM structured reporting kann RadLex auch helfen Abläufe effizienter zu machen und Strukturen der Texte kontextbezogen wiederzubenutzen.
Ergebnisse des Forschungsprojektes Khresmoi (http://www.khresmoi.eu/) werden präsentiert und auch weitere Ideen für die Entwicklung von generellen Suchwerkzeugen in medizinischen Daten, vor allem in visuellen Daten, wie Suche nach visuell ähnlichen volumes of interest oder die Suche nach wissenschaftlichen Artikeln, die thematisch zu einem bearbeiteten Fall passen.
Recombinant protein expression in E.coliajithnandanam
Recombinant Protein expression in E.coli, Best suitable strains for protein expression, advantages of using E.coli for choosing the host for protein expression
Medizinische Berichte werden meistens als Freitext erstellt, da dies schnell geht und in jeder Situation eine hohe Flexibilität hat. Werden allerdings Daten oder Dokumente in medizinischen Systemen zwischen mehreren Partnern geteilt kann auch eine maschinelle Auswertung helfen, vor allen wenn es um sehr große Datenmengen geht. Auch standardisierte Benutzung von Abkürzungen und generellen Begriffen kann die Verständlichkeit der Texte erhöhen.
In der Radiologie ist die RadLex Terminologie vor allem für das Schreiben von Radiologieberichten erstellt worden. RadLex hilft, die benutzen Worte verschiedenen Personen vergleichbarer zu machen und sowohl Synonyme als auch andere Verwandtschaften von Begriffen analysieren zu können. RadLex existiert in Englisch und Deutsch, es können also damit auch deutsche Begriffe benutzt werden, um z.B. in englischen Dokumenten zu suchen. Durch templates im DICOM structured reporting kann RadLex auch helfen Abläufe effizienter zu machen und Strukturen der Texte kontextbezogen wiederzubenutzen.
Ergebnisse des Forschungsprojektes Khresmoi (http://www.khresmoi.eu/) werden präsentiert und auch weitere Ideen für die Entwicklung von generellen Suchwerkzeugen in medizinischen Daten, vor allem in visuellen Daten, wie Suche nach visuell ähnlichen volumes of interest oder die Suche nach wissenschaftlichen Artikeln, die thematisch zu einem bearbeiteten Fall passen.
Open Science in den Sozialwissenschaften und der Soziologieuherb
Open Science drängt auf die möglichst umstandslose Nutzbarkeit und Verfügbarkeit weitgehend aller im Forschungsprozess anfallenden Informationen. Dazu zählen in erster Linie Textpublikationen, Forschungsdaten und Forschungssoftware. Will Open Science sich jedoch nicht nur auf die Verfügbarkeit von Objekten kaprizieren, sondern auch Transparenz als Ziel ausloben, so sollten auch die wissenschaftliche Arbeit moderierende Prozesse (wie die Begutachtung bzw. Review von Textpublikationen) und die zur Bewertung von Wissenschaft herangezogenen Parainformationen (Impact-Metriken) von ihr adressiert werden.
Der Vortrag referiert den Status Quo der Open Science in Soziologie und Sozialwissenschaften entlang der erwähnten Ausformungen der Open Science: Open Access zu Textpublikationen und Forschungsdaten, Open Access zu Forschungssoftware, Open Review und Open Metrics. Vortrag am GESIS – Leibniz-Institut für Sozialwissenschaften, Köln, 24.01.2017.
2. LHA – Leipziger Gesundheitsatlas
Ontologien
Kick-off Meeting, Leipzig, 04.04.2016 2
• Strukturierte Repräsentation von Wissen
Konzepte, Beziehungen
• Sehr große Ontologien
Tissue
Anatomic Structure,
System, or Substance
Organ …
Anatomie Molekular-
biologie
ChemieMedizin
Lung SkinKidney …
3. LHA – Leipziger Gesundheitsatlas
Ontologiebasierte Annotationen
Kick-off Meeting, Leipzig, 04.04.2016 3
• Einheitliche, semantische
Beschreibung von Objekt-
eigenschaften
Gene, Proteine, … Publikationen Patientenakten Case Report Forms
UMLS
→ Semantische Suche, Navigation …
→ Interoperabilität, quellübergreifende Analysen, ...
• z.B. zwischen klinischen & Forschungsanwendungen
→ Identifikation von Common Data Elements (CDEs)
• z.B. Design neuer Fragebögen (Wiederverwendung)
…
4. LHA – Leipziger Gesundheitsatlas
Probleme und Ziele
Kick-off Meeting, Leipzig, 04.04.2016 4
• Bisher kaum Annotationen für z.B. Case Report Forms (CRFs),
Analyseergebnisse, komplexe Phänotypen, …
• Schwieriger und aufwendiger Annotationsprozess
• Domänenspezifische Objekteigenschaften
• Unstrukturierte Freitextangaben
• Hohe Anzahl biomedizinischer Datensätze & sehr große Ontologien
• Semantische Anreicherung der LHA-Daten durch Annotationen
• Entwicklung (semi-)automatischer Annotation Linking Verfahren
• Hohe Datenqualität: Verifikation und iterative Verbesserung
• Effiziente Verlinkung: steigende Anzahl Quellen+Anwendungen im LHA
5. LHA – Leipziger Gesundheitsatlas
Ziele AG 1.3
1) Annotationsverwaltung und Datenintegration
• Vereinheitlichung der Objekte und Dokumente und Integration
in die LHA-Forschungsdatenbank (mit AP 1.1)
2) Weiterentwicklung und Anwendung von Annotation
Linking Verfahren für LHA-Daten
• Verwendung von Metadaten + Wiederverwendung existierender Links
• Nutzen der in BIO definierten ontologischen Grundlage (mit AP 1.2)
• Realisierung effizienter, skalierbarer Annotationsverfahren
(mit Big Data Zentrum ScaDS Dresden/Leipzig)
3) Qualitätsanalyse und Verifikation der Annotationen
• Qualitätskriterien: Ranking von Annotationsvorschlägen
• Qualitätsanalyse, Verifikation und iterative Verbesserung (mit AP 1.4 und AP 2)
• Analyse der Effizienz der Linking Verfahren
Kick-off Meeting, Leipzig, 04.04.2016 5
6. LHA – Leipziger Gesundheitsatlas
Vorarbeiten – Ontology Matching
Kick-off Meeting, Leipzig, 04.04.2016 6
• GOMMA: GENERIC ONTOLOGY MATCHING AND MAPPING MANAGEMENT
• Umfangreiche Infrastruktur zur Verwaltung und Analyse der
Evolution von Ontologien und Mappings
Kirsten, Groß, Hartung, Rahm: GOMMA: A Component-based Infrastructure for managing and
analyzing Life Science Ontologies and their Evolution. Journal of Biomedical Semantics, 2:6, 2011.
7. LHA – Leipziger Gesundheitsatlas
Beispiel: Annotation von CRFs
Kick-off Meeting, Leipzig, 04.04.2016 7
• Case Report Forms (CRFs): Fragebögen / Formulare
zur Datenerhebung
• Medizinische Historie von Patienten
• Soziodemographie
• Anthropometrie
• Eignungskriterien für Patientenrekrutierung
• …
• Annotation mit Konzepten biomedizinischer Ontologien
UMLSLIFE Investigation
Ontology
BIO
9. LHA – Leipziger Gesundheitsatlas
Kick-off Meeting, Leipzig, 04.04.2016
Seit wann leben Sie im Alten- oder Pflegeheim?
…
In welchem Land sind Sie geboren?
In Deutschland
Weiß nicht
Antwortverweigerung
In einem anderen Land
In welchem Land ist Ihre Mutter geboren?
In Deutschland
Weiß nicht
Antwortverweigerung
In einem anderen Land
9
10. LHA – Leipziger Gesundheitsatlas
Kick-off Meeting, Leipzig, 04.04.2016
Metathesaurus UMLS, NCI
Codes:
https://cdebrowser.nci.nih.gov/CDEBrowser/
https://ncim.nci.nih.gov/ncimbrowser/
https://uts.nlm.nih.gov/metathesaurus.html
Seit wann leben Sie im Alten- oder Pflegeheim?
…
In welchem Land sind Sie geboren?
In Deutschland
Weiß nicht
Antwortverweigerung
In einem anderen Land
In welchem Land ist Ihre Mutter geboren?
In Deutschland
Weiß nicht
Antwortverweigerung
In einem anderen Land
C0032040
Place of Birth
Birth Place
C3172580
Where was your biological mother born?
Mother birthplace
C0338046
Residential Home
retirement home
11. LHA – Leipziger Gesundheitsatlas
Kick-off Meeting, Leipzig, 04.04.2016
Metathesaurus UMLS, NCI
NCI Common Data Elements
(CDEBrowser)
Codes:
https://cdebrowser.nci.nih.gov/CDEBrowser/
https://ncim.nci.nih.gov/ncimbrowser/
https://uts.nlm.nih.gov/metathesaurus.html
Seit wann leben Sie im Alten- oder Pflegeheim?
…
In welchem Land sind Sie geboren?
In Deutschland
Weiß nicht
Antwortverweigerung
In einem anderen Land
In welchem Land ist Ihre Mutter geboren?
In Deutschland
Weiß nicht
Antwortverweigerung
In einem anderen Land
C0032040
Place of Birth
Birth Place
2661044
Demographic Patient Birth Place Code
Birth Place
C3172580
Where was your biological mother born?
Mother birthplace
C0338046
Residential Home
retirement home
12. LHA – Leipziger Gesundheitsatlas
Patients who have had prior
recombinant erythropoietin
treatment whose anemia
had never responded
Patients who have had prior
recombinant erythropoietin (1)
treatment whose anemia (2)
had never responded (3)
Patients with established CRF
as an indication for the
treatment of anemia
Herausforderungen
Kick-off Meeting, Leipzig, 04.04.2016 12
• Fragen häufig in natürlicher
Sprache formuliert
• Identifikation relevanter Terme
oder Termgruppen
• Suche nach N:M Korrespondenzen
• Fragen können mehrere
biomedizinische Konzepte enthalten
• Standardstrategien erzeugen
1:1 Mappings
• Größe der Datenquellen
• Viele Formulare
• UMLS: >2.8 Millionen Konzepte
• Teilweise verschiedene
Sprachen (engl., dt.)
1 C0022661 Kidney Failure, Chronic
2 C0039798 therapeutic aspects
3 C0002871 Anemia
1 C0376541 Recombinant Erythropoietin
2 C0002871 Anemia
3 C0438286 Absent response to treatment
Patients with established CRF (1)
as an indication for the
treatment (2) of anemia (3)
yes no
yes no
13. LHA – Leipziger Gesundheitsatlas
Vorarbeiten - Annotation Linking
Kick-off Meeting, Leipzig, 04.04.2016 13
• Workflow zur automatischen Annotation von
medizinischen Formularen mit UMLS
Christen, Groß, Varghese, Dugas, Rahm: Annotating Medical Forms using UMLS. Proc. 11th Intl.
Conference on Data Integration in the Life Sciences (DILS), 2015.
Keyword
Identifikation
(POS-Tagging),
Tokenisierung,
Semantisches
Blocking
Matching:
TF/IDF,
Trigram, LCS,
Soft-TFIDF…
Selektion:
Threshold,
Group-based
filtering
…
Set of
annotation
mappings
ℳ𝐹1,𝑈𝑀𝐿𝑆
…
ℳ𝐹 𝑛,𝑈𝑀𝐿𝑆
Set of
forms
𝐹1 . . 𝐹 𝑛
UMLS
Preprocessing Annotation
Generation
Postprocessing
14. LHA – Leipziger Gesundheitsatlas
Erweiterte Verfahren
Kick-off Meeting, Leipzig, 04.04.2016 14
• Wiederverwendung existierender Annotationen
• Erzeugung von Annotationsclustern
• Gruppierung nach Konzepten &
Identifikation von relevanten Features
• Linking neuer CRFs nutzt Cluster
• Semantik-basierte Selektion
• Ausnutzung der semantischen
Beziehungen zwischen Konzepten
• Co-Okkurrenzen: häufig gemeinsame
Annotation zu einer Frage
• Ontologiehierarchie
• Graphbasierte Verfahren zur
Ähnlichkeitsberechnung
Victor Christen: Annotation of Medical Documents. Talk at Australian National
University, Canberra, March 2016.
15. LHA – Leipziger Gesundheitsatlas
Zusammenfassung
• LHA-Forschungsdatenbank: Komponente zur
Annotationsverwaltung und Datenintegration
• Weiterentwicklung und Anwendung von Annotation
Linking Verfahren für LHA-Daten
• CRFs, Analyseergebnisse, Phänotypen
• LIFE Investigation Ontology, BIO, externe Ontologien
• Definition von Qualitätskriterien
• Verifikation der Annotationen und iterative
Verbesserung der Verfahren und Ergebnisse
15Kick-off Meeting, Leipzig, 04.04.2016