Algorithmen und Applikationen zur
interaktiven Visualisierung und
zum visuellen Data Mining
chemiespezifischer Datensätze
...
Inhalt
• Das ChemVis-Projekt
• Visualisierung chemischer Datenobjekte
• Visual Data Mining in der Chemie
– Problemstellung...
Interaktive Computergraphik
in der Chemie
„Neben der Bearbeitung komplexer numerischer Probleme ist es vor
allem die farbg...
ChemVis Projekt
Interdiziplinäres DFG-Projekt (V3D2):
Computer-Chemie-Centrum,
Universität Erlangen-Nürnberg
Visualisierun...
Inhalt
• Das ChemVis-Projekt
• Visualisierung chemischer Datenobjekte
• Visual Data Mining in der Chemie
– Problemstellung...
Visualisierung chemischer Datenobjekte
OH

H

H

H

O

Problem:
• Vielzahl nicht-kompatibler Standalone-Programme
• Einges...
Problematik der Web-basierten
Wissenschaftlichen Visualisierung
Visualisierung ist essentiell aber auch
poblematisch:
• un...
Visualisierung
Interaktion
3D
Daten

Filter

Mapper

Renderer

Bilder
Video
Darstellung

Visualisierungspipeline

1-t t

V...
Client-Server-basierte
Visualisierungspipeline
Interaktion
Server
3D
Daten

Filter

Mapper

Renderer

Bilder
Video
Client
...
Interaktive Visualisierung von
Molekülorbitalen - OrbVis I
Ziel: Vereinfachte Zugänglichkeit zur Quantenchemie
• Existiere...
Interaktive Visualisierung von
Molekülorbitalen - OrbVis II

Auswahlfenster mit Energieniveaus

VRML-Plugin und JAVAApplet...
Client-Server-basierte Applikationen

Molsurf
VRML Creator for Chemical
Structures

Cryo-EMVis

Moleklüdynamikanimationen
...
Inhalt
• Das ChemVis-Projekt
• Visualisierung chemischer Datenobjekte
• Visual Data Mining in der Chemie
– Problemstellung...
Daten in der Chemie
18000000
16000000
14000000
12000000
10000000
8000000
6000000
4000000
2000000

Merck Katalog
Synopsys P...
Multi-variate und multi-dimensionale
numerische Datensätze
Änderung der Chemischen Synthesetechnologie
• Neue Technologien...
Visual Data Mining
Problem:
• Informationsflut
• Multidimensionalität
• inhärentes Wissen bleibt verborgen
• Klassische Da...
Glyph-basierte Informationsvisualisierung
• 3 Raumdimensionen
• Farbe
• Form
• Größe
• Transparenz
• Oberflächeneffekte
• ...
Java/Java3D InfVis Applikation
Menü

Java3D
Render
Fenster

Tool-Fenster:
Dynamische Filter,
Detailinformationen,
Selektie...
Java/Java3D InfVis Applikation
- Render-Fenster
3D Barchart

Scatterplot
3D Glyphen
© Oellien, Intervet Innovation GmbH 20...
Java/Java3D InfVis Applikation
- Tool-Fenster

Dynamische Filter-Tools
Selektions-Tools
Detailinformationen
© Oellien, Int...
Java/Java3D InfVis Applikation
- Menü und Kontroll-Fenster

© Oellien, Intervet Innovation GmbH 2003
BioChemInformatics
ChemCodes Reaktionsdatenbank I
• Umsetzungen der 100 wichtigsten FGs ~ 75% der Chemie
• 100 Standardreaktionen gleichfalls...
Beispiel I: Reaktionsoptimierung
• Aufgabe:
Optimierung einer Reaktion auf > 95% Ausbeute
• 7-dimensionaler Raum:
Reagenz,...
Beispiel I: Reaktionsoptimierung

© Oellien, Intervet Innovation GmbH 2003
BioChemInformatics
Beispiel II: Reaktionsplanung
H

KompatibilitätsKontrolle
der funktionellen
Gruppen

H
N

H

O

© Oellien, Intervet Innova...
Functional Group Compatibility Browser

© Oellien, Intervet Innovation GmbH 2003
BioChemInformatics
Beispiel II: Reaktionsplanung

© Oellien, Intervet Innovation GmbH 2003
BioChemInformatics
Beispiel III: Leitstruktursuche
• Initiiert im April 1990
(modifiziert 1994)
• ~ 250.000 Verbindungen
• 41.000 mit anti-tu...
Beispiel III: Leitstruktursuche
COMPARE
• nur Vergleich von 2
Verbindungen
• Ähnlichkeitsvergleich
hinsichtlich der
biolog...
Beispiel III: Leitstruktursuche

© Oellien, Intervet Innovation GmbH 2003
BioChemInformatics
Beispiel III: Leitstruktur-Suche
(Clusterung von Platinverbindungen)

© Oellien, Intervet Innovation GmbH 2003
BioChemInfo...
NCI Screening Data 3D Miner I

© Oellien, Intervet Innovation GmbH 2003
BioChemInformatics
NCI Screening Data 3D Miner II

© Oellien, Intervet Innovation GmbH 2003
BioChemInformatics
Ausblick: Volumen-basierte
Informationsvisualisierung
Datensätze mit Millionen von Datenpunkten
Glyph-basierte Ansätze
• p...
Danksagung
• Prof. Johann Gasteiger
Computer-Chemie-Centrum
Universität Erlangen-Nürnberg

C

3

• Prof. Thomas Ertl, Dr. ...
Nächste SlideShare
Wird geladen in …5
×

Algorithmen und Applikationen zur interaktiven Visualisierung und visuellen Data Mining chemiespezifischer Datensätze

687 Aufrufe

Veröffentlicht am

Algorithmen und Applikationen zur interaktiven Visualisierung und visuellen Data Mining chemiespezifischer Datensätze, Intervet, 2002, Schwabenheim, Germany

Veröffentlicht in: Gesundheit & Medizin
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
687
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
12
Aktionen
Geteilt
0
Downloads
3
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Algorithmen und Applikationen zur interaktiven Visualisierung und visuellen Data Mining chemiespezifischer Datensätze

  1. 1. Algorithmen und Applikationen zur interaktiven Visualisierung und zum visuellen Data Mining chemiespezifischer Datensätze Frank Oellien Intervet Innovation GmbH D-55270 Schwabenheim Computer Chemie Centrum D-91052 Erlangen © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  2. 2. Inhalt • Das ChemVis-Projekt • Visualisierung chemischer Datenobjekte • Visual Data Mining in der Chemie – Problemstellung – InfVis-Applikation – Beispiele – Ausblick © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  3. 3. Interaktive Computergraphik in der Chemie „Neben der Bearbeitung komplexer numerischer Probleme ist es vor allem die farbgraphische Umsetzung der Ergebnisse, die der menschlichen Fähigkeit, Bilder leichter und schneller zu erfassen als Texte und Zahlenkolonnen, überaus entgegenkommt.“ Molecular Modelling: „...die Berechnung, Darstellung und Bearbeitung von realistischen, dreidimensionalen Molekülstrukturen und ihren phsikochemischen Eigenschaften.“ Erst möglich durch komfortable, leistungsfähige interaktive Computergraphiksysteme. „Wirkstoffdesign“; Böhm, Klebe, Kubinyi „Ein Bild sagt mehr als Tausend Worte!“ Internationales Sprichwort © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  4. 4. ChemVis Projekt Interdiziplinäres DFG-Projekt (V3D2): Computer-Chemie-Centrum, Universität Erlangen-Nürnberg Visualisierung und Interaktive Systeme Universität Stuttgart Ziel: Entwicklung von Technologien zur Einbindung von interaktiven, chemischen Repräsentationen in digitale Dokumente http://www2.chemie.uni-erlangen.de/ChemVis/ © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  5. 5. Inhalt • Das ChemVis-Projekt • Visualisierung chemischer Datenobjekte • Visual Data Mining in der Chemie – Problemstellung – InfVis-Applikation – Beispiele – Ausblick © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  6. 6. Visualisierung chemischer Datenobjekte OH H H H O Problem: • Vielzahl nicht-kompatibler Standalone-Programme • Eingeschränkter Informationsfluss • Eingeschränkte Einsicht in Daten und Zusammenhänge Ziel: Portable, sich an Internetstandards orientierende Systeme, die eine Einbettung dynamischer Visualisierungen in digitale Dokumente erlauben. © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  7. 7. Problematik der Web-basierten Wissenschaftlichen Visualisierung Visualisierung ist essentiell aber auch poblematisch: • unterschiedliche Plattformen (PC, SGI, ...) • unterschiedliche Graphikhardware • unterschiedliche HW-Generationen (Alter) • unterschiedliche Betriebssysteme © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  8. 8. Visualisierung Interaktion 3D Daten Filter Mapper Renderer Bilder Video Darstellung Visualisierungspipeline 1-t t Volumen Zellen Interpolation Triangulation BildschirmKoordinaten Bild © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  9. 9. Client-Server-basierte Visualisierungspipeline Interaktion Server 3D Daten Filter Mapper Renderer Bilder Video Client Darstellung Visualisierungspipeline 1-t t Volumen Zellen Interpolation Triangulation BildschirmKoordinaten Bild © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  10. 10. Interaktive Visualisierung von Molekülorbitalen - OrbVis I Ziel: Vereinfachte Zugänglichkeit zur Quantenchemie • Existierende Plattform-unabhängige Techniken nutzen • Übertragung chemischer Daten Keine Volumendaten ! • Chemisches Wissen im Applet → Client-seitiger Ansatz (Graphikkarten, Interaktionsrate) © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  11. 11. Interaktive Visualisierung von Molekülorbitalen - OrbVis II Auswahlfenster mit Energieniveaus VRML-Plugin und JAVAApplet mit LUMO bzw. HOMO © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  12. 12. Client-Server-basierte Applikationen Molsurf VRML Creator for Chemical Structures Cryo-EMVis Moleklüdynamikanimationen Molekorbitalanimationen (Reaktionen) © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  13. 13. Inhalt • Das ChemVis-Projekt • Visualisierung chemischer Datenobjekte • Visual Data Mining in der Chemie – Problemstellung – InfVis-Applikation – Beispiele – Ausblick © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  14. 14. Daten in der Chemie 18000000 16000000 14000000 12000000 10000000 8000000 6000000 4000000 2000000 Merck Katalog Synopsys PG ACX NCI DTP ChemInform Spresi Beilstein CAS ChemCodes 0 © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  15. 15. Multi-variate und multi-dimensionale numerische Datensätze Änderung der Chemischen Synthesetechnologie • Neue Technologien (HTS, kombinatorische Synthese) → Experimente generieren Terabytes an Daten/Jahr • Entwicklung von Datamining- und Visualisierungs-Tools konnte mit dieser Entwicklung nicht Schritt halten • Ernster Engpass in der chemischen Forschung ! → Bedarf an Applikationen zum interaktiven Datamining und zur Informationsvisualisierung sind notwendig © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  16. 16. Visual Data Mining Problem: • Informationsflut • Multidimensionalität • inhärentes Wissen bleibt verborgen • Klassische Data Mining-Ansätze → „Black Box“- und Experten-Systeme Ziel: • Nutzen der natürlichen Fähigkeiten des visuellen Cortex • Interaktives Data Mining (Expertenwissen integrieren) • Intuitiv und daher bedienbar für „Jedermann“ © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  17. 17. Glyph-basierte Informationsvisualisierung • 3 Raumdimensionen • Farbe • Form • Größe • Transparenz • Oberflächeneffekte • Animation • einige 100 Glyphen © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  18. 18. Java/Java3D InfVis Applikation Menü Java3D Render Fenster Tool-Fenster: Dynamische Filter, Detailinformationen, Selektier-Tools) KontrollFenster © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  19. 19. Java/Java3D InfVis Applikation - Render-Fenster 3D Barchart Scatterplot 3D Glyphen © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  20. 20. Java/Java3D InfVis Applikation - Tool-Fenster Dynamische Filter-Tools Selektions-Tools Detailinformationen © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  21. 21. Java/Java3D InfVis Applikation - Menü und Kontroll-Fenster © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  22. 22. ChemCodes Reaktionsdatenbank I • Umsetzungen der 100 wichtigsten FGs ~ 75% der Chemie • 100 Standardreaktionen gleichfalls >75% der Chemie • Grenzen der Standardreaktionen ermitteln • Aufklärung der FG Kompatibilität • Regeln und Vorhersagen zu generieren • Ziel: Umfassende, globale Vermessung des chemischen Reaktivitätsraums © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  23. 23. Beispiel I: Reaktionsoptimierung • Aufgabe: Optimierung einer Reaktion auf > 95% Ausbeute • 7-dimensionaler Raum: Reagenz, Zeit, Lösungsmittel, Temperatur, Stöchiometrie, Reagenzienreihenfolge, FG-Kompatibilität © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  24. 24. Beispiel I: Reaktionsoptimierung © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  25. 25. Beispiel II: Reaktionsplanung H KompatibilitätsKontrolle der funktionellen Gruppen H N H O © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  26. 26. Functional Group Compatibility Browser © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  27. 27. Beispiel II: Reaktionsplanung © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  28. 28. Beispiel III: Leitstruktursuche • Initiiert im April 1990 (modifiziert 1994) • ~ 250.000 Verbindungen • 41.000 mit anti-tumor Screening-Daten • GI50, TGI, LC50 • Zahlreiche DM-Ansätze © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  29. 29. Beispiel III: Leitstruktursuche COMPARE • nur Vergleich von 2 Verbindungen • Ähnlichkeitsvergleich hinsichtlich der biologischen Aktivität • Keine Vergleichsmöglichkeiten mit anderen Verbindungen COMPARE-Applikation des Drug Therapeutic Programs, NCI, NIH © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  30. 30. Beispiel III: Leitstruktursuche © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  31. 31. Beispiel III: Leitstruktur-Suche (Clusterung von Platinverbindungen) © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  32. 32. NCI Screening Data 3D Miner I © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  33. 33. NCI Screening Data 3D Miner II © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  34. 34. Ausblick: Volumen-basierte Informationsvisualisierung Datensätze mit Millionen von Datenpunkten Glyph-basierte Ansätze • produzieren Millionen von geometrischen Primitiven • interaktive Visualisierung nicht möglich Volumen-basierte Ansätze • können eine große Anzahl von Datenpunkten visualisieren • interaktive Visualisierung durch Nutzung von moderner Grafikhardware © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics
  35. 35. Danksagung • Prof. Johann Gasteiger Computer-Chemie-Centrum Universität Erlangen-Nürnberg C 3 • Prof. Thomas Ertl, Dr. Klaus Engel Visualisierung und interaktive Systeme Universität Stuttgart • Dr. Wolf-Dietrich Ihlenfeldt, Dr. Patrick Kiser, Dr. Gary Eichenbaum ChemCodes Inc. • Marc Nicklaus Laboratory of Medicinal Chemistry NCI, NIH • Deutsche Forschungsgemeinschaft © Oellien, Intervet Innovation GmbH 2003 BioChemInformatics

×