Thomas Firley • Dessau, 5. Juni 2008 • Seite 1
Entwicklung einer Suchmaschine für Verbraucher
im Bundesamt für Verbraucher...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 2
Projektziel
Entwicklung einer im Internet jedem Verbraucher zugänglichen
Su...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 3
Projektziel
Grundidee zum Aufbau der Suchmaschine
- Moderierter Katalog der...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 4
Kooperationsprojekt
Projektpartner
• BVL und
• RRZN (Regionales Rechenzentr...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 5
Entwicklung und Betrieb der Suchmaschine „Clewwa“
• BVL
- Projektleitung un...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 6
Technik
Hardware
• 2 Dual Core Server
(Crawler, Beantwortung von Suchanfrag...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 7
Die Suchmaschine „Clewwa“
Allen Interessierten über das Internet frei zugän...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 8
Startseite
Thomas Firley • Dessau, 5. Juni 2008 • Seite 9
Zeitstempel (Datum und Uhrzeit der Eingabe)
Anfragende IP-Adresse (anonymis...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 10
Routineauswertungen:
Sortieren der Suchbegriffe nach Häufigkeit der Eingab...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 11
Auswertung der Logfiles – BVL
Erkennen der Suchmotivation der Nutzer unter...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 12
Erfahrungen
Katalogumfang
• Ca. 2,3 Millionen indizierte Seiten
Zugriffsza...
Thomas Firley • Dessau, 5. Juni 2008 • Seite 13
Danke für Ihre
Aufmerksamkeit!
Nächste SlideShare
Wird geladen in …5
×

Entwicklung von Clewwa.de

147 Aufrufe

Veröffentlicht am

Entwicklung einer im Internet jedem Verbraucher zugänglichen Suchmaschine für die Bereiche Verbraucherschutz und Lebensmittelsicherheit mit folgenden Zielen

Verbesserung der Verbraucherinformation
Besseres Verständnis der Verbraucherwahrnehmung
Informationsgewährung, §5 VIG
Gezielte und regelmäßige Auswertung des Informationsverhaltens der Verbraucher zur
Risikofrüherkennung zur
Verbesserung des Verbraucherschutzes und der Lebensmittelsicherheit
Unabhängigkeit der Suchmaschine

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
147
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
6
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Entwicklung von Clewwa.de

  1. 1. Thomas Firley • Dessau, 5. Juni 2008 • Seite 1 Entwicklung einer Suchmaschine für Verbraucher im Bundesamt für Verbraucherschutz und Lebensmittelsicherheit Dr. Thomas Firley Dr. Soumaya Lhafi Bundesamt für Verbraucherschutz und Lebensmittelsicherheit www.bvl.bund.de
  2. 2. Thomas Firley • Dessau, 5. Juni 2008 • Seite 2 Projektziel Entwicklung einer im Internet jedem Verbraucher zugänglichen Suchmaschine für die Bereiche Verbraucherschutz und Lebensmittelsicherheit mit folgenden Zielen - Verbesserung der Verbraucherinformation - Besseres Verständnis der Verbraucherwahrnehmung - Informationsgewährung, §5 VIG - Gezielte und regelmäßige Auswertung des Informationsverhaltens der Verbraucher zur - Risikofrüherkennung zur - Verbesserung des Verbraucherschutzes und der Lebensmittelsicherheit - Unabhängigkeit der Suchmaschine
  3. 3. Thomas Firley • Dessau, 5. Juni 2008 • Seite 3 Projektziel Grundidee zum Aufbau der Suchmaschine - Moderierter Katalog der zu durchsuchenden Internetseiten - Themen: - Lebensmittel, Kosmetik, Textilien, Tabak, Bedarfsgegenstände, Futtermittel, Pflanzenschutz, Tiergesundheit, Gentechnik, Verbraucherschutz - Auswahlmöglichkeit nach verschiedenen Kategorien - Behörden, wissenschaftliche Einrichtungen, Wirtschaft, Umwelt- und Verbraucherverbände, Medien - Suchergebnisse möglichst aktuell - Gezielte Platzierung auf Verbraucherseiten
  4. 4. Thomas Firley • Dessau, 5. Juni 2008 • Seite 4 Kooperationsprojekt Projektpartner • BVL und • RRZN (Regionales Rechenzentrum für Niedersachsen der Universität Hannover) Projektfinanzierung - Finanziert durch das BVL (Bereitstellung von 78.000 € im ersten Jahr und von 20.000 € in den Folgejahren) Zeitplan - Beginn: Dezember 2007 - Beginn Pilotbetrieb: Januar 2008 - Offizielle Vorstellung: 14. März 2008
  5. 5. Thomas Firley • Dessau, 5. Juni 2008 • Seite 5 Entwicklung und Betrieb der Suchmaschine „Clewwa“ • BVL - Projektleitung und –beratung - Erstellung und Bereitstellung der Web-Site-Listen - Erstellung und Bereitstellung von Synonymlisten (geplant) - Entwicklung der Auswertungsroutinen der Logfiles - Auswertung der Logfiles - Kontakt für Verbraucher und Site-Betreiber • RRZN - Technische Umsetzung (inkl. Programmierung und Betrieb) - Erfassung der Logfiles - Routineauswertungen - Tägliche Übermittlung an das BVL Arbeitsteilung der Projektpartner
  6. 6. Thomas Firley • Dessau, 5. Juni 2008 • Seite 6 Technik Hardware • 2 Dual Core Server (Crawler, Beantwortung von Suchanfragen) Software - Java - Nutch / Lucene Zeitplan - Crawl-Interwall ca. eine Woche - Bei Medien ca. einen Tag
  7. 7. Thomas Firley • Dessau, 5. Juni 2008 • Seite 7 Die Suchmaschine „Clewwa“ Allen Interessierten über das Internet frei zugänglich Aufrufbar über die Internetseite http://www.clewwa.de Beschränkung der Suche auf Internetseiten mit verbraucherrelevanten Inhalten und konsistenten Informationen Quellen aus fünf ausgewählten Bereichen Flexible Vorauswahl von Quellen Suche in Volltexten und Dokumententiteln Kombinationen von Suchbegriffen über Boolesche-Verknüpfungen
  8. 8. Thomas Firley • Dessau, 5. Juni 2008 • Seite 8 Startseite
  9. 9. Thomas Firley • Dessau, 5. Juni 2008 • Seite 9 Zeitstempel (Datum und Uhrzeit der Eingabe) Anfragende IP-Adresse (anonymisiert, Hash-Wert) Suchbegriffe und -kombinationen Ausgewählte Suchbereiche Art der Suche (einfache / erweiterte Suche) Ergebnisse der Suche (Fundstellen) Vom Nutzer aufgerufene Fundstellen in Verbindung mit Suchbegriffen Reihenfolge der Fundstellenaufrufe Ergebnisse der Parallelsuche im Bereich „Medien“ Erfasste Daten – Logfiles
  10. 10. Thomas Firley • Dessau, 5. Juni 2008 • Seite 10 Routineauswertungen: Sortieren der Suchbegriffe nach Häufigkeit der Eingabe Kombination von Suchbegriff, Zeitstempel, IP-Hash und Reihenfolge der Fundstellenaufrufe Eingruppierung der Suchbegriffe anhand der BVL-Synonymlisten Suchbegriffe mit Ergebnissen aus dem Bereich „Medien“ Suchbegriffe ohne Ergebnisse aus dem Bereich „Medien“ Suchbegriffe ohne Ergebnisse Auswertung der Logfiles – RRZN
  11. 11. Thomas Firley • Dessau, 5. Juni 2008 • Seite 11 Auswertung der Logfiles – BVL Erkennen der Suchmotivation der Nutzer unter Berücksichtigung der Schwarmtheorie - Auswertung der Begriffsinhalte und deren Bezug - Vergleich der Suchbegriffe mit der Reihenfolge der Fundstellenaufrufe - Abgleich der Anfragen / Ergebnissen mit in den Medien aufgetretenen Begriffen - Berücksichtigung der Aktualität der Fundstellen - Hinweise durch häufige Suchanfragen oder Anfragen ohne Suchergebnis - Erkennung von Trends im Suchverhalten der Nutzer durch tägliche Erfassung und Auswertung  Risikofrüherkennung
  12. 12. Thomas Firley • Dessau, 5. Juni 2008 • Seite 12 Erfahrungen Katalogumfang • Ca. 2,3 Millionen indizierte Seiten Zugriffszahlen - Gesamt 166 576 Zugriffe (14. März bis 13. Mai) - Zwischen 10 000 und 1000 Zugriffe pro Tag - Durchschnitt 2730 pro Tag Besonderheiten - Dynamische URLs - Robots.txt mit Crawl-Delay - Unerwünschte Seiten - Verärgerte Nutzer - Falsche Erwartungen - Presse
  13. 13. Thomas Firley • Dessau, 5. Juni 2008 • Seite 13 Danke für Ihre Aufmerksamkeit!

×