SlideShare ist ein Scribd-Unternehmen logo
1 von 46
Downloaden Sie, um offline zu lesen
Lebensmittelkontrolle 2.0:
Das AAPVL-Projekt
A. Krewinkel, S. Sünkler, D. Lewandowski,
N. Finck, B. Tolg, L.W. Kroh, J. Fritsche
Onlinehandel mit Lebensmitteln
Was gibt es zu kaufen?
Einführung
Steigerung des jährlichen Online-Umsatzes
auf 20 Milliarden Euro bis 2020
(Prognose von Ernst & Young)
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 2
Rechtlicher Hintergrund
§ 3 Nr. 1 LFGB in Verbindung mit Art. 3 Nr. 8 der Lebensmittel-
Basisverordnung (EG) Nr. 178/2002
„Inverkehrbringen“ bedeutet das Bereithalten von Lebensmitteln für
Verkaufszwecke einschließlich das Anbieten zum Verkauf oder jede
andere Form der Weitergabe, gleichgültig ob unentgeltlich oder nicht,
sowie der Verkauf, der Vertrieb oder andere Formen der Weitergabe
selbst.19
Leitfaden für die Durchführung einzelner Bestimmungen der
Verordnung (EG) Nr. 852/2004 über Lebensmittelhygiene
(SANCO/1731/2008 Rev. 6)
- 3.9. Lebensmittelunternehmen und Internet-Verkäufe
Einige Unternehmen bieten ihre Waren im Internet zum Verkauf an.
Wenngleich diese Art von Handel nicht speziell in der Verordnung
aufgeführt ist, fallen die betreffenden Unternehmen unter die Definition
des „Lebensmittelunternehmens“ und unterliegen den einschlägigen
Vorschriften des Lebensmittelrechts.
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 3
Entwicklung von automatisierten Analyseverfahren
zur Identifizierung und Bewertung von nicht
verkehrsfähigen Produkten des virtuellen
Lebensmittelmarktes
• finanziert durch BMEL mit ca. 500.000 € (3 Jahre)
• Projektträgerschaft durch die Bundesanstalt für
Landwirtschaft und Ernährung (BLE) im Rahmen des
Programms zur Innovationsförderung
• Projektstart: 15.02.2013
• Projektende: 14.02.2016
Kontrolle des Online-Lebensmittel-
handels in Deutschland
AAPVL
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 4
Interdisziplinäres Forschungsprojekt
• Department Information: Websuche
Prof. Dr. Dirk Lewandowski, Sebastian Sünkler
• Department Medizintechnik: Text- und Bildanalyse
Prof. Dr. Boris Tolg, Niklas Finck
• Department Ökotrophologie/ Food Science: Applikation & Bewertung
Prof. Dr. Jan Fritsche, Alexandra Krewinkel
• Bundesamt für Verbraucherschutz und Lebensmittelsicherheit
Dr. Georg Schreiber, G@ZIELT
Das Projekt
AAPVL
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 5
Das Projekt
AAPVL
Ziele des Projekts
Automatisierte Produktkontrolle
Entwicklung eines Systems zur automatischen Identifizierung von potentiell
nicht-konformen Lebensmitteln (inklusive Händlerinformationen) und deren
sachkundige Bewertung:
• Optimierung der Relevanz der Suchmaschinentreffer
• Integration von Text-, Logo- und Bilderkennungsverfahren zur
erweiterten Identifizierung nicht konformer Lebensmittel unter
besonderer Berücksichtigung von spezielle Auslobungen und
Kenntlichmachungen
• Entwicklung einer Monitoring-Komponente zur regelmäßigen
automatisierten und risikoorientierten Abfrage definierter Lebensmittel,
Inhaltsstoffe oder Händler
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 6
Entwicklung der prototypischen Software
• Automatisierte Umsetzung der Abläufe der Produktrecherche
– Auftragsrecherchen
• Automatisierte Produktbewertung
– nicht zugelassene Inhaltsstoffe (z.B. pharmakologisch aktive
Substanzen)
– Health Claims
– Logo- und Siegelmissbrauch
• kontinuierliche Überwachung von Anbietern und Produkten in einem
steuerbaren Monitoring über Risikoprofile
Das Projekt AAPVL
Operative Umsetzung
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 7
Komponenten der Software
Anwender
GUI
Suchmaschinen
Bild-
erkennung
Crawler
MySQL-
Datenbank-
server
Textanalyse
WWW
Scraper
Datenserver
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 8
Pilotstudie
Hintergrund und Zielsetzung
• Zusammenarbeit mit dem Bayerischen Landesamt für
Gesundheit und Lebensmittelsicherheit
• Ermittlung aller Internetangebote von Produkten die zwei spezifische
pharmakologisch aktive Substanzen enthalten (Alkaloide)
• Substanzen stehen im Verdacht in Kombination
gesundheitsschädlich zu sein
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 9
Hintergrund und Zielsetzung
• Suchmaschinensuche in google.de und bing.de
• Verwendung von 11 spezifischen Suchanfragen
• Relevanzbeurteilung der Suchmaschineergebnisse anhand der
Produktangebote im gesamten Shop
• Ermittlung der Händlerinformationen
Pilotstudie
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 10
Recherchetool
Datenerfassung
Dublettenfilterung
und Abgleich der
Negativliste
Recherch
eauftrag Anwender
GUI
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 11
Auswertung Suchmaschinensuche
4493
4190
8683
1360
2282
3248
507 912
1242
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
Google.de Bing.de Gesamt
Anzahl
Suchergebnisse von 11 Suchanfragen
Suchergebnisse Suchergebnisse ohne Dubletten Relevante Suchergebnisse
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 12
Recherchetool
Datenerfassung
Dublettenfilterung
und Abgleich der
Negativliste
Shopidentifikation
Lebensmittel-
shopidentifikation
Recherch
eauftrag Anwender
GUI
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 13
Auswertung der Recherche
0.0
10.0
20.0
30.0
40.0
50.0
60.0
Relevante
Suchergebnisse
Irrelevanter
Suchergebnisse
Unklares
Suchergebnis
Nicht
deutschsprachiges
Ergebnis
26.6
56.8
0.6 0.2
11.8
4.0
Prozent
der
Ergebnisse
Kategorie
Prozentuale Verteilung der Suchergebnisse von Google und Bing
(ohne Dubletten)
Treffer Drittland
Treffer EU
Treffer aus Deutschland n = 2935
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 14
Auswertung der Recherche
303
36
410
177
126 28
587
0
100
200
300
400
500
600
700
Anzahl
Kategorie
Verteilung der irrelevanten Suchergebnisse
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 15
Recherchetool
Datenerfassung
Dublettenfilterung
und Abgleich der
Negativliste
Shopidentifikation
Lebensmittel-
shopidentifikation
Produktseiten-
identifikation
Verstoßanalyse
Recherch
eauftrag Anwender
GUI
Verdachts-
analyse
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 16
Auswertung der Recherche
0.0
10.0
20.0
30.0
40.0
50.0
60.0
Relevante
Suchergebnisse
Irrelevanter
Suchergebnisse
Unklares
Suchergebnis
Nicht
deutschsprachiges
Ergebnis
26.6
56.8
0.6 0.2
11.8
4.0
Prozent
der
Ergebnisse
Kategorie
Prozentuale Verteilung der Suchergebnisse von Google und Bing
(ohne Dubletten)
Treffer Drittland
Treffer EU
Treffer aus Deutschland n = 2935
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 17
Recherchetool
Datenerfassung
Dublettenfilterung
und Abgleich der
Negativliste
Shopidentifikation
Lebensmittel-
shopidentifikation
Produktseiten-
identifikation
Verstoßanalyse
Impressums-
erkennung
Recherch
eauftrag Anwender
GUI
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 18
Verdachts-
analyse
Auswertung der Recherche
303
36
410
177
126 28
587
0
100
200
300
400
500
600
700
Anzahl
Kategorie
Verteilung der irrelevanten Suchergebnisse
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 19
Auswertung der Recherche
137
73 63
6 13 33 35 17
56
153
46
15 25 45 12
52
0
20
40
60
80
100
120
140
160
180
Anzahl
der
Ergebnisse
Bundesland
Geographische Verteilung der relevanten Produktangebote
innerhalb Deutschlands
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 20
Recherchetool
Datenerfassung
Dublettenfilterung
und Abgleich der
Negativliste
Shopidentifikation
Lebensmittel-
shopidentifikation
Produktseiten-
identifikation
Verstoßanalyse
Impressums-
erkennung
Ausgabe von
Abschlussberichten
Recherch
eauftrag Anwender
Manuelle Bewertung
Weiterverarbeitung,
juristische Prüfung
und ggf.
behördliche
Maßnahmen
GUI
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 21
Verdachts-
analyse
Ergebnisse
• Relevante Suchergebnisse 1242 verdächtige Produktangebote
• Verteilt auf 219 Produkte
• Verteilt auf 440 unterschiedliche Händler
Pilotstudie
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 22
23
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp
Technische Anforderungen
• Aufteilung der Software in Module zwecks vereinfachter Wartung und
Erweiterung (z. B. Trennung zwischen Grafischer Benutzerschnittstelle und
Analyse Applikationen)Verwendung von 11 spezifischen Suchanfragen
• Zentraler Zugriff auf die Anwendung (Web-Anwendung)
• Zentrale Kommunikationsschnittstelle (Datenbank)
• Verarbeitung unstrukturierter Daten (Webseiten) und Bilder aus dem World
Wide Web (Speicherung, Analyse, Export)
• Parallele Verarbeitung rechenintensiver Analyseprozesse (Performance)
Realisierung der Anforderungen
• Nutzung standardisierter Entwurfsmuster für die Entwicklung von
Teilkomponenten der Software
• Drei-Schichten-Architektur für den gesamten Prototyp
• Rechencluster zur Umsetzung eines verteilten Systems
24
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Anforderungen
Software-Prototyp:
Architektur
25
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Technologien:
• MySQL: Relationales Datenbankmanagementsystem
• HTML: Quelltext für die Strukturierung von Webseiten
• XLSX: Microsoft Office Excel-Format
• JPG, PNG, GIF: BildformateVerarbeitung unstrukturierter Daten
(Webseiten) und Bilder aus dem World
26
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Data Tier (Datenhaltung)
Technologien (Datenanalye)
• C#: Objektorientierte Programmiersprache mit Komponenten für die
Realisierung von verteilten Prozessen
• RegEx: Zeichenketten zur Beschreibung des Aufbaus von Text-
Mengen (Pattern Matching)
• OpenCV: Programmbibliothek zur Bildverarbeitung (Extraktion von
Texten in Bildern, Musterkennung in Bildern)
27
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Application Tier
Technologien (Datenerfassung)
• Apache: Standard Webserver mit hoher Verbreitung mit MySQL und PHP-
Unterstützung
• cURL: Anwendung zur Simulierung von HTTP-Clients für den Aufruf und die
Speicherung von Webseiten
• XPath: XML Path Language zur Extraktion von Inhalten aus XML-Dateien
und HTML-Dateien
28
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
ClientTier (Benutzerschnittstelle)
Technologien
• HTML & CSS: De-facto-Standard für Layout und Design von Webseiten
• JavaScript: Nutzung von jQuery (Programmbibliothek zur vereinfachten
Implementierung von asynchronen Prozessen und Echtzeit Manipulation
von Webseiten)
• PHP: weit verbreitete Programmiersprache zur Entwicklung von Web-
Anwendungen
• PHPExcel: Programmbibliothek zur Erstellung von Excel-Tabellen z. B. aus
Datensätzen in Datenbanken
29
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp
30
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Datenerfassung
Dublettenfilterung
und Abgleich der
Negativliste
Recherch
eauftrag Anwender
GUI
Technischer Ablauf
1. curl https://www.google.de/q=synephrin&start=1 (Erfassen der
Google Suchergebnisseiten)
2. xpath->evaluate(//h[@class='r']/a]) (Extraktion der Links aus den
Suchtreffern)
3. Abgleich der Links mit einer Negativliste zur Filterung nicht gewollter
Webseiten
4. Speichern der Metadaten der URLs in der Datenbank
5. curl http://miramix.com/product-tag/synephrin/ (Speichern aller
extrahierten URLs in HTML)
Software-Prototyp:
Software Frontend
31
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Shopidentifikation
Lebensmittel-
shopidentifikation
Wissensbasis
• 6500 Internetseiten geclustert nach Kategorien
(Shops, Lebensmittelshops, Informationseiten)
• Quellen für die Seiten sind u. a.:
• Ergebnisse zuvor durchgeführter
Teststudien (manuelle Klassifikation von
Internetseiten)
• dmoz.de (Webverzeichnis)
• eTrustedShops (Zertifizierungsstelle für
Online-Shops)
• preis.de (Preisvergleichsportal)
Software-Prototyp:
Software Backend
32
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Shopidentifikation
Lebensmittel-
shopidentifikation
Technischer Ablauf
1. Wörter werden abhängig von dem Kontext in dem
sie in die Webseite eingebettet sind gespeichert,
z.B.
- <script>wörter</script> als script::wörter
- <title>text</title> als title::text
- <a ...>link</a> als a::link
- <tag atribut=value> als tag::atribut::value
2. Bewertung der Wörter nach Relevanz(anhand
der Wissensbasis)
Relevanz:
- Wahrscheinlichkeit p
- Häufigkeit h
- e := p * log(h)
3. Bewertung der Seiten anhand der
aussagekräftigsten Wörter und Ausgabe einer
"Sicherheit"
Software-Prototyp:
Software Backend
33
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Shopidentifikation
Lebensmittel-
shopidentifikation
Beispiele
• script::payment 673/674 (e:0.9541)
• warenkorb 1074/1077 (e:0.9540)
• script::trustedshops com 638/639v(e:0.9514)
• form::act.::int::arg.::advanced search 561/562
(e:0.9461)
• a::int::arg.::checkout 517/518 (e:0.94062)
• meta::cont.::onlineshop 463/464 (e:0.9353)
• mwst zzgl 428/429 e:0.9298)
• widerrufsrecht 600/603 (e:0.922949517879176)
Software-Prototyp:
Software Backend
34
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Technischer Ablauf
1. curl http://miramix.com/product-tag/synephrin/ (Aufruf der gespeicherten
URLs)
2. xpath->evaluate(//a) (Extraktion der Links und Linktexte auf der
Webseite)
3. Abgleich der extrahierten Inhalte mit Positivliste (gewichtete
Suchterme)
4. curl http://miramix.com/impressum
5. Auslesen der Daten mit Regulären Ausdrücken angelehnt an DIN 5008
Software-Prototyp:
Software Backend
35
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Regulärer Ausdruck
(?<PLZ>d{5})(?:s+)
(?<Ort>
(?:
(?:
(?:Hansest(?:adt|.)|Bad|Berg(?:isch|.)|Alt|Neu|Gro(?:ß|ss)|Klein|Insel|
Hohe|Ober|Unter|Sankt|Schw(?:ä|ae)b(?:.|isch)?|St.?|Skt.?|
Kloster|Kurort|Markt)?[^S]*
(?:(?:[A-ZÄäÖöÜüß]){2,30}(?:–|-)(?:[A-ZÄäÖöÜüß]){1,30}|(?:(?!bad)(?:[A-
ZÄäÖöÜüß]){2,30}))
)|
(?:(?:(?:[A-ZÄäÖöÜüß]){1,30}[^S]{0,8}(?:–|-)[^S]{0,8}){0,4}
(?:[A-ZÄäÖöÜüß]){2,30}
)
)
(?:(?:[^S]+(?:am|a.|bei|im|i.|in|ot|uf)[^S]+(?:[A-ZÄäÖöÜüß]){2,30})?
(?:[^S]+
(?:(?:an|a.|i(?:.|n|m)|uf|ant)[^S]*(?:der|d.))[^S]+
(?:(?:[A-ZÄäÖöÜüß]){2,30}|(?:[A-ZÄäÖöÜüß]){1,5}.)|
(?:[a-z]{1,2}.(?:[a-z].?)?)
)?
)?
)
Software-Prototyp:
Software Backend
36
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Software Backend
Technischer Ablauf
1. Anfrage an die Datenbank für die Zusammenstellung von
Abschlussberichten (MySQL Statements)
2. Speicherung der Werte in Arrays
3. Aufteilung der Ergebnistabellen nach Bundesländern
4. Nutzung von Funktionen in PHPExcel für Erstellung der Excel-Tabellen
5. Benachrichtigung über Fertistellung des Berichts per E-Mail
37
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Manuelle Bewertung
GUI
Technischer Ablauf
1. Zusammenstellung der nachzubewertenden Webseiten
nach definierten Auswahlkriterien aus der Datenbank
2. Darstellung der Webseiten im Browser mit Formularen
Software-Prototyp:
Manuelle Bewertung
Pilotstudie
Demo-Beispiel
Ziel:
• Identifikation von möglichst Bio-Lebensmittelshops
• Testlauf der bisher umgesetzten Module des Prototypen
Datenerfassung
Dublettenfilterung
und Abgleich der
Negativliste
Shopidentifikation
Lebensmittel-
shopidentifikation
Impressums-
erkennung
Dubletten-
filterung
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 38
Pilotstudie
Demo-Beispiel
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 39
Ausblick
WHAT IS NEXT?
40
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Fallbeispiel Europäisches Biologo
41
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Logoerkennung
42
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Logoerkennung
Ausgangslage
• Keine gesetzliche Norm bezüglich des Logos und seiner Verwendung im Internet
• Logos im Internet unterscheiden sich durch u. a. durch:
• Hohe Farbvarianz
• "Falsche" Seitenverhältnisse
• Zugeschnittene Logos
• Sehr kleine Logos
• Verdeckte Logos
• Auf der "offiziellen" Seite des Bio-Logos werden alleine drei verschiedene
Farbwerte verwendet
Bisherige Umsetzung
• Fokus auf “grünes” Bio Logo der EU
• Bild-Segmentierung:
• Reduktion auf Farbbereich des Logos
• Reduktion der gefundenen Bereiche (Kleine Bereiche
verschwinden)
• Zusammenhängende Bereiche einzeln verarbeiten
• Zu kleine Bereiche verwerfen
• Anteil heller Teile (potentielle Sterne) muss Mindestmaß
überschreiten
43
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Logoerkennung
44
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Logoerkennung
Bisherige Umsetzung
Fazit und Ausblick
• Das AAPVL Projekt hat die technologischen Grundlagen für die
Entwicklung eines automatisierten Analyseverfahrens für die
Lebensmittelkontrolle im Internet geschaffen.
• Das APPVL Konzept liefert einen effektiven Beitrag, um auf
effizienter Weise, die hohe Lebensmittelsicherheit im Onlinehandel
zu gewährleisten.
• Anhand einer Fallstudie konnte die Praxistauglichkeit des APPVL
Konzept für die Lebensmittelkontrolle im Internet gezeigt werden.
• Weitere Fallbeispiele und Optimierung des APPVL Konzepts folgen
(z.B. Weiterentwicklung der Reduktionsstufen).
45
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Danke für die Aufmerksamkeit
46
Food Science Dialog 2015: Lebensmittelkontrolle 2.0

Weitere ähnliche Inhalte

Ähnlich wie Lebensmittelkontrolle 2.0: Das AAPVL Projekt

Automatisiertes webauftritt testen
Automatisiertes webauftritt testenAutomatisiertes webauftritt testen
Automatisiertes webauftritt testenmradamlacey
 
Google Analytics & Seo @seosixt wiesn 2014
Google Analytics & Seo @seosixt wiesn 2014Google Analytics & Seo @seosixt wiesn 2014
Google Analytics & Seo @seosixt wiesn 2014121WATT GmbH
 
Connected Products: Die vier Stufen der intelligenten Vernetzung
Connected Products: Die vier Stufen der intelligenten VernetzungConnected Products: Die vier Stufen der intelligenten Vernetzung
Connected Products: Die vier Stufen der intelligenten VernetzungTWT
 
Interall Media Conference 2014
Interall Media Conference 2014 Interall Media Conference 2014
Interall Media Conference 2014 Company Spotlight
 
Studie: Wie Google Unternehmensumsätze steigert
Studie: Wie Google Unternehmensumsätze steigertStudie: Wie Google Unternehmensumsätze steigert
Studie: Wie Google Unternehmensumsätze steigertTWT
 
Anmeldeverfahren für stromverbrauchende Produkte
Anmeldeverfahren für stromverbrauchende ProdukteAnmeldeverfahren für stromverbrauchende Produkte
Anmeldeverfahren für stromverbrauchende ProdukteOeko-Institut
 
Plm med dev-white-paper (deutsch)
Plm med dev-white-paper (deutsch)Plm med dev-white-paper (deutsch)
Plm med dev-white-paper (deutsch)Ralf Kittel
 
Mumenthaler innovationsmanagement agmb
Mumenthaler innovationsmanagement agmbMumenthaler innovationsmanagement agmb
Mumenthaler innovationsmanagement agmbRudolf Mumenthaler
 
Wearables, Smartphones & Co. im Unternehmenseinsatz
Wearables, Smartphones & Co. im UnternehmenseinsatzWearables, Smartphones & Co. im Unternehmenseinsatz
Wearables, Smartphones & Co. im UnternehmenseinsatzChristian Sauter
 
Medizinprodukte-Software: Ist QM-System notwendig?
Medizinprodukte-Software: Ist QM-System notwendig?Medizinprodukte-Software: Ist QM-System notwendig?
Medizinprodukte-Software: Ist QM-System notwendig?Christian Johner
 
Konformitätsbewertung: In 7 Schritten zum CE-Zeichen für Ihr Medizinprodukt
Konformitätsbewertung: In 7 Schritten zum CE-Zeichen für Ihr MedizinproduktKonformitätsbewertung: In 7 Schritten zum CE-Zeichen für Ihr Medizinprodukt
Konformitätsbewertung: In 7 Schritten zum CE-Zeichen für Ihr MedizinproduktChristian Johner
 
Modul 5: Die 5 Phasen der NPD (New Product Development
Modul 5: Die 5 Phasen der NPD (New Product DevelopmentModul 5: Die 5 Phasen der NPD (New Product Development
Modul 5: Die 5 Phasen der NPD (New Product Developmentcaniceconsulting
 
result App-Forschung
result App-Forschungresult App-Forschung
result App-Forschungresult gmbh
 
Web Analytics: Google Analytics dominiert, Schweiz hat Nachholbedarf
Web Analytics: Google Analytics dominiert, Schweiz hat NachholbedarfWeb Analytics: Google Analytics dominiert, Schweiz hat Nachholbedarf
Web Analytics: Google Analytics dominiert, Schweiz hat NachholbedarfYourposition AG
 
Webinar Dashboards und Datenvisualisierung
Webinar Dashboards und DatenvisualisierungWebinar Dashboards und Datenvisualisierung
Webinar Dashboards und DatenvisualisierungEduvision Ausbildungen
 
Wir Helfen Ihnen Bei Der Erstellung Der Produkte Die Ihnen Ein Gesunder ROI B...
Wir Helfen Ihnen Bei Der Erstellung Der Produkte Die Ihnen Ein Gesunder ROI B...Wir Helfen Ihnen Bei Der Erstellung Der Produkte Die Ihnen Ein Gesunder ROI B...
Wir Helfen Ihnen Bei Der Erstellung Der Produkte Die Ihnen Ein Gesunder ROI B...Bradley Pallister
 
SeHF 2015 | Die elektronische Gesundheitsakte ELGA in Österreich - ein Praxis...
SeHF 2015 | Die elektronische Gesundheitsakte ELGA in Österreich - ein Praxis...SeHF 2015 | Die elektronische Gesundheitsakte ELGA in Österreich - ein Praxis...
SeHF 2015 | Die elektronische Gesundheitsakte ELGA in Österreich - ein Praxis...Swiss eHealth Forum
 
PLM Open Hours - Best Practices in der Produkstrukturierung
PLM Open Hours - Best Practices in der ProdukstrukturierungPLM Open Hours - Best Practices in der Produkstrukturierung
PLM Open Hours - Best Practices in der ProdukstrukturierungIntelliact AG
 
SeHF 2015 | Drei konkrete Praxisprojekte aus dem CAS eHealth - Gesundheit dig...
SeHF 2015 | Drei konkrete Praxisprojekte aus dem CAS eHealth - Gesundheit dig...SeHF 2015 | Drei konkrete Praxisprojekte aus dem CAS eHealth - Gesundheit dig...
SeHF 2015 | Drei konkrete Praxisprojekte aus dem CAS eHealth - Gesundheit dig...Swiss eHealth Forum
 
Einführung Open Source ERP Systeme
Einführung Open Source ERP SystemeEinführung Open Source ERP Systeme
Einführung Open Source ERP SystemeMatthias Stürmer
 

Ähnlich wie Lebensmittelkontrolle 2.0: Das AAPVL Projekt (20)

Automatisiertes webauftritt testen
Automatisiertes webauftritt testenAutomatisiertes webauftritt testen
Automatisiertes webauftritt testen
 
Google Analytics & Seo @seosixt wiesn 2014
Google Analytics & Seo @seosixt wiesn 2014Google Analytics & Seo @seosixt wiesn 2014
Google Analytics & Seo @seosixt wiesn 2014
 
Connected Products: Die vier Stufen der intelligenten Vernetzung
Connected Products: Die vier Stufen der intelligenten VernetzungConnected Products: Die vier Stufen der intelligenten Vernetzung
Connected Products: Die vier Stufen der intelligenten Vernetzung
 
Interall Media Conference 2014
Interall Media Conference 2014 Interall Media Conference 2014
Interall Media Conference 2014
 
Studie: Wie Google Unternehmensumsätze steigert
Studie: Wie Google Unternehmensumsätze steigertStudie: Wie Google Unternehmensumsätze steigert
Studie: Wie Google Unternehmensumsätze steigert
 
Anmeldeverfahren für stromverbrauchende Produkte
Anmeldeverfahren für stromverbrauchende ProdukteAnmeldeverfahren für stromverbrauchende Produkte
Anmeldeverfahren für stromverbrauchende Produkte
 
Plm med dev-white-paper (deutsch)
Plm med dev-white-paper (deutsch)Plm med dev-white-paper (deutsch)
Plm med dev-white-paper (deutsch)
 
Mumenthaler innovationsmanagement agmb
Mumenthaler innovationsmanagement agmbMumenthaler innovationsmanagement agmb
Mumenthaler innovationsmanagement agmb
 
Wearables, Smartphones & Co. im Unternehmenseinsatz
Wearables, Smartphones & Co. im UnternehmenseinsatzWearables, Smartphones & Co. im Unternehmenseinsatz
Wearables, Smartphones & Co. im Unternehmenseinsatz
 
Medizinprodukte-Software: Ist QM-System notwendig?
Medizinprodukte-Software: Ist QM-System notwendig?Medizinprodukte-Software: Ist QM-System notwendig?
Medizinprodukte-Software: Ist QM-System notwendig?
 
Konformitätsbewertung: In 7 Schritten zum CE-Zeichen für Ihr Medizinprodukt
Konformitätsbewertung: In 7 Schritten zum CE-Zeichen für Ihr MedizinproduktKonformitätsbewertung: In 7 Schritten zum CE-Zeichen für Ihr Medizinprodukt
Konformitätsbewertung: In 7 Schritten zum CE-Zeichen für Ihr Medizinprodukt
 
Modul 5: Die 5 Phasen der NPD (New Product Development
Modul 5: Die 5 Phasen der NPD (New Product DevelopmentModul 5: Die 5 Phasen der NPD (New Product Development
Modul 5: Die 5 Phasen der NPD (New Product Development
 
result App-Forschung
result App-Forschungresult App-Forschung
result App-Forschung
 
Web Analytics: Google Analytics dominiert, Schweiz hat Nachholbedarf
Web Analytics: Google Analytics dominiert, Schweiz hat NachholbedarfWeb Analytics: Google Analytics dominiert, Schweiz hat Nachholbedarf
Web Analytics: Google Analytics dominiert, Schweiz hat Nachholbedarf
 
Webinar Dashboards und Datenvisualisierung
Webinar Dashboards und DatenvisualisierungWebinar Dashboards und Datenvisualisierung
Webinar Dashboards und Datenvisualisierung
 
Wir Helfen Ihnen Bei Der Erstellung Der Produkte Die Ihnen Ein Gesunder ROI B...
Wir Helfen Ihnen Bei Der Erstellung Der Produkte Die Ihnen Ein Gesunder ROI B...Wir Helfen Ihnen Bei Der Erstellung Der Produkte Die Ihnen Ein Gesunder ROI B...
Wir Helfen Ihnen Bei Der Erstellung Der Produkte Die Ihnen Ein Gesunder ROI B...
 
SeHF 2015 | Die elektronische Gesundheitsakte ELGA in Österreich - ein Praxis...
SeHF 2015 | Die elektronische Gesundheitsakte ELGA in Österreich - ein Praxis...SeHF 2015 | Die elektronische Gesundheitsakte ELGA in Österreich - ein Praxis...
SeHF 2015 | Die elektronische Gesundheitsakte ELGA in Österreich - ein Praxis...
 
PLM Open Hours - Best Practices in der Produkstrukturierung
PLM Open Hours - Best Practices in der ProdukstrukturierungPLM Open Hours - Best Practices in der Produkstrukturierung
PLM Open Hours - Best Practices in der Produkstrukturierung
 
SeHF 2015 | Drei konkrete Praxisprojekte aus dem CAS eHealth - Gesundheit dig...
SeHF 2015 | Drei konkrete Praxisprojekte aus dem CAS eHealth - Gesundheit dig...SeHF 2015 | Drei konkrete Praxisprojekte aus dem CAS eHealth - Gesundheit dig...
SeHF 2015 | Drei konkrete Praxisprojekte aus dem CAS eHealth - Gesundheit dig...
 
Einführung Open Source ERP Systeme
Einführung Open Source ERP SystemeEinführung Open Source ERP Systeme
Einführung Open Source ERP Systeme
 

Mehr von Hamburg University of Applied Sciences (HAW)

Mehr von Hamburg University of Applied Sciences (HAW) (13)

Der Einfluss der Suchmaschinenoptimierung auf die Ergebnisse von Google: Ein ...
Der Einfluss der Suchmaschinenoptimierung auf die Ergebnisse von Google: Ein ...Der Einfluss der Suchmaschinenoptimierung auf die Ergebnisse von Google: Ein ...
Der Einfluss der Suchmaschinenoptimierung auf die Ergebnisse von Google: Ein ...
 
Entwicklungen und Anwendungsbereiche von digitalen Assistenten mit Sprachsuche
Entwicklungen und Anwendungsbereiche von digitalen Assistenten mit SprachsucheEntwicklungen und Anwendungsbereiche von digitalen Assistenten mit Sprachsuche
Entwicklungen und Anwendungsbereiche von digitalen Assistenten mit Sprachsuche
 
Die Relevanz von sprachgesteuerter Suche für den Onlinehandel
Die Relevanz von sprachgesteuerter Suche für den OnlinehandelDie Relevanz von sprachgesteuerter Suche für den Onlinehandel
Die Relevanz von sprachgesteuerter Suche für den Onlinehandel
 
The influence of search engine optimization on Google's results: A multi-dime...
The influence of search engine optimization on Google's results: A multi-dime...The influence of search engine optimization on Google's results: A multi-dime...
The influence of search engine optimization on Google's results: A multi-dime...
 
Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur A...
Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur A...Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur A...
Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur A...
 
Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisi...
Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisi...Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisi...
Den Einfluss der Suchmaschinenoptimierung messbar machen: Ein halb-automatisi...
 
Ok Google... The end of search as we know it
Ok Google... The end of search as we know itOk Google... The end of search as we know it
Ok Google... The end of search as we know it
 
THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...
THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...
THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...
 
WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...
WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...
WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...
 
World Usability Day Hamburg 2015: Workshop Voice Search
World Usability Day Hamburg 2015: Workshop Voice SearchWorld Usability Day Hamburg 2015: Workshop Voice Search
World Usability Day Hamburg 2015: Workshop Voice Search
 
Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...
Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...
Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...
 
Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...
Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...
Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...
 
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
 

Lebensmittelkontrolle 2.0: Das AAPVL Projekt

  • 1. Lebensmittelkontrolle 2.0: Das AAPVL-Projekt A. Krewinkel, S. Sünkler, D. Lewandowski, N. Finck, B. Tolg, L.W. Kroh, J. Fritsche
  • 2. Onlinehandel mit Lebensmitteln Was gibt es zu kaufen? Einführung Steigerung des jährlichen Online-Umsatzes auf 20 Milliarden Euro bis 2020 (Prognose von Ernst & Young) Food Science Dialog 2015: Lebensmittelkontrolle 2.0 2
  • 3. Rechtlicher Hintergrund § 3 Nr. 1 LFGB in Verbindung mit Art. 3 Nr. 8 der Lebensmittel- Basisverordnung (EG) Nr. 178/2002 „Inverkehrbringen“ bedeutet das Bereithalten von Lebensmitteln für Verkaufszwecke einschließlich das Anbieten zum Verkauf oder jede andere Form der Weitergabe, gleichgültig ob unentgeltlich oder nicht, sowie der Verkauf, der Vertrieb oder andere Formen der Weitergabe selbst.19 Leitfaden für die Durchführung einzelner Bestimmungen der Verordnung (EG) Nr. 852/2004 über Lebensmittelhygiene (SANCO/1731/2008 Rev. 6) - 3.9. Lebensmittelunternehmen und Internet-Verkäufe Einige Unternehmen bieten ihre Waren im Internet zum Verkauf an. Wenngleich diese Art von Handel nicht speziell in der Verordnung aufgeführt ist, fallen die betreffenden Unternehmen unter die Definition des „Lebensmittelunternehmens“ und unterliegen den einschlägigen Vorschriften des Lebensmittelrechts. Food Science Dialog 2015: Lebensmittelkontrolle 2.0 3
  • 4. Entwicklung von automatisierten Analyseverfahren zur Identifizierung und Bewertung von nicht verkehrsfähigen Produkten des virtuellen Lebensmittelmarktes • finanziert durch BMEL mit ca. 500.000 € (3 Jahre) • Projektträgerschaft durch die Bundesanstalt für Landwirtschaft und Ernährung (BLE) im Rahmen des Programms zur Innovationsförderung • Projektstart: 15.02.2013 • Projektende: 14.02.2016 Kontrolle des Online-Lebensmittel- handels in Deutschland AAPVL Food Science Dialog 2015: Lebensmittelkontrolle 2.0 4
  • 5. Interdisziplinäres Forschungsprojekt • Department Information: Websuche Prof. Dr. Dirk Lewandowski, Sebastian Sünkler • Department Medizintechnik: Text- und Bildanalyse Prof. Dr. Boris Tolg, Niklas Finck • Department Ökotrophologie/ Food Science: Applikation & Bewertung Prof. Dr. Jan Fritsche, Alexandra Krewinkel • Bundesamt für Verbraucherschutz und Lebensmittelsicherheit Dr. Georg Schreiber, G@ZIELT Das Projekt AAPVL Food Science Dialog 2015: Lebensmittelkontrolle 2.0 5
  • 6. Das Projekt AAPVL Ziele des Projekts Automatisierte Produktkontrolle Entwicklung eines Systems zur automatischen Identifizierung von potentiell nicht-konformen Lebensmitteln (inklusive Händlerinformationen) und deren sachkundige Bewertung: • Optimierung der Relevanz der Suchmaschinentreffer • Integration von Text-, Logo- und Bilderkennungsverfahren zur erweiterten Identifizierung nicht konformer Lebensmittel unter besonderer Berücksichtigung von spezielle Auslobungen und Kenntlichmachungen • Entwicklung einer Monitoring-Komponente zur regelmäßigen automatisierten und risikoorientierten Abfrage definierter Lebensmittel, Inhaltsstoffe oder Händler Food Science Dialog 2015: Lebensmittelkontrolle 2.0 6
  • 7. Entwicklung der prototypischen Software • Automatisierte Umsetzung der Abläufe der Produktrecherche – Auftragsrecherchen • Automatisierte Produktbewertung – nicht zugelassene Inhaltsstoffe (z.B. pharmakologisch aktive Substanzen) – Health Claims – Logo- und Siegelmissbrauch • kontinuierliche Überwachung von Anbietern und Produkten in einem steuerbaren Monitoring über Risikoprofile Das Projekt AAPVL Operative Umsetzung Food Science Dialog 2015: Lebensmittelkontrolle 2.0 7
  • 9. Pilotstudie Hintergrund und Zielsetzung • Zusammenarbeit mit dem Bayerischen Landesamt für Gesundheit und Lebensmittelsicherheit • Ermittlung aller Internetangebote von Produkten die zwei spezifische pharmakologisch aktive Substanzen enthalten (Alkaloide) • Substanzen stehen im Verdacht in Kombination gesundheitsschädlich zu sein Food Science Dialog 2015: Lebensmittelkontrolle 2.0 9
  • 10. Hintergrund und Zielsetzung • Suchmaschinensuche in google.de und bing.de • Verwendung von 11 spezifischen Suchanfragen • Relevanzbeurteilung der Suchmaschineergebnisse anhand der Produktangebote im gesamten Shop • Ermittlung der Händlerinformationen Pilotstudie Food Science Dialog 2015: Lebensmittelkontrolle 2.0 10
  • 11. Recherchetool Datenerfassung Dublettenfilterung und Abgleich der Negativliste Recherch eauftrag Anwender GUI Food Science Dialog 2015: Lebensmittelkontrolle 2.0 11
  • 12. Auswertung Suchmaschinensuche 4493 4190 8683 1360 2282 3248 507 912 1242 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Google.de Bing.de Gesamt Anzahl Suchergebnisse von 11 Suchanfragen Suchergebnisse Suchergebnisse ohne Dubletten Relevante Suchergebnisse Food Science Dialog 2015: Lebensmittelkontrolle 2.0 12
  • 14. Auswertung der Recherche 0.0 10.0 20.0 30.0 40.0 50.0 60.0 Relevante Suchergebnisse Irrelevanter Suchergebnisse Unklares Suchergebnis Nicht deutschsprachiges Ergebnis 26.6 56.8 0.6 0.2 11.8 4.0 Prozent der Ergebnisse Kategorie Prozentuale Verteilung der Suchergebnisse von Google und Bing (ohne Dubletten) Treffer Drittland Treffer EU Treffer aus Deutschland n = 2935 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 14
  • 15. Auswertung der Recherche 303 36 410 177 126 28 587 0 100 200 300 400 500 600 700 Anzahl Kategorie Verteilung der irrelevanten Suchergebnisse Food Science Dialog 2015: Lebensmittelkontrolle 2.0 15
  • 17. Auswertung der Recherche 0.0 10.0 20.0 30.0 40.0 50.0 60.0 Relevante Suchergebnisse Irrelevanter Suchergebnisse Unklares Suchergebnis Nicht deutschsprachiges Ergebnis 26.6 56.8 0.6 0.2 11.8 4.0 Prozent der Ergebnisse Kategorie Prozentuale Verteilung der Suchergebnisse von Google und Bing (ohne Dubletten) Treffer Drittland Treffer EU Treffer aus Deutschland n = 2935 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 17
  • 19. Auswertung der Recherche 303 36 410 177 126 28 587 0 100 200 300 400 500 600 700 Anzahl Kategorie Verteilung der irrelevanten Suchergebnisse Food Science Dialog 2015: Lebensmittelkontrolle 2.0 19
  • 20. Auswertung der Recherche 137 73 63 6 13 33 35 17 56 153 46 15 25 45 12 52 0 20 40 60 80 100 120 140 160 180 Anzahl der Ergebnisse Bundesland Geographische Verteilung der relevanten Produktangebote innerhalb Deutschlands Food Science Dialog 2015: Lebensmittelkontrolle 2.0 20
  • 21. Recherchetool Datenerfassung Dublettenfilterung und Abgleich der Negativliste Shopidentifikation Lebensmittel- shopidentifikation Produktseiten- identifikation Verstoßanalyse Impressums- erkennung Ausgabe von Abschlussberichten Recherch eauftrag Anwender Manuelle Bewertung Weiterverarbeitung, juristische Prüfung und ggf. behördliche Maßnahmen GUI Food Science Dialog 2015: Lebensmittelkontrolle 2.0 21 Verdachts- analyse
  • 22. Ergebnisse • Relevante Suchergebnisse 1242 verdächtige Produktangebote • Verteilt auf 219 Produkte • Verteilt auf 440 unterschiedliche Händler Pilotstudie Food Science Dialog 2015: Lebensmittelkontrolle 2.0 22
  • 23. 23 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp
  • 24. Technische Anforderungen • Aufteilung der Software in Module zwecks vereinfachter Wartung und Erweiterung (z. B. Trennung zwischen Grafischer Benutzerschnittstelle und Analyse Applikationen)Verwendung von 11 spezifischen Suchanfragen • Zentraler Zugriff auf die Anwendung (Web-Anwendung) • Zentrale Kommunikationsschnittstelle (Datenbank) • Verarbeitung unstrukturierter Daten (Webseiten) und Bilder aus dem World Wide Web (Speicherung, Analyse, Export) • Parallele Verarbeitung rechenintensiver Analyseprozesse (Performance) Realisierung der Anforderungen • Nutzung standardisierter Entwurfsmuster für die Entwicklung von Teilkomponenten der Software • Drei-Schichten-Architektur für den gesamten Prototyp • Rechencluster zur Umsetzung eines verteilten Systems 24 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp: Anforderungen
  • 25. Software-Prototyp: Architektur 25 Food Science Dialog 2015: Lebensmittelkontrolle 2.0
  • 26. Technologien: • MySQL: Relationales Datenbankmanagementsystem • HTML: Quelltext für die Strukturierung von Webseiten • XLSX: Microsoft Office Excel-Format • JPG, PNG, GIF: BildformateVerarbeitung unstrukturierter Daten (Webseiten) und Bilder aus dem World 26 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp: Data Tier (Datenhaltung)
  • 27. Technologien (Datenanalye) • C#: Objektorientierte Programmiersprache mit Komponenten für die Realisierung von verteilten Prozessen • RegEx: Zeichenketten zur Beschreibung des Aufbaus von Text- Mengen (Pattern Matching) • OpenCV: Programmbibliothek zur Bildverarbeitung (Extraktion von Texten in Bildern, Musterkennung in Bildern) 27 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp: Application Tier Technologien (Datenerfassung) • Apache: Standard Webserver mit hoher Verbreitung mit MySQL und PHP- Unterstützung • cURL: Anwendung zur Simulierung von HTTP-Clients für den Aufruf und die Speicherung von Webseiten • XPath: XML Path Language zur Extraktion von Inhalten aus XML-Dateien und HTML-Dateien
  • 28. 28 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp: ClientTier (Benutzerschnittstelle) Technologien • HTML & CSS: De-facto-Standard für Layout und Design von Webseiten • JavaScript: Nutzung von jQuery (Programmbibliothek zur vereinfachten Implementierung von asynchronen Prozessen und Echtzeit Manipulation von Webseiten) • PHP: weit verbreitete Programmiersprache zur Entwicklung von Web- Anwendungen • PHPExcel: Programmbibliothek zur Erstellung von Excel-Tabellen z. B. aus Datensätzen in Datenbanken
  • 29. 29 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp
  • 30. 30 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Datenerfassung Dublettenfilterung und Abgleich der Negativliste Recherch eauftrag Anwender GUI Technischer Ablauf 1. curl https://www.google.de/q=synephrin&start=1 (Erfassen der Google Suchergebnisseiten) 2. xpath->evaluate(//h[@class='r']/a]) (Extraktion der Links aus den Suchtreffern) 3. Abgleich der Links mit einer Negativliste zur Filterung nicht gewollter Webseiten 4. Speichern der Metadaten der URLs in der Datenbank 5. curl http://miramix.com/product-tag/synephrin/ (Speichern aller extrahierten URLs in HTML) Software-Prototyp: Software Frontend
  • 31. 31 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Shopidentifikation Lebensmittel- shopidentifikation Wissensbasis • 6500 Internetseiten geclustert nach Kategorien (Shops, Lebensmittelshops, Informationseiten) • Quellen für die Seiten sind u. a.: • Ergebnisse zuvor durchgeführter Teststudien (manuelle Klassifikation von Internetseiten) • dmoz.de (Webverzeichnis) • eTrustedShops (Zertifizierungsstelle für Online-Shops) • preis.de (Preisvergleichsportal) Software-Prototyp: Software Backend
  • 32. 32 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Shopidentifikation Lebensmittel- shopidentifikation Technischer Ablauf 1. Wörter werden abhängig von dem Kontext in dem sie in die Webseite eingebettet sind gespeichert, z.B. - <script>wörter</script> als script::wörter - <title>text</title> als title::text - <a ...>link</a> als a::link - <tag atribut=value> als tag::atribut::value 2. Bewertung der Wörter nach Relevanz(anhand der Wissensbasis) Relevanz: - Wahrscheinlichkeit p - Häufigkeit h - e := p * log(h) 3. Bewertung der Seiten anhand der aussagekräftigsten Wörter und Ausgabe einer "Sicherheit" Software-Prototyp: Software Backend
  • 33. 33 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Shopidentifikation Lebensmittel- shopidentifikation Beispiele • script::payment 673/674 (e:0.9541) • warenkorb 1074/1077 (e:0.9540) • script::trustedshops com 638/639v(e:0.9514) • form::act.::int::arg.::advanced search 561/562 (e:0.9461) • a::int::arg.::checkout 517/518 (e:0.94062) • meta::cont.::onlineshop 463/464 (e:0.9353) • mwst zzgl 428/429 e:0.9298) • widerrufsrecht 600/603 (e:0.922949517879176) Software-Prototyp: Software Backend
  • 34. 34 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Technischer Ablauf 1. curl http://miramix.com/product-tag/synephrin/ (Aufruf der gespeicherten URLs) 2. xpath->evaluate(//a) (Extraktion der Links und Linktexte auf der Webseite) 3. Abgleich der extrahierten Inhalte mit Positivliste (gewichtete Suchterme) 4. curl http://miramix.com/impressum 5. Auslesen der Daten mit Regulären Ausdrücken angelehnt an DIN 5008 Software-Prototyp: Software Backend
  • 35. 35 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Regulärer Ausdruck (?<PLZ>d{5})(?:s+) (?<Ort> (?: (?: (?:Hansest(?:adt|.)|Bad|Berg(?:isch|.)|Alt|Neu|Gro(?:ß|ss)|Klein|Insel| Hohe|Ober|Unter|Sankt|Schw(?:ä|ae)b(?:.|isch)?|St.?|Skt.?| Kloster|Kurort|Markt)?[^S]* (?:(?:[A-ZÄäÖöÜüß]){2,30}(?:–|-)(?:[A-ZÄäÖöÜüß]){1,30}|(?:(?!bad)(?:[A- ZÄäÖöÜüß]){2,30})) )| (?:(?:(?:[A-ZÄäÖöÜüß]){1,30}[^S]{0,8}(?:–|-)[^S]{0,8}){0,4} (?:[A-ZÄäÖöÜüß]){2,30} ) ) (?:(?:[^S]+(?:am|a.|bei|im|i.|in|ot|uf)[^S]+(?:[A-ZÄäÖöÜüß]){2,30})? (?:[^S]+ (?:(?:an|a.|i(?:.|n|m)|uf|ant)[^S]*(?:der|d.))[^S]+ (?:(?:[A-ZÄäÖöÜüß]){2,30}|(?:[A-ZÄäÖöÜüß]){1,5}.)| (?:[a-z]{1,2}.(?:[a-z].?)?) )? )? ) Software-Prototyp: Software Backend
  • 36. 36 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp: Software Backend Technischer Ablauf 1. Anfrage an die Datenbank für die Zusammenstellung von Abschlussberichten (MySQL Statements) 2. Speicherung der Werte in Arrays 3. Aufteilung der Ergebnistabellen nach Bundesländern 4. Nutzung von Funktionen in PHPExcel für Erstellung der Excel-Tabellen 5. Benachrichtigung über Fertistellung des Berichts per E-Mail
  • 37. 37 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Manuelle Bewertung GUI Technischer Ablauf 1. Zusammenstellung der nachzubewertenden Webseiten nach definierten Auswahlkriterien aus der Datenbank 2. Darstellung der Webseiten im Browser mit Formularen Software-Prototyp: Manuelle Bewertung
  • 38. Pilotstudie Demo-Beispiel Ziel: • Identifikation von möglichst Bio-Lebensmittelshops • Testlauf der bisher umgesetzten Module des Prototypen Datenerfassung Dublettenfilterung und Abgleich der Negativliste Shopidentifikation Lebensmittel- shopidentifikation Impressums- erkennung Dubletten- filterung Food Science Dialog 2015: Lebensmittelkontrolle 2.0 38
  • 39. Pilotstudie Demo-Beispiel Food Science Dialog 2015: Lebensmittelkontrolle 2.0 39
  • 40. Ausblick WHAT IS NEXT? 40 Food Science Dialog 2015: Lebensmittelkontrolle 2.0
  • 41. Fallbeispiel Europäisches Biologo 41 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp: Logoerkennung
  • 42. 42 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp: Logoerkennung Ausgangslage • Keine gesetzliche Norm bezüglich des Logos und seiner Verwendung im Internet • Logos im Internet unterscheiden sich durch u. a. durch: • Hohe Farbvarianz • "Falsche" Seitenverhältnisse • Zugeschnittene Logos • Sehr kleine Logos • Verdeckte Logos • Auf der "offiziellen" Seite des Bio-Logos werden alleine drei verschiedene Farbwerte verwendet
  • 43. Bisherige Umsetzung • Fokus auf “grünes” Bio Logo der EU • Bild-Segmentierung: • Reduktion auf Farbbereich des Logos • Reduktion der gefundenen Bereiche (Kleine Bereiche verschwinden) • Zusammenhängende Bereiche einzeln verarbeiten • Zu kleine Bereiche verwerfen • Anteil heller Teile (potentielle Sterne) muss Mindestmaß überschreiten 43 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp: Logoerkennung
  • 44. 44 Food Science Dialog 2015: Lebensmittelkontrolle 2.0 Software-Prototyp: Logoerkennung Bisherige Umsetzung
  • 45. Fazit und Ausblick • Das AAPVL Projekt hat die technologischen Grundlagen für die Entwicklung eines automatisierten Analyseverfahrens für die Lebensmittelkontrolle im Internet geschaffen. • Das APPVL Konzept liefert einen effektiven Beitrag, um auf effizienter Weise, die hohe Lebensmittelsicherheit im Onlinehandel zu gewährleisten. • Anhand einer Fallstudie konnte die Praxistauglichkeit des APPVL Konzept für die Lebensmittelkontrolle im Internet gezeigt werden. • Weitere Fallbeispiele und Optimierung des APPVL Konzepts folgen (z.B. Weiterentwicklung der Reduktionsstufen). 45 Food Science Dialog 2015: Lebensmittelkontrolle 2.0
  • 46. Danke für die Aufmerksamkeit 46 Food Science Dialog 2015: Lebensmittelkontrolle 2.0