SlideShare ist ein Scribd-Unternehmen logo
1 © 2015 Glanos GmbH© 2015 Glanos GmbH
Praxisbericht: Automatisierte Klassifikation
von Stellenanzeigen für Experteer
Gerhard Rolletschek, Glanos
2 © 2015 Glanos GmbH
Warum das Ganze? Oder: das Ziel der Reise
• Viele Stellenanzeigen aus
dem Web
• In unterschiedlichem Format
• Ohne Metadaten
Assembly
Pipeline
• Richtig einsortierte Stellenanzeigen
• Nach Industrie, Funktion,
Karrierelevel und Ort
• Grundlage für erfolgreiche Suchen
und Matching zu Kandidaten
3 © 2015 Glanos GmbH
Methodische Herausforderungen im Datenmeer
Stellenanzeigen
Heterogenität der Stellenanzeigen
• Von großen Firmen
• Von mittleren und kleinen Firmen
• Von Headhuntern
• In mehreren Sprachen
• Kulturelle Unterschiede im Arbeitsleben
Unterschiedliche Indikatoren für die richtige Klassifikation
• Sprachliche Varianten, z.B. von Personalverantwortung
• Unterschiedliche Bedeutung eines Features in
verschiedenen Branchen
4 © 2015 Glanos GmbH
Ein kleiner Teil des Wissens ist
explizit und liegt in einem
Regelwerk vor (=Businesslogik)
Der größere Teil liegt jedoch erstmal
nicht dokumentiert vor
Trainingsdaten zeigen Einflüsse, wer
und wann klassifiziert hat
Eingespielte Praktiken laufen teilweise
gegen Businesslogiken
Der Eisberg in den Trainingsdaten
Eingespielte Praxis,
ad-hoc-Entscheidungen,
Intuition,
Tagesform
Explizites
dokumentiertes
Wissen
5 © 2015 Glanos GmbH
In die Tiefe tauchen –
und die Auswirkungen auf das Projekt
Zusammenspiel in der Organisation und Kommunikation
• Erfolge sind schwierig messbar, wenn die
Trainingsdaten selbst zweifelhaft sind
• Nachevaluation von Differenzen in der Autoklassifikation
und der Trainingsmenge
• Einbindung unterschiedlicher Abteilungen notwendig,
um das implizite Wissen in Regeln zu transformieren
Hybrid-Ansatz notwendig
• Kombination aus harten Regeln, die sprachliche
Varianten berücksichtigen und Machine Learning
• Wichtige Business-Regeln müssen forciert werden
können
6 © 2015 Glanos GmbH
Die Autoklassifikation in der Assembly Pipeline
Text Analytics-Schicht
 Extraktion relevanter Phrasen und Zuordnung zu Businesslogik
 Sehr hohe Präzision (>98%) durch kontrollierte Extraktion
Regel-System-Schicht
 Mehrstufiges Businesslogik-System auf den Ergebnissen der Text Analytics
Klassifikationsschicht
 Linguistisch und semantisch motivierte Feature-Extraktion
 Stochastic Gradient Descent Learner für perfomantes Lernen in hoch-
dimensionalen Problemen
Qualitätsmanagement
 Merge von Text-Analytics, Regeln und Klassifikation
 Transparente/nachverfolgbare Entscheidungskriterien
 Continuous integration aller Komponenten, auch der Regeln und Text Analytics
7 © 2015 Glanos GmbH
Land in Sicht: Das Resultat
 Mehr als 55% Dunkelverarbeitungsquote
 Über 90% Präzision in jedem Attribut
8 © 2015 Glanos GmbH
Eine Stellenanzeige in der Nahansicht …
9 © 2015 Glanos GmbH
… und was daraus gemacht wird
1
1
3
4
8
7
5
5
6
2
2
6
• Bezugnahme auf Manager Soft Skills:
“Leadership”, “Communication skills”
• Gesucht wird ein Manager mit lang-
jähriger Management-Erfahrung, der viele
Mitarbeiter führt und für deren berufliche
Förderung zuständig ist (career
development)
• Große Budgetverantwortung
• Stellenbezeichnung
• Industrie “Life Science”
• Manager auf zweiter Organisations-
ebene, der Manager führt
• “Director” lässt sich nur schwer einordnen,
kann viel bedeuten, muss durch
Zusammenhang spezifiziert werden.
• Zuständigkeit für den Bereich Verkauf
7
1
2
3
4
5
6
8
10 © 2015 Glanos GmbH
Der Maschinenraum
Frontend
DataLab
Glanos QM, HTML/JS/CSS,
Angular
Business-Logik
Scala, Java, Akka,
Glanos Business-
Logik-Tools
Linguistik
Scala, Java, OpenNLP,
Glanos Linguistik-
Tools
Storage
ElasticSearch, OrientDB
KonnektorenCrawler
11 © 2015 Glanos GmbH
Mehr unter
www.glanos.de
www.experteer.de

Weitere ähnliche Inhalte

Andere mochten auch

Roboter-Journalismus: die Erstellung automatisch generierter Spielberichte
Roboter-Journalismus: die Erstellung automatisch generierter SpielberichteRoboter-Journalismus: die Erstellung automatisch generierter Spielberichte
Roboter-Journalismus: die Erstellung automatisch generierter Spielberichte
Rising Media Ltd.
 
Analytics meets Big Data – R/Python auf der Hadoop/Spark-Plattform
Analytics meets Big Data – R/Python auf der Hadoop/Spark-PlattformAnalytics meets Big Data – R/Python auf der Hadoop/Spark-Plattform
Analytics meets Big Data – R/Python auf der Hadoop/Spark-Plattform
Rising Media Ltd.
 
Churn - Entwicklung und Anwendung eines Kündigerfrühwarnsystems
Churn - Entwicklung und Anwendung eines KündigerfrühwarnsystemsChurn - Entwicklung und Anwendung eines Kündigerfrühwarnsystems
Churn - Entwicklung und Anwendung eines Kündigerfrühwarnsystems
Rising Media Ltd.
 
Der Einsatz von Uplift-Modeling am Beispiel der Lufthansa Miles & More Credit...
Der Einsatz von Uplift-Modeling am Beispiel der Lufthansa Miles & More Credit...Der Einsatz von Uplift-Modeling am Beispiel der Lufthansa Miles & More Credit...
Der Einsatz von Uplift-Modeling am Beispiel der Lufthansa Miles & More Credit...
Rising Media Ltd.
 
Predictive Analytics Powered By Process Mining: It’s The Process, Stupid!
Predictive Analytics Powered By Process Mining: It’s The Process, Stupid!Predictive Analytics Powered By Process Mining: It’s The Process, Stupid!
Predictive Analytics Powered By Process Mining: It’s The Process, Stupid!
Rising Media Ltd.
 
Sports Movement Toolbox
Sports Movement ToolboxSports Movement Toolbox
Sports Movement Toolbox
Dan Williams
 
Curso demeditacion osho
Curso demeditacion oshoCurso demeditacion osho
Curso demeditacion osho
uriel sanchez sanchez
 
Taller#7 armuelles
Taller#7 armuellesTaller#7 armuelles
Taller#7 armuelles
maely09soto
 
CAPITULO 12
CAPITULO 12CAPITULO 12
Resume fort march 2016
Resume fort  march 2016Resume fort  march 2016
Resume fort march 2016
John Fort, III
 
NAPCC-Winter2011
NAPCC-Winter2011NAPCC-Winter2011
NAPCC-Winter2011
Stephanie Pedersen
 
SISTEMA GESTOR DE REFERENCIAS BIBLIOGRÁFICAS Y ELABORADOR DE BIBLIOGRAFÍAS PA...
SISTEMA GESTOR DE REFERENCIAS BIBLIOGRÁFICAS Y ELABORADOR DE BIBLIOGRAFÍAS PA...SISTEMA GESTOR DE REFERENCIAS BIBLIOGRÁFICAS Y ELABORADOR DE BIBLIOGRAFÍAS PA...
SISTEMA GESTOR DE REFERENCIAS BIBLIOGRÁFICAS Y ELABORADOR DE BIBLIOGRAFÍAS PA...
DANIEL CUBILLOS
 
A arvore do Japão_5a_Marcelina_Silva
A arvore do Japão_5a_Marcelina_SilvaA arvore do Japão_5a_Marcelina_Silva
A arvore do Japão_5a_Marcelina_Silva
Biblioteca da Escola EB 2/3 de Beiriz
 
HIPAA Compliance Cheat Sheet
HIPAA Compliance Cheat SheetHIPAA Compliance Cheat Sheet
HIPAA Compliance Cheat Sheet
Scrypt, Inc.
 
Electric Energy Conservation:Tips & Tricks
Electric Energy Conservation:Tips & TricksElectric Energy Conservation:Tips & Tricks
Electric Energy Conservation:Tips & Tricks
Vartul Tripathi
 
Internet of Things trifft auf Customer Intelligence
Internet of Things trifft auf Customer IntelligenceInternet of Things trifft auf Customer Intelligence
Internet of Things trifft auf Customer Intelligence
Rising Media Ltd.
 
Predictive Analytics World Manufacturing Düsseldorf 2017 - EN
Predictive Analytics World Manufacturing Düsseldorf 2017 - ENPredictive Analytics World Manufacturing Düsseldorf 2017 - EN
Predictive Analytics World Manufacturing Düsseldorf 2017 - EN
Rising Media Ltd.
 
Wie Social Media Listening Leben retten kann
Wie Social Media Listening Leben retten kannWie Social Media Listening Leben retten kann
Wie Social Media Listening Leben retten kann
Rising Media Ltd.
 
Predictive Analytics für gemeinnützige Zwecke - und was Unternehmen daraus le...
Predictive Analytics für gemeinnützige Zwecke - und was Unternehmen daraus le...Predictive Analytics für gemeinnützige Zwecke - und was Unternehmen daraus le...
Predictive Analytics für gemeinnützige Zwecke - und was Unternehmen daraus le...
Rising Media Ltd.
 
Social Media Data in Predictive Analytics
Social Media Data in Predictive AnalyticsSocial Media Data in Predictive Analytics
Social Media Data in Predictive Analytics
Rising Media Ltd.
 

Andere mochten auch (20)

Roboter-Journalismus: die Erstellung automatisch generierter Spielberichte
Roboter-Journalismus: die Erstellung automatisch generierter SpielberichteRoboter-Journalismus: die Erstellung automatisch generierter Spielberichte
Roboter-Journalismus: die Erstellung automatisch generierter Spielberichte
 
Analytics meets Big Data – R/Python auf der Hadoop/Spark-Plattform
Analytics meets Big Data – R/Python auf der Hadoop/Spark-PlattformAnalytics meets Big Data – R/Python auf der Hadoop/Spark-Plattform
Analytics meets Big Data – R/Python auf der Hadoop/Spark-Plattform
 
Churn - Entwicklung und Anwendung eines Kündigerfrühwarnsystems
Churn - Entwicklung und Anwendung eines KündigerfrühwarnsystemsChurn - Entwicklung und Anwendung eines Kündigerfrühwarnsystems
Churn - Entwicklung und Anwendung eines Kündigerfrühwarnsystems
 
Der Einsatz von Uplift-Modeling am Beispiel der Lufthansa Miles & More Credit...
Der Einsatz von Uplift-Modeling am Beispiel der Lufthansa Miles & More Credit...Der Einsatz von Uplift-Modeling am Beispiel der Lufthansa Miles & More Credit...
Der Einsatz von Uplift-Modeling am Beispiel der Lufthansa Miles & More Credit...
 
Predictive Analytics Powered By Process Mining: It’s The Process, Stupid!
Predictive Analytics Powered By Process Mining: It’s The Process, Stupid!Predictive Analytics Powered By Process Mining: It’s The Process, Stupid!
Predictive Analytics Powered By Process Mining: It’s The Process, Stupid!
 
Sports Movement Toolbox
Sports Movement ToolboxSports Movement Toolbox
Sports Movement Toolbox
 
Curso demeditacion osho
Curso demeditacion oshoCurso demeditacion osho
Curso demeditacion osho
 
Taller#7 armuelles
Taller#7 armuellesTaller#7 armuelles
Taller#7 armuelles
 
CAPITULO 12
CAPITULO 12CAPITULO 12
CAPITULO 12
 
Resume fort march 2016
Resume fort  march 2016Resume fort  march 2016
Resume fort march 2016
 
NAPCC-Winter2011
NAPCC-Winter2011NAPCC-Winter2011
NAPCC-Winter2011
 
SISTEMA GESTOR DE REFERENCIAS BIBLIOGRÁFICAS Y ELABORADOR DE BIBLIOGRAFÍAS PA...
SISTEMA GESTOR DE REFERENCIAS BIBLIOGRÁFICAS Y ELABORADOR DE BIBLIOGRAFÍAS PA...SISTEMA GESTOR DE REFERENCIAS BIBLIOGRÁFICAS Y ELABORADOR DE BIBLIOGRAFÍAS PA...
SISTEMA GESTOR DE REFERENCIAS BIBLIOGRÁFICAS Y ELABORADOR DE BIBLIOGRAFÍAS PA...
 
A arvore do Japão_5a_Marcelina_Silva
A arvore do Japão_5a_Marcelina_SilvaA arvore do Japão_5a_Marcelina_Silva
A arvore do Japão_5a_Marcelina_Silva
 
HIPAA Compliance Cheat Sheet
HIPAA Compliance Cheat SheetHIPAA Compliance Cheat Sheet
HIPAA Compliance Cheat Sheet
 
Electric Energy Conservation:Tips & Tricks
Electric Energy Conservation:Tips & TricksElectric Energy Conservation:Tips & Tricks
Electric Energy Conservation:Tips & Tricks
 
Internet of Things trifft auf Customer Intelligence
Internet of Things trifft auf Customer IntelligenceInternet of Things trifft auf Customer Intelligence
Internet of Things trifft auf Customer Intelligence
 
Predictive Analytics World Manufacturing Düsseldorf 2017 - EN
Predictive Analytics World Manufacturing Düsseldorf 2017 - ENPredictive Analytics World Manufacturing Düsseldorf 2017 - EN
Predictive Analytics World Manufacturing Düsseldorf 2017 - EN
 
Wie Social Media Listening Leben retten kann
Wie Social Media Listening Leben retten kannWie Social Media Listening Leben retten kann
Wie Social Media Listening Leben retten kann
 
Predictive Analytics für gemeinnützige Zwecke - und was Unternehmen daraus le...
Predictive Analytics für gemeinnützige Zwecke - und was Unternehmen daraus le...Predictive Analytics für gemeinnützige Zwecke - und was Unternehmen daraus le...
Predictive Analytics für gemeinnützige Zwecke - und was Unternehmen daraus le...
 
Social Media Data in Predictive Analytics
Social Media Data in Predictive AnalyticsSocial Media Data in Predictive Analytics
Social Media Data in Predictive Analytics
 

Ähnlich wie Praxisbericht: Automatisierte Klassifikation von Stellenanzeigen für Experteer

CRM Vortrag - BVMW IT Frühstück 2011
CRM Vortrag - BVMW IT Frühstück 2011CRM Vortrag - BVMW IT Frühstück 2011
CRM Vortrag - BVMW IT Frühstück 2011
Custemotion Unternehmensberatung UG (haftungsbeschränkt)
 
Twowayys Agile Sourcing
Twowayys Agile SourcingTwowayys Agile Sourcing
Twowayys Agile Sourcing
Jörg Petters
 
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
Wolfgang Schmidt
 
Mag. Maximilian Gschwandtner (Grothusen)
Mag. Maximilian Gschwandtner (Grothusen)Mag. Maximilian Gschwandtner (Grothusen)
Mag. Maximilian Gschwandtner (Grothusen)
Praxistage
 
Auswahlhilfe ERP-Software
Auswahlhilfe ERP-SoftwareAuswahlhilfe ERP-Software
Auswahlhilfe ERP-Software
Jessica Vitali
 
Agiles Projekt-und Portfoliomanagement – mehr als nur agile Projekte
Agiles Projekt-und Portfoliomanagement – mehr als nur agile ProjekteAgiles Projekt-und Portfoliomanagement – mehr als nur agile Projekte
Agiles Projekt-und Portfoliomanagement – mehr als nur agile Projekte
Ayelt Komus
 
Provadis Nr. 12 Oktober 2016
Provadis Nr. 12 Oktober 2016Provadis Nr. 12 Oktober 2016
Provadis Nr. 12 Oktober 2016
Natasha Senn
 
Prozessoptimierung: Gleichartige Prozesse standardisieren. Aber nach Maß.
Prozessoptimierung: Gleichartige Prozesse standardisieren. Aber nach Maß.Prozessoptimierung: Gleichartige Prozesse standardisieren. Aber nach Maß.
Prozessoptimierung: Gleichartige Prozesse standardisieren. Aber nach Maß.
Jürgen Marx
 
20191113 dev ops und continuous delivery_testautomatisierung ist trumpf
20191113 dev ops und continuous delivery_testautomatisierung ist trumpf20191113 dev ops und continuous delivery_testautomatisierung ist trumpf
20191113 dev ops und continuous delivery_testautomatisierung ist trumpf
Stefan Jobst
 
Alles unter Kontrolle? effizientes Übersetzungsmanagement in der P
Alles unter Kontrolle? effizientes Übersetzungsmanagement in der PAlles unter Kontrolle? effizientes Übersetzungsmanagement in der P
Alles unter Kontrolle? effizientes Übersetzungsmanagement in der P
Axel Poestges
 
Wirksames Stammdatenmanagement
Wirksames StammdatenmanagementWirksames Stammdatenmanagement
Wirksames Stammdatenmanagement
CDQ - Sharing Data Excellence
 
Mehr Budget für Digital-Analytics-Teams
Mehr Budget für Digital-Analytics-TeamsMehr Budget für Digital-Analytics-Teams
Mehr Budget für Digital-Analytics-Teams
ro11 GmbH
 
Ifaa erfolgreiche fach- und führungskarriere - dr fratschner -baumgartner &...
Ifaa   erfolgreiche fach- und führungskarriere - dr fratschner -baumgartner &...Ifaa   erfolgreiche fach- und führungskarriere - dr fratschner -baumgartner &...
Ifaa erfolgreiche fach- und führungskarriere - dr fratschner -baumgartner &...
Friedrich, Dr. Fratschner
 
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
Thomas Jenewein
 
Talent Sourcing: Fastenkur 2.0 und Einbindung von Taleo
Talent Sourcing: Fastenkur 2.0 und Einbindung von TaleoTalent Sourcing: Fastenkur 2.0 und Einbindung von Taleo
Talent Sourcing: Fastenkur 2.0 und Einbindung von Taleo
STRIMgroup
 
PERFORMIX.Wien 2016 – Startschuss für Start-ups – so startet man durch – Alex...
PERFORMIX.Wien 2016 – Startschuss für Start-ups – so startet man durch – Alex...PERFORMIX.Wien 2016 – Startschuss für Start-ups – so startet man durch – Alex...
PERFORMIX.Wien 2016 – Startschuss für Start-ups – so startet man durch – Alex...
Werbeplanung.at Summit
 
2017 04 12_procure_one_company_ppt_
2017 04 12_procure_one_company_ppt_2017 04 12_procure_one_company_ppt_
2017 04 12_procure_one_company_ppt_
Andrew Seim
 
Lean Lab in der Pharmazeutischen Industrie
Lean Lab in der Pharmazeutischen IndustrieLean Lab in der Pharmazeutischen Industrie
Lean Lab in der Pharmazeutischen Industrie
Lean Knowledge Base UG
 
Einladung art of planninig 2016_wien
Einladung art of planninig 2016_wienEinladung art of planninig 2016_wien
Einladung art of planninig 2016_wien
Heimo Teubenbacher
 

Ähnlich wie Praxisbericht: Automatisierte Klassifikation von Stellenanzeigen für Experteer (20)

CRM Vortrag - BVMW IT Frühstück 2011
CRM Vortrag - BVMW IT Frühstück 2011CRM Vortrag - BVMW IT Frühstück 2011
CRM Vortrag - BVMW IT Frühstück 2011
 
Twowayys Agile Sourcing
Twowayys Agile SourcingTwowayys Agile Sourcing
Twowayys Agile Sourcing
 
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
 
Mag. Maximilian Gschwandtner (Grothusen)
Mag. Maximilian Gschwandtner (Grothusen)Mag. Maximilian Gschwandtner (Grothusen)
Mag. Maximilian Gschwandtner (Grothusen)
 
Auswahlhilfe ERP-Software
Auswahlhilfe ERP-SoftwareAuswahlhilfe ERP-Software
Auswahlhilfe ERP-Software
 
Agiles Projekt-und Portfoliomanagement – mehr als nur agile Projekte
Agiles Projekt-und Portfoliomanagement – mehr als nur agile ProjekteAgiles Projekt-und Portfoliomanagement – mehr als nur agile Projekte
Agiles Projekt-und Portfoliomanagement – mehr als nur agile Projekte
 
Provadis Nr. 12 Oktober 2016
Provadis Nr. 12 Oktober 2016Provadis Nr. 12 Oktober 2016
Provadis Nr. 12 Oktober 2016
 
Prozessoptimierung: Gleichartige Prozesse standardisieren. Aber nach Maß.
Prozessoptimierung: Gleichartige Prozesse standardisieren. Aber nach Maß.Prozessoptimierung: Gleichartige Prozesse standardisieren. Aber nach Maß.
Prozessoptimierung: Gleichartige Prozesse standardisieren. Aber nach Maß.
 
20191113 dev ops und continuous delivery_testautomatisierung ist trumpf
20191113 dev ops und continuous delivery_testautomatisierung ist trumpf20191113 dev ops und continuous delivery_testautomatisierung ist trumpf
20191113 dev ops und continuous delivery_testautomatisierung ist trumpf
 
Alles unter Kontrolle? effizientes Übersetzungsmanagement in der P
Alles unter Kontrolle? effizientes Übersetzungsmanagement in der PAlles unter Kontrolle? effizientes Übersetzungsmanagement in der P
Alles unter Kontrolle? effizientes Übersetzungsmanagement in der P
 
Wirksames Stammdatenmanagement
Wirksames StammdatenmanagementWirksames Stammdatenmanagement
Wirksames Stammdatenmanagement
 
Mehr Budget für Digital-Analytics-Teams
Mehr Budget für Digital-Analytics-TeamsMehr Budget für Digital-Analytics-Teams
Mehr Budget für Digital-Analytics-Teams
 
Ifaa erfolgreiche fach- und führungskarriere - dr fratschner -baumgartner &...
Ifaa   erfolgreiche fach- und führungskarriere - dr fratschner -baumgartner &...Ifaa   erfolgreiche fach- und führungskarriere - dr fratschner -baumgartner &...
Ifaa erfolgreiche fach- und führungskarriere - dr fratschner -baumgartner &...
 
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
 
Talent Sourcing: Fastenkur 2.0 und Einbindung von Taleo
Talent Sourcing: Fastenkur 2.0 und Einbindung von TaleoTalent Sourcing: Fastenkur 2.0 und Einbindung von Taleo
Talent Sourcing: Fastenkur 2.0 und Einbindung von Taleo
 
PERFORMIX.Wien 2016 – Startschuss für Start-ups – so startet man durch – Alex...
PERFORMIX.Wien 2016 – Startschuss für Start-ups – so startet man durch – Alex...PERFORMIX.Wien 2016 – Startschuss für Start-ups – so startet man durch – Alex...
PERFORMIX.Wien 2016 – Startschuss für Start-ups – so startet man durch – Alex...
 
2010 09 29 11-30 dr marcel siegenthaler
2010 09 29 11-30 dr marcel siegenthaler2010 09 29 11-30 dr marcel siegenthaler
2010 09 29 11-30 dr marcel siegenthaler
 
2017 04 12_procure_one_company_ppt_
2017 04 12_procure_one_company_ppt_2017 04 12_procure_one_company_ppt_
2017 04 12_procure_one_company_ppt_
 
Lean Lab in der Pharmazeutischen Industrie
Lean Lab in der Pharmazeutischen IndustrieLean Lab in der Pharmazeutischen Industrie
Lean Lab in der Pharmazeutischen Industrie
 
Einladung art of planninig 2016_wien
Einladung art of planninig 2016_wienEinladung art of planninig 2016_wien
Einladung art of planninig 2016_wien
 

Mehr von Rising Media Ltd.

Data Science at Roche: From Exploration to Productionization - Frank Block
Data Science at Roche: From Exploration to Productionization - Frank BlockData Science at Roche: From Exploration to Productionization - Frank Block
Data Science at Roche: From Exploration to Productionization - Frank Block
Rising Media Ltd.
 
Cost-Effective Personalisation Platform for 30M Users of Ringier Axel Springe...
Cost-Effective Personalisation Platform for 30M Users of Ringier Axel Springe...Cost-Effective Personalisation Platform for 30M Users of Ringier Axel Springe...
Cost-Effective Personalisation Platform for 30M Users of Ringier Axel Springe...
Rising Media Ltd.
 
Uplift Modelling as a Tool for Making Causal Inferences at Shopify - Mojan Hamed
Uplift Modelling as a Tool for Making Causal Inferences at Shopify - Mojan HamedUplift Modelling as a Tool for Making Causal Inferences at Shopify - Mojan Hamed
Uplift Modelling as a Tool for Making Causal Inferences at Shopify - Mojan Hamed
Rising Media Ltd.
 
Behind the Buzzword: Understanding Customer Data Platforms in the Light of Pr...
Behind the Buzzword: Understanding Customer Data Platforms in the Light of Pr...Behind the Buzzword: Understanding Customer Data Platforms in the Light of Pr...
Behind the Buzzword: Understanding Customer Data Platforms in the Light of Pr...
Rising Media Ltd.
 
Data Science Development Lifecycle - Everyone Talks About it, Nobody Really K...
Data Science Development Lifecycle - Everyone Talks About it, Nobody Really K...Data Science Development Lifecycle - Everyone Talks About it, Nobody Really K...
Data Science Development Lifecycle - Everyone Talks About it, Nobody Really K...
Rising Media Ltd.
 
Creating Community at WeWork through Graph Embeddings with node2vec - Karry Lu
Creating Community at WeWork through Graph Embeddings with node2vec - Karry LuCreating Community at WeWork through Graph Embeddings with node2vec - Karry Lu
Creating Community at WeWork through Graph Embeddings with node2vec - Karry Lu
Rising Media Ltd.
 
More than 10 Blue Links: Advanced-Level SERP Optimisation
More than 10 Blue Links: Advanced-Level SERP OptimisationMore than 10 Blue Links: Advanced-Level SERP Optimisation
More than 10 Blue Links: Advanced-Level SERP Optimisation
Rising Media Ltd.
 
How to Get Great Results Across Every Marketing Channel
How to Get Great Results Across Every Marketing ChannelHow to Get Great Results Across Every Marketing Channel
How to Get Great Results Across Every Marketing Channel
Rising Media Ltd.
 
Don’t Freak Out! Tips for Mobile and Voice Search
Don’t Freak Out! Tips for Mobile and Voice SearchDon’t Freak Out! Tips for Mobile and Voice Search
Don’t Freak Out! Tips for Mobile and Voice Search
Rising Media Ltd.
 
The Scout24 Data Landscape Manifesto: Building an Opinionated Data Platform
The Scout24 Data Landscape Manifesto: Building an Opinionated Data PlatformThe Scout24 Data Landscape Manifesto: Building an Opinionated Data Platform
The Scout24 Data Landscape Manifesto: Building an Opinionated Data Platform
Rising Media Ltd.
 
Prescriptive ohne Predictive: Regression ist noch nicht tot! ROMI bei Unitymedia
Prescriptive ohne Predictive: Regression ist noch nicht tot! ROMI bei UnitymediaPrescriptive ohne Predictive: Regression ist noch nicht tot! ROMI bei Unitymedia
Prescriptive ohne Predictive: Regression ist noch nicht tot! ROMI bei Unitymedia
Rising Media Ltd.
 
Reinforcement Learning - Learning from Experience like a Human
Reinforcement Learning - Learning from Experience like a HumanReinforcement Learning - Learning from Experience like a Human
Reinforcement Learning - Learning from Experience like a Human
Rising Media Ltd.
 
Mindful Analytics - Wie Achtsamkeit uns noch besser macht
Mindful Analytics - Wie Achtsamkeit uns noch besser machtMindful Analytics - Wie Achtsamkeit uns noch besser macht
Mindful Analytics - Wie Achtsamkeit uns noch besser macht
Rising Media Ltd.
 
Data Science Development with Impact
Data Science Development with ImpactData Science Development with Impact
Data Science Development with Impact
Rising Media Ltd.
 
Predictive Analytics World for Business Deutschland 2018
Predictive Analytics World for Business Deutschland 2018Predictive Analytics World for Business Deutschland 2018
Predictive Analytics World for Business Deutschland 2018
Rising Media Ltd.
 
Predictive Analytics World for Business Germany 2018
Predictive Analytics World for Business Germany 2018Predictive Analytics World for Business Germany 2018
Predictive Analytics World for Business Germany 2018
Rising Media Ltd.
 
The Centrality of a Detailed Understanding of your Audience
The Centrality of a Detailed Understanding of your AudienceThe Centrality of a Detailed Understanding of your Audience
The Centrality of a Detailed Understanding of your Audience
Rising Media Ltd.
 
Der steinige Weg zum automatisierten Data Science Produkt – Empfehlungen und ...
Der steinige Weg zum automatisierten Data Science Produkt – Empfehlungen und ...Der steinige Weg zum automatisierten Data Science Produkt – Empfehlungen und ...
Der steinige Weg zum automatisierten Data Science Produkt – Empfehlungen und ...
Rising Media Ltd.
 
Data Alchemy
Data AlchemyData Alchemy
Data Alchemy
Rising Media Ltd.
 
SpiegelMining – Data Science auf Spiegel Online
SpiegelMining – Data Science auf Spiegel Online SpiegelMining – Data Science auf Spiegel Online
SpiegelMining – Data Science auf Spiegel Online
Rising Media Ltd.
 

Mehr von Rising Media Ltd. (20)

Data Science at Roche: From Exploration to Productionization - Frank Block
Data Science at Roche: From Exploration to Productionization - Frank BlockData Science at Roche: From Exploration to Productionization - Frank Block
Data Science at Roche: From Exploration to Productionization - Frank Block
 
Cost-Effective Personalisation Platform for 30M Users of Ringier Axel Springe...
Cost-Effective Personalisation Platform for 30M Users of Ringier Axel Springe...Cost-Effective Personalisation Platform for 30M Users of Ringier Axel Springe...
Cost-Effective Personalisation Platform for 30M Users of Ringier Axel Springe...
 
Uplift Modelling as a Tool for Making Causal Inferences at Shopify - Mojan Hamed
Uplift Modelling as a Tool for Making Causal Inferences at Shopify - Mojan HamedUplift Modelling as a Tool for Making Causal Inferences at Shopify - Mojan Hamed
Uplift Modelling as a Tool for Making Causal Inferences at Shopify - Mojan Hamed
 
Behind the Buzzword: Understanding Customer Data Platforms in the Light of Pr...
Behind the Buzzword: Understanding Customer Data Platforms in the Light of Pr...Behind the Buzzword: Understanding Customer Data Platforms in the Light of Pr...
Behind the Buzzword: Understanding Customer Data Platforms in the Light of Pr...
 
Data Science Development Lifecycle - Everyone Talks About it, Nobody Really K...
Data Science Development Lifecycle - Everyone Talks About it, Nobody Really K...Data Science Development Lifecycle - Everyone Talks About it, Nobody Really K...
Data Science Development Lifecycle - Everyone Talks About it, Nobody Really K...
 
Creating Community at WeWork through Graph Embeddings with node2vec - Karry Lu
Creating Community at WeWork through Graph Embeddings with node2vec - Karry LuCreating Community at WeWork through Graph Embeddings with node2vec - Karry Lu
Creating Community at WeWork through Graph Embeddings with node2vec - Karry Lu
 
More than 10 Blue Links: Advanced-Level SERP Optimisation
More than 10 Blue Links: Advanced-Level SERP OptimisationMore than 10 Blue Links: Advanced-Level SERP Optimisation
More than 10 Blue Links: Advanced-Level SERP Optimisation
 
How to Get Great Results Across Every Marketing Channel
How to Get Great Results Across Every Marketing ChannelHow to Get Great Results Across Every Marketing Channel
How to Get Great Results Across Every Marketing Channel
 
Don’t Freak Out! Tips for Mobile and Voice Search
Don’t Freak Out! Tips for Mobile and Voice SearchDon’t Freak Out! Tips for Mobile and Voice Search
Don’t Freak Out! Tips for Mobile and Voice Search
 
The Scout24 Data Landscape Manifesto: Building an Opinionated Data Platform
The Scout24 Data Landscape Manifesto: Building an Opinionated Data PlatformThe Scout24 Data Landscape Manifesto: Building an Opinionated Data Platform
The Scout24 Data Landscape Manifesto: Building an Opinionated Data Platform
 
Prescriptive ohne Predictive: Regression ist noch nicht tot! ROMI bei Unitymedia
Prescriptive ohne Predictive: Regression ist noch nicht tot! ROMI bei UnitymediaPrescriptive ohne Predictive: Regression ist noch nicht tot! ROMI bei Unitymedia
Prescriptive ohne Predictive: Regression ist noch nicht tot! ROMI bei Unitymedia
 
Reinforcement Learning - Learning from Experience like a Human
Reinforcement Learning - Learning from Experience like a HumanReinforcement Learning - Learning from Experience like a Human
Reinforcement Learning - Learning from Experience like a Human
 
Mindful Analytics - Wie Achtsamkeit uns noch besser macht
Mindful Analytics - Wie Achtsamkeit uns noch besser machtMindful Analytics - Wie Achtsamkeit uns noch besser macht
Mindful Analytics - Wie Achtsamkeit uns noch besser macht
 
Data Science Development with Impact
Data Science Development with ImpactData Science Development with Impact
Data Science Development with Impact
 
Predictive Analytics World for Business Deutschland 2018
Predictive Analytics World for Business Deutschland 2018Predictive Analytics World for Business Deutschland 2018
Predictive Analytics World for Business Deutschland 2018
 
Predictive Analytics World for Business Germany 2018
Predictive Analytics World for Business Germany 2018Predictive Analytics World for Business Germany 2018
Predictive Analytics World for Business Germany 2018
 
The Centrality of a Detailed Understanding of your Audience
The Centrality of a Detailed Understanding of your AudienceThe Centrality of a Detailed Understanding of your Audience
The Centrality of a Detailed Understanding of your Audience
 
Der steinige Weg zum automatisierten Data Science Produkt – Empfehlungen und ...
Der steinige Weg zum automatisierten Data Science Produkt – Empfehlungen und ...Der steinige Weg zum automatisierten Data Science Produkt – Empfehlungen und ...
Der steinige Weg zum automatisierten Data Science Produkt – Empfehlungen und ...
 
Data Alchemy
Data AlchemyData Alchemy
Data Alchemy
 
SpiegelMining – Data Science auf Spiegel Online
SpiegelMining – Data Science auf Spiegel Online SpiegelMining – Data Science auf Spiegel Online
SpiegelMining – Data Science auf Spiegel Online
 

Praxisbericht: Automatisierte Klassifikation von Stellenanzeigen für Experteer

  • 1. 1 © 2015 Glanos GmbH© 2015 Glanos GmbH Praxisbericht: Automatisierte Klassifikation von Stellenanzeigen für Experteer Gerhard Rolletschek, Glanos
  • 2. 2 © 2015 Glanos GmbH Warum das Ganze? Oder: das Ziel der Reise • Viele Stellenanzeigen aus dem Web • In unterschiedlichem Format • Ohne Metadaten Assembly Pipeline • Richtig einsortierte Stellenanzeigen • Nach Industrie, Funktion, Karrierelevel und Ort • Grundlage für erfolgreiche Suchen und Matching zu Kandidaten
  • 3. 3 © 2015 Glanos GmbH Methodische Herausforderungen im Datenmeer Stellenanzeigen Heterogenität der Stellenanzeigen • Von großen Firmen • Von mittleren und kleinen Firmen • Von Headhuntern • In mehreren Sprachen • Kulturelle Unterschiede im Arbeitsleben Unterschiedliche Indikatoren für die richtige Klassifikation • Sprachliche Varianten, z.B. von Personalverantwortung • Unterschiedliche Bedeutung eines Features in verschiedenen Branchen
  • 4. 4 © 2015 Glanos GmbH Ein kleiner Teil des Wissens ist explizit und liegt in einem Regelwerk vor (=Businesslogik) Der größere Teil liegt jedoch erstmal nicht dokumentiert vor Trainingsdaten zeigen Einflüsse, wer und wann klassifiziert hat Eingespielte Praktiken laufen teilweise gegen Businesslogiken Der Eisberg in den Trainingsdaten Eingespielte Praxis, ad-hoc-Entscheidungen, Intuition, Tagesform Explizites dokumentiertes Wissen
  • 5. 5 © 2015 Glanos GmbH In die Tiefe tauchen – und die Auswirkungen auf das Projekt Zusammenspiel in der Organisation und Kommunikation • Erfolge sind schwierig messbar, wenn die Trainingsdaten selbst zweifelhaft sind • Nachevaluation von Differenzen in der Autoklassifikation und der Trainingsmenge • Einbindung unterschiedlicher Abteilungen notwendig, um das implizite Wissen in Regeln zu transformieren Hybrid-Ansatz notwendig • Kombination aus harten Regeln, die sprachliche Varianten berücksichtigen und Machine Learning • Wichtige Business-Regeln müssen forciert werden können
  • 6. 6 © 2015 Glanos GmbH Die Autoklassifikation in der Assembly Pipeline Text Analytics-Schicht  Extraktion relevanter Phrasen und Zuordnung zu Businesslogik  Sehr hohe Präzision (>98%) durch kontrollierte Extraktion Regel-System-Schicht  Mehrstufiges Businesslogik-System auf den Ergebnissen der Text Analytics Klassifikationsschicht  Linguistisch und semantisch motivierte Feature-Extraktion  Stochastic Gradient Descent Learner für perfomantes Lernen in hoch- dimensionalen Problemen Qualitätsmanagement  Merge von Text-Analytics, Regeln und Klassifikation  Transparente/nachverfolgbare Entscheidungskriterien  Continuous integration aller Komponenten, auch der Regeln und Text Analytics
  • 7. 7 © 2015 Glanos GmbH Land in Sicht: Das Resultat  Mehr als 55% Dunkelverarbeitungsquote  Über 90% Präzision in jedem Attribut
  • 8. 8 © 2015 Glanos GmbH Eine Stellenanzeige in der Nahansicht …
  • 9. 9 © 2015 Glanos GmbH … und was daraus gemacht wird 1 1 3 4 8 7 5 5 6 2 2 6 • Bezugnahme auf Manager Soft Skills: “Leadership”, “Communication skills” • Gesucht wird ein Manager mit lang- jähriger Management-Erfahrung, der viele Mitarbeiter führt und für deren berufliche Förderung zuständig ist (career development) • Große Budgetverantwortung • Stellenbezeichnung • Industrie “Life Science” • Manager auf zweiter Organisations- ebene, der Manager führt • “Director” lässt sich nur schwer einordnen, kann viel bedeuten, muss durch Zusammenhang spezifiziert werden. • Zuständigkeit für den Bereich Verkauf 7 1 2 3 4 5 6 8
  • 10. 10 © 2015 Glanos GmbH Der Maschinenraum Frontend DataLab Glanos QM, HTML/JS/CSS, Angular Business-Logik Scala, Java, Akka, Glanos Business- Logik-Tools Linguistik Scala, Java, OpenNLP, Glanos Linguistik- Tools Storage ElasticSearch, OrientDB KonnektorenCrawler
  • 11. 11 © 2015 Glanos GmbH Mehr unter www.glanos.de www.experteer.de