SlideShare a Scribd company logo
1 of 25
Download to read offline
Jak dzięki Data Mining księgujemy
automatycznie koszty w inFakt.pl ?
Kraków, 20 października 2016
O mnie
Sebastian Bobrowski, CTO, co-founder inFakt.pl
O inFakt
InFakt.pl
• 3 produkty:
• program do faktur
• program do księgowości
• ogólnopolskie Biuro Rachunkowe
• 400 000 użytkowników
• 9 lat
Dlaczego AI?
Założenia
Księgowy ma bardzo powtarzalną pracę
Ludzie popełniają błędy
Szybkość księgowania
Założenia
Cele:
przyśpieszyć pracę księgowego
zautomatyzować
zmniejszyć ilość błędów
Założenia
Bazujemy na danych na fakturach (NIP)
Mamy kilka mln danych uczących
Machine Learning
4 klasyfikatowy:
Passive Aggressive
Perceptron
Stochastic Gradient Descent
Naive Bayes for multivariate Bernoulli
Machine Learning
Wyniki:
15% skuteczności
95% poprawności
Memory Base Model
XClassifier
Memory Base Model
Memory Base Model
Wyniki:
55% skuteczności
97,5% poprawności
Memory Base Model Błędy
10% - obie decyzje poprawne
15% błąd Xclassifier
75% błąd księgowego
Czego się nauczyłem?
Czego się nauczyłem
Dobranie cech jest kluczowe
Czego się nauczyłem
Prosta implementacja na początek
Czego się nauczyłem
Szybko na produkcji
Czego się nauczyłem
Ludzie się mylą częściej niż niedoskonały algorytm
Co dalej?
Model globalny - wyniki
Analiza tekstu
Model globalny - wyniki
Analiza PKD
Model globalny - wyniki
Szukanie anomalii (kwot, dat)
Open source
Open Source
infakt.com
Pytania?
Kontakt
Sebastian Bobrowski
CTO
e-mail: sebastian.bobrowski@infakt.pl
mobile.:+48 508 457 847

More Related Content

Similar to AIMeetup #2: Jak dzięki Data Mining księgujemy automatycznie koszty w Infakt.pl?

Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
byteLAKE
 

Similar to AIMeetup #2: Jak dzięki Data Mining księgujemy automatycznie koszty w Infakt.pl? (20)

semKRK #13 - Aneta i Dawid Krystosik
semKRK #13 - Aneta i Dawid KrystosiksemKRK #13 - Aneta i Dawid Krystosik
semKRK #13 - Aneta i Dawid Krystosik
 
Dane a analizy, czyli jak efektywnie mierzyć używalność witryny
Dane a analizy, czyli jak efektywnie mierzyć używalność witrynyDane a analizy, czyli jak efektywnie mierzyć używalność witryny
Dane a analizy, czyli jak efektywnie mierzyć używalność witryny
 
11 sposobów na zwiększenie konwersji na stronie internetowej
11 sposobów na zwiększenie konwersji na stronie internetowej11 sposobów na zwiększenie konwersji na stronie internetowej
11 sposobów na zwiększenie konwersji na stronie internetowej
 
Wykorzystanie danych z systemów analitycznych w sprzedaży online
Wykorzystanie danych z systemów analitycznych w sprzedaży onlineWykorzystanie danych z systemów analitycznych w sprzedaży online
Wykorzystanie danych z systemów analitycznych w sprzedaży online
 
Landingi webinar 11.02.2015
Landingi webinar 11.02.2015Landingi webinar 11.02.2015
Landingi webinar 11.02.2015
 
Benchmarking i consumer insight jako podstawa optymalizacji konwersji na stro...
Benchmarking i consumer insight jako podstawa optymalizacji konwersji na stro...Benchmarking i consumer insight jako podstawa optymalizacji konwersji na stro...
Benchmarking i consumer insight jako podstawa optymalizacji konwersji na stro...
 
Analityka internetowa
Analityka internetowaAnalityka internetowa
Analityka internetowa
 
Analityka w startupie - dlaczego musisz o niej pamiętać od samego początku? -...
Analityka w startupie - dlaczego musisz o niej pamiętać od samego początku? -...Analityka w startupie - dlaczego musisz o niej pamiętać od samego początku? -...
Analityka w startupie - dlaczego musisz o niej pamiętać od samego początku? -...
 
The Lean Startup w Divante
The Lean Startup w DivanteThe Lean Startup w Divante
The Lean Startup w Divante
 
Jak efektywnie pracować z pulpitami cash flow?
Jak efektywnie pracować z pulpitami cash flow?Jak efektywnie pracować z pulpitami cash flow?
Jak efektywnie pracować z pulpitami cash flow?
 
Raport Deloitte: Inteligentna automatyzacja 2019
Raport Deloitte: Inteligentna automatyzacja 2019Raport Deloitte: Inteligentna automatyzacja 2019
Raport Deloitte: Inteligentna automatyzacja 2019
 
Analityka internetowa 5 kroków jak ją wdrożyć w firmie
Analityka internetowa   5 kroków jak ją wdrożyć w firmieAnalityka internetowa   5 kroków jak ją wdrożyć w firmie
Analityka internetowa 5 kroków jak ją wdrożyć w firmie
 
Clv Kogo pozyskujesz klienta czy jego transakcje
Clv Kogo pozyskujesz klienta czy jego transakcjeClv Kogo pozyskujesz klienta czy jego transakcje
Clv Kogo pozyskujesz klienta czy jego transakcje
 
Kupuj wartosc a nie transakcje
Kupuj wartosc a nie transakcjeKupuj wartosc a nie transakcje
Kupuj wartosc a nie transakcje
 
Metody ratowania koszyków zakupowych
Metody ratowania koszyków zakupowychMetody ratowania koszyków zakupowych
Metody ratowania koszyków zakupowych
 
Metody ratowania koszyków zakupowych 31.03
Metody ratowania koszyków zakupowych 31.03Metody ratowania koszyków zakupowych 31.03
Metody ratowania koszyków zakupowych 31.03
 
Metody ratowania koszyków zakupowych 31.03.2016
Metody ratowania koszyków zakupowych 31.03.2016Metody ratowania koszyków zakupowych 31.03.2016
Metody ratowania koszyków zakupowych 31.03.2016
 
Case study: Jak zorganizować magazyn? 200 a 2000 paczek. Paweł Fornalski
Case study: Jak zorganizować magazyn? 200 a 2000 paczek. Paweł FornalskiCase study: Jak zorganizować magazyn? 200 a 2000 paczek. Paweł Fornalski
Case study: Jak zorganizować magazyn? 200 a 2000 paczek. Paweł Fornalski
 
Grow with Google Partners - optAd360
Grow with Google Partners - optAd360Grow with Google Partners - optAd360
Grow with Google Partners - optAd360
 
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
 

More from 2040.io

More from 2040.io (12)

Jak budujemy inteligentnego asystenta biznesowego
Jak budujemy inteligentnego asystenta biznesowegoJak budujemy inteligentnego asystenta biznesowego
Jak budujemy inteligentnego asystenta biznesowego
 
Obsługa klienta z wykorzystaniem sztucznej inteligencji
Obsługa klienta z wykorzystaniem sztucznej inteligencjiObsługa klienta z wykorzystaniem sztucznej inteligencji
Obsługa klienta z wykorzystaniem sztucznej inteligencji
 
Jak AI pozwala nam usłyszeć głos klienta
Jak AI pozwala nam usłyszeć głos klientaJak AI pozwala nam usłyszeć głos klienta
Jak AI pozwala nam usłyszeć głos klienta
 
Wyzwania związane z modelowaniem mobilnych systemów świadomych kontekstu
Wyzwania związane z modelowaniem mobilnych systemów świadomych kontekstuWyzwania związane z modelowaniem mobilnych systemów świadomych kontekstu
Wyzwania związane z modelowaniem mobilnych systemów świadomych kontekstu
 
Rozpoznawanie mowy: problem rozwiązany?
Rozpoznawanie mowy: problem rozwiązany?Rozpoznawanie mowy: problem rozwiązany?
Rozpoznawanie mowy: problem rozwiązany?
 
Czy Deep Learning działa?
Czy Deep Learning działa?Czy Deep Learning działa?
Czy Deep Learning działa?
 
Analiza semantyczna zasosowana w środowisku Menerva
Analiza semantyczna zasosowana w środowisku MenervaAnaliza semantyczna zasosowana w środowisku Menerva
Analiza semantyczna zasosowana w środowisku Menerva
 
Time-series prediction with neural networks
Time-series prediction with neural networksTime-series prediction with neural networks
Time-series prediction with neural networks
 
Ai meetup Neural machine translation updated
Ai meetup Neural machine translation updatedAi meetup Neural machine translation updated
Ai meetup Neural machine translation updated
 
AIMeetup #4: Neural-machine-translation
AIMeetup #4: Neural-machine-translationAIMeetup #4: Neural-machine-translation
AIMeetup #4: Neural-machine-translation
 
AIMeetup #4: Artificial intelligence and economics
AIMeetup #4: Artificial intelligence and economicsAIMeetup #4: Artificial intelligence and economics
AIMeetup #4: Artificial intelligence and economics
 
AIMeetup #4: Let’s compete with machine! edrone crm
AIMeetup #4: Let’s compete with machine! edrone crmAIMeetup #4: Let’s compete with machine! edrone crm
AIMeetup #4: Let’s compete with machine! edrone crm
 

AIMeetup #2: Jak dzięki Data Mining księgujemy automatycznie koszty w Infakt.pl?