SlideShare a Scribd company logo
1 of 21
BÁO CÁO KẾT THÚC
THỰC TẬP
Thực tập sinh: THÁI QUANG TIẾN
Công ty GMO-Z.COM VNLAB
NỘI DUNG
TRÌNH BÀY
1. GIỚI THIỆU BẢN THÂN
2. KAGGLE PROJECT
3. TỔNG KẾT KÌ THỰC TẬP
1. Sơ lược về bản thân
GIỚI THIỆU
BẢNTHÂNSƠ LƯỢC
• Thái Quang Tiến
• ĐH Bách Khoa Đà Nẵng, CNTT, Khóa 2015
SỞ THÍCH
• Game, nghe nhạc, tìm & thử cái mới
LĨNH VỰC
QUAN TÂM
• Low-level programming, HCI và một số lĩnh vực khác
thuộc khoa học máy tính
• NNLT thường dùng: C/C++, Java, Assembly,…
2. Kaggle Project
BÀI TOÁN
NHẬN BIẾT GIAO DỊCH LỪA ĐẢO
SỬ DỤNG HỌC MÁY
(CREDIT CARD FRAUD DETECTION USING
MACHINE LEARNING)
?
NỘIDUNG
NỘI DUNG:
Cho bộ dữ liệu gồm các giao dịch
thẻ tín dụng, mỗi giao dịch được
mô tả bởi 30 đặc trưng và được
gán nhãn 0-1 tương ứng với giao
dịch hợp pháp/không hợp pháp.
Yêu cầu viết chương trình bằng
Python sử dụng Machine Learning
để nhận biết một giao dịch có phải
là lừa đảo hay không?
PHƯƠNGPHÁP
TIẾPCẬN
PHƯƠNG PHÁP TIẾP CẬN:
•Phân tích dữ liệu
•Lập ra model sơ khai, thử nghiệm
•Đánh giá và cải tiến/thay đổi model
•Thay đổi cách tiếp cận (Supervised
Learning => Unsupervised Learning) và
thực hiện như trên
PHƯƠNGPHÁP
ĐÁNHGIÁ
&
NỀNTẢNGLẬPTRÌNH
PHƯƠNG PHÁP ĐÁNH GIÁ:
•Thông số đánh giá chính: AUPRC, Recall
•Thông số tham khảo: AUROC, Fbeta
score, Precision, Accuracy
NỀN TẢNG LẬP TRÌNH:
•Trang luyện tập phân tích dữ liệu Kaggle
•Jupyter notebook
•Python
•Sklearn, matplot, seaborn
PHÂN TÍCH
DỮ LIỆU
Kiểm tra nhận
định ban đầu
Phân tích từng
đặc trưng
Tính correlation
giữa các đặc
trưng
Xử lý đặc trưng
“Time”
TÁCH TRAIN
TEST SET
Có/không có
đặc trưng
“Time”
Chia random /
stratified với tỷ
lệ 80/20
Chia random +
Holdout CV
LẬP MODEL
Logistic
Regression
Random Forest
Tuning:
K-fold CV =>
Regularization
Param
Đánh giá với
từng thông số
Class Weight
ĐÁNH GIÁ
MODEL
MAE, Accuracy,
Fscore,
Precision/Recall
Vẽ confusion
matrix
Vẽ ROC curve và
tính AUROC
Vẽ PR curve và
tính AUPRC
TRỌNG TÂM:
AUPRC, RECALL!
TIẾP CẬN
UNSUPER-
VISED
K-Mean
clustering
Isolation Forest
Đánh giá
TRÌNH TỰ THIẾT KẾ
3. Kết quả project
ĐÃLÀMĐƯỢC
•Đã lập được kế hoạch, hướng tiếp
cận đối với bài toán mới
•Học được cơ bản cách phân tích dữ
liệu
•Áp dụng được những kiến thức đã
học được vào bài toán thực tế
•Học cách nhìn bài toán dưới nhiều
góc độ
CHƯALÀMĐƯỢC
•Kế hoạch không ổn định, hay thay
đổi
•Chưa thuần thục Python và các thư
viện liên quan, mất nhiều thời gian
để viết code
•Lý thuyết còn nhiều chỗ chưa nắm
vững
CẢI TIẾN
•Phân tích kĩ hơn dữ liệu, sử dụng
các kĩ thuật phức tạp để tiền xử lý
•Thử nghiệm thêm các model khác
(SVM, Naïve Bayes, NN,…)
•Tuning model với các kĩ thuật khác
nhau (GridSearch,
RandomSearch,…)
•Tiền xử lý dữ liệu cho bài toán
Unsupervised Learning
•Thử nghiệm các model
Unsupervised khác nhau
4. Tổng kết kì thực tập
NỘIDUNG
THỰCTẬP
•Training cơ bản: linux, vagrant,
design pattern, git, DB design
•Khóa học Machine Learning cơ bản
•Viết bài blog và thuyết trình
•Bài toán thực tế
•Luyện tập tiếng Nhật
NHỮNGĐIỀU
ĐÃHỌCĐƯỢC
•Kiến thức kỹ thuật
•Cách lập kế hoạch và duy trì nó
trong làm việc, học tập
•Cách tự nghiên cứu, tìm hiểu chủ
đề mới trong khoảng thời gian giới
hạn
•Cách trình bày những điều mình
biết đến người khác một cách hệ
thống, rõ ràng, dễ hiểu
KHÓKHĂN
•Tiếp xúc với nhiều công nghệ mới
•Giữ lịch trình, kế hoạch ổn định,
chi tiết
•Nền tảng toán học chưa chắc chắn
•Cần nắm vững một lượng lớn lý
thuyết
XINCÁMƠNMỌINGƯỜIRẤTNHIỀU!

More Related Content

What's hot

Ky nang quan ly thoi gian
Ky nang quan ly thoi gianKy nang quan ly thoi gian
Ky nang quan ly thoi gianThao Media 99
 
Quản trị dự án công nghệ thông tin
Quản trị dự án công nghệ thông tinQuản trị dự án công nghệ thông tin
Quản trị dự án công nghệ thông tinAnh Dam
 
Cau hoi trac nghiem THCB_ 1.pdf
Cau hoi trac nghiem THCB_ 1.pdfCau hoi trac nghiem THCB_ 1.pdf
Cau hoi trac nghiem THCB_ 1.pdfLMaiNhHong
 
Kỹ năng quản lý thời gian hiệu quả
Kỹ năng quản lý thời gian hiệu quảKỹ năng quản lý thời gian hiệu quả
Kỹ năng quản lý thời gian hiệu quảLê Tưởng
 
Chuong 2 lich su tu tuong quan tri
Chuong 2  lich su tu tuong quan triChuong 2  lich su tu tuong quan tri
Chuong 2 lich su tu tuong quan triTrang Kieu
 
Do an tot nghiep _ Nguyen Huu Bien
Do an tot nghiep _ Nguyen Huu BienDo an tot nghiep _ Nguyen Huu Bien
Do an tot nghiep _ Nguyen Huu Biennhbien
 
Sử Dụng Thời Gian Hiệu Quả
Sử Dụng Thời Gian Hiệu Quả Sử Dụng Thời Gian Hiệu Quả
Sử Dụng Thời Gian Hiệu Quả Nguyễn Văn Hoàng
 
Tài liệu tham khảo kỹ năng ra quyết định
Tài liệu tham khảo kỹ năng ra quyết địnhTài liệu tham khảo kỹ năng ra quyết định
Tài liệu tham khảo kỹ năng ra quyết địnhTổ chức Đào tạo PTC
 
Báo cáo đồ án môn công nghệ phần mềm
Báo cáo đồ án môn công nghệ phần mềmBáo cáo đồ án môn công nghệ phần mềm
Báo cáo đồ án môn công nghệ phần mềmRiTa15
 
TS. BÙI QUANG XUÂN . QUẢN LÝ THỜI GIAN
TS. BÙI QUANG XUÂN . QUẢN LÝ THỜI GIANTS. BÙI QUANG XUÂN . QUẢN LÝ THỜI GIAN
TS. BÙI QUANG XUÂN . QUẢN LÝ THỜI GIANBùi Quang Xuân
 
Huong dan cach viet email
Huong dan cach viet  emailHuong dan cach viet  email
Huong dan cach viet emailLynguyen_rose
 
Bài giảng Kỹ năng quản lý thời gian
Bài giảng Kỹ năng quản lý thời gianBài giảng Kỹ năng quản lý thời gian
Bài giảng Kỹ năng quản lý thời gianTâm Việt Group
 
Hướng dẫn giải bài tập chuỗi - Toán cao cấp
Hướng dẫn giải bài tập chuỗi - Toán cao cấpHướng dẫn giải bài tập chuỗi - Toán cao cấp
Hướng dẫn giải bài tập chuỗi - Toán cao cấpVan-Duyet Le
 
Khóa luận tốt nghiệp Phân tích thiết kế hệ thống thông tin quản lý ký túc xá ...
Khóa luận tốt nghiệp Phân tích thiết kế hệ thống thông tin quản lý ký túc xá ...Khóa luận tốt nghiệp Phân tích thiết kế hệ thống thông tin quản lý ký túc xá ...
Khóa luận tốt nghiệp Phân tích thiết kế hệ thống thông tin quản lý ký túc xá ...Duc Dinh
 
Ky nang xac dinh muc tieu
Ky nang xac dinh muc tieuKy nang xac dinh muc tieu
Ky nang xac dinh muc tieuThành Nguyễn
 
Kỹ năng lập và tổ chức thực hiện kế hoạch công tác của lãnh đạo cấp phòng
Kỹ năng lập và tổ chức thực hiện kế hoạch công tác của lãnh đạo cấp phòngKỹ năng lập và tổ chức thực hiện kế hoạch công tác của lãnh đạo cấp phòng
Kỹ năng lập và tổ chức thực hiện kế hoạch công tác của lãnh đạo cấp phòngjackjohn45
 
Tcp Udp
Tcp UdpTcp Udp
Tcp Udpyanhul
 

What's hot (20)

Ky nang quan ly thoi gian
Ky nang quan ly thoi gianKy nang quan ly thoi gian
Ky nang quan ly thoi gian
 
Quản trị dự án công nghệ thông tin
Quản trị dự án công nghệ thông tinQuản trị dự án công nghệ thông tin
Quản trị dự án công nghệ thông tin
 
Cau hoi trac nghiem THCB_ 1.pdf
Cau hoi trac nghiem THCB_ 1.pdfCau hoi trac nghiem THCB_ 1.pdf
Cau hoi trac nghiem THCB_ 1.pdf
 
Kỹ năng quản lý thời gian hiệu quả
Kỹ năng quản lý thời gian hiệu quảKỹ năng quản lý thời gian hiệu quả
Kỹ năng quản lý thời gian hiệu quả
 
Chuong 2 lich su tu tuong quan tri
Chuong 2  lich su tu tuong quan triChuong 2  lich su tu tuong quan tri
Chuong 2 lich su tu tuong quan tri
 
Do an tot nghiep _ Nguyen Huu Bien
Do an tot nghiep _ Nguyen Huu BienDo an tot nghiep _ Nguyen Huu Bien
Do an tot nghiep _ Nguyen Huu Bien
 
Sử Dụng Thời Gian Hiệu Quả
Sử Dụng Thời Gian Hiệu Quả Sử Dụng Thời Gian Hiệu Quả
Sử Dụng Thời Gian Hiệu Quả
 
Tài liệu tham khảo kỹ năng ra quyết định
Tài liệu tham khảo kỹ năng ra quyết địnhTài liệu tham khảo kỹ năng ra quyết định
Tài liệu tham khảo kỹ năng ra quyết định
 
Báo cáo đồ án môn công nghệ phần mềm
Báo cáo đồ án môn công nghệ phần mềmBáo cáo đồ án môn công nghệ phần mềm
Báo cáo đồ án môn công nghệ phần mềm
 
TS. BÙI QUANG XUÂN . QUẢN LÝ THỜI GIAN
TS. BÙI QUANG XUÂN . QUẢN LÝ THỜI GIANTS. BÙI QUANG XUÂN . QUẢN LÝ THỜI GIAN
TS. BÙI QUANG XUÂN . QUẢN LÝ THỜI GIAN
 
Chap9
Chap9Chap9
Chap9
 
Huong dan cach viet email
Huong dan cach viet  emailHuong dan cach viet  email
Huong dan cach viet email
 
--De cuong on tap hdh
 --De cuong on tap hdh --De cuong on tap hdh
--De cuong on tap hdh
 
Bài giảng Kỹ năng quản lý thời gian
Bài giảng Kỹ năng quản lý thời gianBài giảng Kỹ năng quản lý thời gian
Bài giảng Kỹ năng quản lý thời gian
 
Hướng dẫn giải bài tập chuỗi - Toán cao cấp
Hướng dẫn giải bài tập chuỗi - Toán cao cấpHướng dẫn giải bài tập chuỗi - Toán cao cấp
Hướng dẫn giải bài tập chuỗi - Toán cao cấp
 
Khóa luận tốt nghiệp Phân tích thiết kế hệ thống thông tin quản lý ký túc xá ...
Khóa luận tốt nghiệp Phân tích thiết kế hệ thống thông tin quản lý ký túc xá ...Khóa luận tốt nghiệp Phân tích thiết kế hệ thống thông tin quản lý ký túc xá ...
Khóa luận tốt nghiệp Phân tích thiết kế hệ thống thông tin quản lý ký túc xá ...
 
Ky nang xac dinh muc tieu
Ky nang xac dinh muc tieuKy nang xac dinh muc tieu
Ky nang xac dinh muc tieu
 
Kỹ năng lập và tổ chức thực hiện kế hoạch công tác của lãnh đạo cấp phòng
Kỹ năng lập và tổ chức thực hiện kế hoạch công tác của lãnh đạo cấp phòngKỹ năng lập và tổ chức thực hiện kế hoạch công tác của lãnh đạo cấp phòng
Kỹ năng lập và tổ chức thực hiện kế hoạch công tác của lãnh đạo cấp phòng
 
Slide mang may tinh
Slide mang may tinhSlide mang may tinh
Slide mang may tinh
 
Tcp Udp
Tcp UdpTcp Udp
Tcp Udp
 

Similar to Nhận biết giao dịch lừa đảo sử dụng học máy

bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascal
bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascalbui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascal
bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascalSP Tin K34
 
C1 introduction
C1 introductionC1 introduction
C1 introductionHồ Lợi
 
CTDL&GT_01
CTDL&GT_01CTDL&GT_01
CTDL&GT_01kikihoho
 
Bài 6: Giải bài toán trên máy tính
Bài 6: Giải bài toán trên máy tínhBài 6: Giải bài toán trên máy tính
Bài 6: Giải bài toán trên máy tínhChâu Trần
 
5 implementation
5 implementation5 implementation
5 implementationTho Da
 
Luận Văn Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...
Luận Văn  Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...Luận Văn  Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...
Luận Văn Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...sividocz
 
DCCTK45_Lập Trình HĐT.pdf
DCCTK45_Lập Trình HĐT.pdfDCCTK45_Lập Trình HĐT.pdf
DCCTK45_Lập Trình HĐT.pdftrucmt2000
 
Ke hoach bai giang
Ke hoach bai giangKe hoach bai giang
Ke hoach bai giangChau Nguyen
 
Kỹ năng xây dựng đề cương nghiên cứu.pptx
Kỹ năng xây dựng đề cương nghiên cứu.pptxKỹ năng xây dựng đề cương nghiên cứu.pptx
Kỹ năng xây dựng đề cương nghiên cứu.pptxPhamLong70
 
Kichbandayhoc
KichbandayhocKichbandayhoc
Kichbandayhocvothu123
 
Vxl Dahl 2009 05 08
Vxl Dahl 2009 05 08Vxl Dahl 2009 05 08
Vxl Dahl 2009 05 08Nguyen Chien
 
Giải bài toán trên máy tính
Giải bài toán trên máy tínhGiải bài toán trên máy tính
Giải bài toán trên máy tínhthuhoai2088
 
05_Project_management.ppt
05_Project_management.ppt05_Project_management.ppt
05_Project_management.ppttienlqtienlq
 
Quản lý dự án phần mềm dasssssssssaasdasdasd
Quản lý dự án phần mềm dasssssssssaasdasdasdQuản lý dự án phần mềm dasssssssssaasdasdasd
Quản lý dự án phần mềm dasssssssssaasdasdasdLNhtQuang11
 

Similar to Nhận biết giao dịch lừa đảo sử dụng học máy (20)

Thdc 06
Thdc 06Thdc 06
Thdc 06
 
bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascal
bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascalbui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascal
bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascal
 
C1 introduction
C1 introductionC1 introduction
C1 introduction
 
C1 introduction
C1 introductionC1 introduction
C1 introduction
 
Đề tài: Công cụ sinh dữ liệu thử tự động cho chương trình Java
Đề tài: Công cụ sinh dữ liệu thử tự động cho chương trình JavaĐề tài: Công cụ sinh dữ liệu thử tự động cho chương trình Java
Đề tài: Công cụ sinh dữ liệu thử tự động cho chương trình Java
 
Xây Dựng Công Cụ Sinh Dữ Liệu Thử Tự Động Cho Chương Trình Java.doc
Xây Dựng Công Cụ Sinh Dữ Liệu Thử Tự Động Cho Chương Trình Java.docXây Dựng Công Cụ Sinh Dữ Liệu Thử Tự Động Cho Chương Trình Java.doc
Xây Dựng Công Cụ Sinh Dữ Liệu Thử Tự Động Cho Chương Trình Java.doc
 
Emailing buoi 2 thuat toan
Emailing buoi 2   thuat toanEmailing buoi 2   thuat toan
Emailing buoi 2 thuat toan
 
CTDL&GT_01
CTDL&GT_01CTDL&GT_01
CTDL&GT_01
 
Bài 6: Giải bài toán trên máy tính
Bài 6: Giải bài toán trên máy tínhBài 6: Giải bài toán trên máy tính
Bài 6: Giải bài toán trên máy tính
 
5 implementation
5 implementation5 implementation
5 implementation
 
Luận Văn Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...
Luận Văn  Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...Luận Văn  Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...
Luận Văn Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...
 
chương1.pdf
chương1.pdfchương1.pdf
chương1.pdf
 
DCCTK45_Lập Trình HĐT.pdf
DCCTK45_Lập Trình HĐT.pdfDCCTK45_Lập Trình HĐT.pdf
DCCTK45_Lập Trình HĐT.pdf
 
Ke hoach bai giang
Ke hoach bai giangKe hoach bai giang
Ke hoach bai giang
 
Kỹ năng xây dựng đề cương nghiên cứu.pptx
Kỹ năng xây dựng đề cương nghiên cứu.pptxKỹ năng xây dựng đề cương nghiên cứu.pptx
Kỹ năng xây dựng đề cương nghiên cứu.pptx
 
Kichbandayhoc
KichbandayhocKichbandayhoc
Kichbandayhoc
 
Vxl Dahl 2009 05 08
Vxl Dahl 2009 05 08Vxl Dahl 2009 05 08
Vxl Dahl 2009 05 08
 
Giải bài toán trên máy tính
Giải bài toán trên máy tínhGiải bài toán trên máy tính
Giải bài toán trên máy tính
 
05_Project_management.ppt
05_Project_management.ppt05_Project_management.ppt
05_Project_management.ppt
 
Quản lý dự án phần mềm dasssssssssaasdasdasd
Quản lý dự án phần mềm dasssssssssaasdasdasdQuản lý dự án phần mềm dasssssssssaasdasdasd
Quản lý dự án phần mềm dasssssssssaasdasdasd
 

More from GMO-Z.com Vietnam Lab Center

高負荷に耐えうるWebApplication Serverの作り方
高負荷に耐えうるWebApplication Serverの作り方高負荷に耐えうるWebApplication Serverの作り方
高負荷に耐えうるWebApplication Serverの作り方GMO-Z.com Vietnam Lab Center
 
Phương pháp và chiến lược đối ứng tải trong Web Application Server
Phương pháp và chiến lược đối ứng tải trong Web Application ServerPhương pháp và chiến lược đối ứng tải trong Web Application Server
Phương pháp và chiến lược đối ứng tải trong Web Application ServerGMO-Z.com Vietnam Lab Center
 
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...GMO-Z.com Vietnam Lab Center
 
Tìm hiểu và triển khai ứng dụng Web với Kubernetes
Tìm hiểu và triển khai ứng dụng Web với KubernetesTìm hiểu và triển khai ứng dụng Web với Kubernetes
Tìm hiểu và triển khai ứng dụng Web với KubernetesGMO-Z.com Vietnam Lab Center
 
Xây dựng hệ thống quản lý sân bóng sử dụng Yii Framework
Xây dựng hệ thống quản lý sân bóng sử dụng Yii FrameworkXây dựng hệ thống quản lý sân bóng sử dụng Yii Framework
Xây dựng hệ thống quản lý sân bóng sử dụng Yii FrameworkGMO-Z.com Vietnam Lab Center
 
Hệ thống giám sát nhận diện khuôn mặt
Hệ thống giám sát nhận diện khuôn mặtHệ thống giám sát nhận diện khuôn mặt
Hệ thống giám sát nhận diện khuôn mặtGMO-Z.com Vietnam Lab Center
 
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụng
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụngBlockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụng
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụngGMO-Z.com Vietnam Lab Center
 
Giới thiệu docker và ứng dụng trong ci-cd
Giới thiệu docker và ứng dụng trong ci-cdGiới thiệu docker và ứng dụng trong ci-cd
Giới thiệu docker và ứng dụng trong ci-cdGMO-Z.com Vietnam Lab Center
 
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab Center
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab CenterTài liệu giới thiệu công ty GMO-Z.com Vietnam Lab Center
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab CenterGMO-Z.com Vietnam Lab Center
 
Create android app can send SMS and Email by React Natice
Create android app can send SMS and Email by React NaticeCreate android app can send SMS and Email by React Natice
Create android app can send SMS and Email by React NaticeGMO-Z.com Vietnam Lab Center
 

More from GMO-Z.com Vietnam Lab Center (20)

高負荷に耐えうるWebApplication Serverの作り方
高負荷に耐えうるWebApplication Serverの作り方高負荷に耐えうるWebApplication Serverの作り方
高負荷に耐えうるWebApplication Serverの作り方
 
Phương pháp và chiến lược đối ứng tải trong Web Application Server
Phương pháp và chiến lược đối ứng tải trong Web Application ServerPhương pháp và chiến lược đối ứng tải trong Web Application Server
Phương pháp và chiến lược đối ứng tải trong Web Application Server
 
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...
 
Tìm hiểu và triển khai ứng dụng Web với Kubernetes
Tìm hiểu và triển khai ứng dụng Web với KubernetesTìm hiểu và triển khai ứng dụng Web với Kubernetes
Tìm hiểu và triển khai ứng dụng Web với Kubernetes
 
Xây dựng hệ thống quản lý sân bóng sử dụng Yii Framework
Xây dựng hệ thống quản lý sân bóng sử dụng Yii FrameworkXây dựng hệ thống quản lý sân bóng sử dụng Yii Framework
Xây dựng hệ thống quản lý sân bóng sử dụng Yii Framework
 
Hệ thống giám sát nhận diện khuôn mặt
Hệ thống giám sát nhận diện khuôn mặtHệ thống giám sát nhận diện khuôn mặt
Hệ thống giám sát nhận diện khuôn mặt
 
Image Style Transfer
Image Style TransferImage Style Transfer
Image Style Transfer
 
Optimizing MySQL queries
Optimizing MySQL queriesOptimizing MySQL queries
Optimizing MySQL queries
 
Surveillance on slam technology
Surveillance on slam technologySurveillance on slam technology
Surveillance on slam technology
 
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụng
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụngBlockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụng
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụng
 
Giới thiệu Embulk
Giới thiệu Embulk Giới thiệu Embulk
Giới thiệu Embulk
 
Giới thiệu docker và ứng dụng trong ci-cd
Giới thiệu docker và ứng dụng trong ci-cdGiới thiệu docker và ứng dụng trong ci-cd
Giới thiệu docker và ứng dụng trong ci-cd
 
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab Center
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab CenterTài liệu giới thiệu công ty GMO-Z.com Vietnam Lab Center
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab Center
 
Chia se Agile
Chia se AgileChia se Agile
Chia se Agile
 
Agile retrospective
Agile retrospectiveAgile retrospective
Agile retrospective
 
Giới thiệu Agile + Scrum
Giới thiệu Agile + ScrumGiới thiệu Agile + Scrum
Giới thiệu Agile + Scrum
 
Create android app can send SMS and Email by React Natice
Create android app can send SMS and Email by React NaticeCreate android app can send SMS and Email by React Natice
Create android app can send SMS and Email by React Natice
 
Introduce React Native
Introduce React NativeIntroduce React Native
Introduce React Native
 
Spark tuning
Spark tuningSpark tuning
Spark tuning
 
Git in real product
Git in real productGit in real product
Git in real product
 

Nhận biết giao dịch lừa đảo sử dụng học máy

  • 1. BÁO CÁO KẾT THÚC THỰC TẬP Thực tập sinh: THÁI QUANG TIẾN Công ty GMO-Z.COM VNLAB
  • 2. NỘI DUNG TRÌNH BÀY 1. GIỚI THIỆU BẢN THÂN 2. KAGGLE PROJECT 3. TỔNG KẾT KÌ THỰC TẬP
  • 3. 1. Sơ lược về bản thân
  • 4. GIỚI THIỆU BẢNTHÂNSƠ LƯỢC • Thái Quang Tiến • ĐH Bách Khoa Đà Nẵng, CNTT, Khóa 2015 SỞ THÍCH • Game, nghe nhạc, tìm & thử cái mới LĨNH VỰC QUAN TÂM • Low-level programming, HCI và một số lĩnh vực khác thuộc khoa học máy tính • NNLT thường dùng: C/C++, Java, Assembly,…
  • 6. BÀI TOÁN NHẬN BIẾT GIAO DỊCH LỪA ĐẢO SỬ DỤNG HỌC MÁY (CREDIT CARD FRAUD DETECTION USING MACHINE LEARNING) ?
  • 7. NỘIDUNG NỘI DUNG: Cho bộ dữ liệu gồm các giao dịch thẻ tín dụng, mỗi giao dịch được mô tả bởi 30 đặc trưng và được gán nhãn 0-1 tương ứng với giao dịch hợp pháp/không hợp pháp. Yêu cầu viết chương trình bằng Python sử dụng Machine Learning để nhận biết một giao dịch có phải là lừa đảo hay không?
  • 8. PHƯƠNGPHÁP TIẾPCẬN PHƯƠNG PHÁP TIẾP CẬN: •Phân tích dữ liệu •Lập ra model sơ khai, thử nghiệm •Đánh giá và cải tiến/thay đổi model •Thay đổi cách tiếp cận (Supervised Learning => Unsupervised Learning) và thực hiện như trên
  • 9. PHƯƠNGPHÁP ĐÁNHGIÁ & NỀNTẢNGLẬPTRÌNH PHƯƠNG PHÁP ĐÁNH GIÁ: •Thông số đánh giá chính: AUPRC, Recall •Thông số tham khảo: AUROC, Fbeta score, Precision, Accuracy NỀN TẢNG LẬP TRÌNH: •Trang luyện tập phân tích dữ liệu Kaggle •Jupyter notebook •Python •Sklearn, matplot, seaborn
  • 10.
  • 11.
  • 12. PHÂN TÍCH DỮ LIỆU Kiểm tra nhận định ban đầu Phân tích từng đặc trưng Tính correlation giữa các đặc trưng Xử lý đặc trưng “Time” TÁCH TRAIN TEST SET Có/không có đặc trưng “Time” Chia random / stratified với tỷ lệ 80/20 Chia random + Holdout CV LẬP MODEL Logistic Regression Random Forest Tuning: K-fold CV => Regularization Param Đánh giá với từng thông số Class Weight ĐÁNH GIÁ MODEL MAE, Accuracy, Fscore, Precision/Recall Vẽ confusion matrix Vẽ ROC curve và tính AUROC Vẽ PR curve và tính AUPRC TRỌNG TÂM: AUPRC, RECALL! TIẾP CẬN UNSUPER- VISED K-Mean clustering Isolation Forest Đánh giá TRÌNH TỰ THIẾT KẾ
  • 13. 3. Kết quả project
  • 14. ĐÃLÀMĐƯỢC •Đã lập được kế hoạch, hướng tiếp cận đối với bài toán mới •Học được cơ bản cách phân tích dữ liệu •Áp dụng được những kiến thức đã học được vào bài toán thực tế •Học cách nhìn bài toán dưới nhiều góc độ
  • 15. CHƯALÀMĐƯỢC •Kế hoạch không ổn định, hay thay đổi •Chưa thuần thục Python và các thư viện liên quan, mất nhiều thời gian để viết code •Lý thuyết còn nhiều chỗ chưa nắm vững
  • 16. CẢI TIẾN •Phân tích kĩ hơn dữ liệu, sử dụng các kĩ thuật phức tạp để tiền xử lý •Thử nghiệm thêm các model khác (SVM, Naïve Bayes, NN,…) •Tuning model với các kĩ thuật khác nhau (GridSearch, RandomSearch,…) •Tiền xử lý dữ liệu cho bài toán Unsupervised Learning •Thử nghiệm các model Unsupervised khác nhau
  • 17. 4. Tổng kết kì thực tập
  • 18. NỘIDUNG THỰCTẬP •Training cơ bản: linux, vagrant, design pattern, git, DB design •Khóa học Machine Learning cơ bản •Viết bài blog và thuyết trình •Bài toán thực tế •Luyện tập tiếng Nhật
  • 19. NHỮNGĐIỀU ĐÃHỌCĐƯỢC •Kiến thức kỹ thuật •Cách lập kế hoạch và duy trì nó trong làm việc, học tập •Cách tự nghiên cứu, tìm hiểu chủ đề mới trong khoảng thời gian giới hạn •Cách trình bày những điều mình biết đến người khác một cách hệ thống, rõ ràng, dễ hiểu
  • 20. KHÓKHĂN •Tiếp xúc với nhiều công nghệ mới •Giữ lịch trình, kế hoạch ổn định, chi tiết •Nền tảng toán học chưa chắc chắn •Cần nắm vững một lượng lớn lý thuyết