Ngày 1/8/2019 tại Khoa Quốc tế - Đại học Quốc gia Hà Nội, GS.TSKH. Hồ Tú Bảo đã trình bày seminar với tiêu đề: Giới thiệu tổng quan về phân tích dữ liệu và phân tích dữ liệu trong kinh doanh.
Tại đây, giáo sư đã chia sẻ các khái niệm cốt lõi của khoa học dữ liệu, phân tích dữ liệu trong kinh doanh - một lĩnh vực đang tạo nên cuộc cách mạng số hóa; chiến lược của các quốc gia và thảo luận hướng đi phù hợp cho Việt Nam trong thời đại chuyển đổi số.
5. To be or not to be?
5
• Kodak: 1999 thu 8 tỷ USD nhờ 21.6 tỷ bức ảnh
(Vốn: 20.9 tỷ USD với 83,000 nhân viên).
• Instagram: 2013 có 21.9 tỷ bức ảnh với 0 USD
(2012: thu 1 tỷ USD với12 nhân viên)
Kodak
Android vs. Symbian
Hotel vs. Airbnb
Brian Chesky and Joe Gebbia (2007). Nathan Bleccharczyk (2008)
6. Digital transformation – Chuyển đổi số
Chuyển đổi số là việc sử dụng dữ liệu và công nghệ số để thay đổi tổng thể
và toàn diện phương thức phát triển, thay đổi cách sống và cách làm việc, làm
cuộc sống của con người tốt đẹp hơn.
6
Digitization Digitalization Transformation
(số hoá thông tin) (số hoá tổ chức) (chuyển đổi)
Tạo ra biểu diễn
số của các đối
tượng vật lý
Digitization
Chuyển đổi hoặc sáng tạo mô
hình kinh doanh/hoạt động với
dữ liệu và công nghệ số
Digitalization
Chuyển đổi toàn diện tổ chức:
từ tư duy, mô hình, lãnh đạo,
văn hóa đến các hoạt động.
Transformation
https://www.i-scoop.eu/digitization-digitalization-digital-transformation-disruption/
7. Digital Transformation
7
socio-economic life Số hoá thông tin
Số hoá tổ chức
KINH TẾ SỐ
Chuyển đổi số là việc sử dụng dữ liệu và công nghệ số để thay đổi tổng thể
và toàn diện phương thức phát triển, thay đổi cách sống và cách làm việc,
làm cuộc sống của con người tốt đẹp hơn.
Công nghệ số
Thay đổi tổng thể và toàn diện mọi
khía cạnh của đời sống kinh tế-xã hội
CHÍNH PHỦ SỐ XÃ HỘI SỐ
8. Digitization: Số hoá thông tin
8
Tạo ra biểu diễn
số của các đối
tượng vật lý
Số hoá thông tin
Số hoá trái đất
Số hoá văn bản Con người được số hoá
Số hoá các tương tác của con người
9. Digitalization: Số hoá tổ chức
Business model innovation – Đổi mới sáng tạo mô hình kinh
doanh
9
Lúc đầu, Google không có mô hình kinh
doanh cụ thể, hoạt động không lợi
nhuận, kiếm được chút lợi nhuận nhờ
bán công cụ tìm kiếm. Năm 2003, công
ty tung ra AdWords cho phép các
doanh nghiệp mua quảng cáo khi mọi
người tìm kiếm trên Google.com. Năm
2008, Google tạo được doanh thu 21 tỉ
đô-la chỉ từ quảng cáo.
1993-1997:Apple vật lộn để có
được doanh thu ổn định (máy
ảnh số máy nghe CD hay TV
đều thất bại). Năm 1997, Steve
Jobs quay lại vị trí CEO, làm dòng sản
phẩm điện tử đẹp mắt, bắt đầu từ iMac,
iPod (bán hơn 100 triệu sản phẩm trong
vòng 6 năm từ 2001), iPhone...
https://quantrimang.com/6-ong-lon-thanh-cong-nho-thay-doi-mo-hinh-kinh-doanh-124459
• Sở hữu lô đất vườn có sổ đỏ
• Mua lại với giá 124% (nếu không chuyển
được mục đích sử dụng đất sau 3 năm)
• 15kg rau sạch/tháng trồng trên mảnh
• 15 đêm nghỉ dưỡng tại resort cao cấp
Chuyển đổi hoặc sáng tạo mô hình
kinh doanh/hoạt động với dữ liệu
và công nghệ số
Số hoá tổ chức
10. 10
Bách khoa toàn thư
xuất bản lần đầu 1771
40 triệu từ cho ~500 nghìn chủ đề,
100 nhà biên tập và 4 nghìn nhà
chuyên môn tham gia viết
Ngừng phát hành bản in
12.3.2012 sau 244 năm.
20 năm
chuyển
đổi số
Kiên trì giá trị cốt
lõi: chất lượng biên
tập nội dung và
dịch vụ giáo dục.
Digitalization: Số hoá tổ chức
Business model innovation – Đổi mới sáng tạo mô hình kinh
doanh
Chuyển đổi hoặc sáng tạo mô hình
kinh doanh/hoạt động với dữ liệu
và công nghệ số
Số hoá tổ chức
12. Kinh tế số – Digital economy
“Nền kinh tế vận hành chủ yếu dựa trên công nghệ số”,
đặc biệt là các giao dịch điện tử qua Internet.
12
13. Chính phủ điện tử và chính phủ số
13
• Dịch vụ trực tuyến
• Websites đa dạng
• Gắn sự kiện cuộc sống
• Tái thiết lập văn phòng
• Minh bạch, tham gia,
hợp tác
• Cam kết cộng đồng
• Bền vững
• Chi phí hợp lý
• Vượt qua hạn chế cũ
Source: Gartner
Tin học hoá bộ máy hành chính
tập trung vào dịch vụ công.
Khai thác dữ liệu, nhằm vào đổi
mới sáng tạo bộ máy hành chính,
làm nền tảng cho KTS & XHS
14. Xã hội số (Society 5.0)
Một xã hội lấy con người làm trung tâm, cân bằng tiến bộ kinh tế với việc giải
quyết các vấn đề xã hội bằng việc áp dụng và tích hợp công nghệ số tại nhà ở,
nơi làm việc, giáo dục và giải trí ...
14
Khám bệnh dự phòng
Robot hỗ trợ chăm sóc sức khoẻ
Đa dạng hoá năng lượng
Sản xuất tại địa phương
Tự động ghoá sản xuất nông nghiệp
Tối ưu việc giao hàng tận nhà
Tối ưu chuỗi giá trị
Sản xuất tự động với robots
Tăng cao tuổi thọ
Giảm chi phí xã hội
Cung cấp năng lượng ổn định
Giảm thiểu hiệu ứng nhà kính
Tăng cường sản xuất thực phẩm
Giảm rác thải
Khuyến khích công nghiệp hoá bền vững
GiHạn chế thiếu hụt lao động thủ công
https://www8.cao.go.jp/cstp/english/society5_0/index.html
15. CMCN, chuyển đổi số và AI
Sản xuất
nông nghiệp
Sản xuất
cơ khí
Sản xuất
tự động
Sản xuất
thông minh
CMCN1
Động cơ hơi nước
CMCN4
Công nghệ số, AI
CMCN2
Năng lượng điện
CMCN3
Máy tính, internet
Sảnphẩm
Thời gian
Sản xuất
hàng loạt
15
16. CMCN, chuyển đổi số và AI
Sản xuất
nông nghiệp
Sản xuất
cơ khí
Sản xuất
tự động
Sản xuất
thông minh
CMCN1
Động cơ hơi nước
CMCN4
Công nghệ số, AI
CMCN2
Năng lượng điện
CMCN3
Máy tính, internet
Sảnphẩm
Thời gian
Sản xuất
hàng loạt
16
17. 17
§ Điện toán đám mây:
Môi trường
§ Internet vạn vật:
Huyết mạch
§ Block chain:
Đồng thuận và
bất biến dữ liệu
§ Trí tuệ nhân tạo:
Chức năng thông minh
§ Dữ liệu lớn:
Năng lượng
§ Khoa học dữ liệu:
“Bộ não” phân tích dữ liệu
để hỗ trợ đưa ra quyết định.
Các đột phá xảy ra đồng thời dẫn đến thay đổi lớn
Đột phá của công nghệ số
Big data
(kích thước rất
lớn và phức tạp)
Internet of thing
(thu nhận và trao đổi dữ liệu)
Artificial
intelligence
(các chức năng
thông minh)
Cloud computing
(dịch vụ lưu trữ và tính toán)
Block chain
(đồng thuận và bất
biến dữ liệu)
Data
Science
18. Nội dung
1. Chuyển đổi số
2. Khoa học dữ liệu
3. Khoa học dữ liệu trong kinh tế số
18
19. Data science – Khoa học dữ liệu
KIẾN THỨC
CHUYÊN NGÀNH
KHOA HỌC
MÁY TÍNH
TOÁN &
THỐNG KÊ
DATA
SCIENCE
XỬ LÝ
DỮ LIỆU
NGHIÊN CỨU
THỐNG KÊ
HỌC MÁY
“In God we trust.
All others bring
data”.
“Ta tin Thượng đế.
Ngoài ra, là dữ
liệu”.
W.E. Deming
... là công cụ lao động cốt yếu trong thời chuyển đổi số
Khoa học về phân tích dữ liệu
“We cannot solve problems
by using the same kind of
thinking we used when we
created them”
Ta không thể giải quyết các
vấn đề với chính cách nghĩ ta
đã dùng khi đặt vấn đề
Albert Einstein
20. Một lược đồ của khoa học dữ liệu
20
Doanh nghiệp, Bộ ngành, Địa phương... Cảm biến Di dộng Web …….
XÂY DỰNG
QUẢN TRỊ
PHÂN TÍCH
Semi-structured/un-structure data extraction …….
Các hệ
phân tán
Tính toán
song song
CSDL
Làm sạch dữ liệu
An toàn dữ
liệu
…….
HỌC MÁY &
KHAI PHÁ DỮ LIỆUTHỐNG KÊ
Trình duyệt Thiết bị di động Hỗ trợ khách hàng
HIỂN THỊ Tag cloud Clustergram Spatial information flowHistory flow
Dịch vụ
Web Cơ sở tri thức MQ, JMS, Sockers
TRỰC TIẾP ĐẾN CON NGƯỜI TRỰC TIẾP ĐẾN MÁY MÓC
NGUỒN DỮ LIỆU
QUẢN TRỊ
DỮ LIỆU
PHÂN TÍCH
DỮ LIỆU
TRUY NHẬP
CHUYỂN KẾT QUẢ
SỬ DỤNG
KẾT QUẢ
Source: WAMDM, Web group
21. Dữ liệu được thu thập thế nào?
§ Quan sát, đo đạc, hoặc thu thập các giá trị của thuộc tính (features,
attributes, properties, variables) của các đối tượng được khảo sát.
§ Hai cách thu thập dữ liệu
Lấy mẫu
ngẫu nhiên
Thu thập mọi
dữ liệu có thể
Trong thống kê cổ điển, lấy mẫu thu
dữ liệu khi đã có mục tiêu, có câu
hỏi cần trả lời, dữ liệu thường có
kích thước nhỏ.
Rất nhiều kỹ thuật thống kê đa
biến đuợc phát triển để giải các
bài toán kích thước lớn và phức
tạp.
21
22. Thống kê một biến (univariate statistics)
n Thống kê cung cấp các phương pháp và kỹ thuật toán học để
phân tích, khái quát hóa và quyết định từ dữ liệu.
n Nội dung chính (cổ điển)
q Thống kê mô tả: Phân bố xác suất…
q Thống kê suy diễn: Ước lượng và kiểm định giá thiết
n Dữ liệu thực nghiệm và quan sát
q Dữ liệu thống kê thường được thu thập để trả lời các câu hỏi
định trước (thiết kế thí nghiệm, thiết kế khảo sát)
q Chủ yếu là dữ liệu số
n Các phương pháp đã được phát triển trước khi có máy tính và cho
các tập dữ liệu nhỏ, để phân tích một biến ngẫu nhiên duy nhất.
22
23. Phân tích dữ liệu nhiều biến
n Phương pháp phân tích dữ liệu truyền thống được tạo ra cho các
bộ dữ liệu với kích thước nhỏ hoặc trung bình và khi máy tính vẫn
còn yếu.
n Phân tích dữ liệu nhiều biến đang thay đổi nhanh chóng do các kỹ
thuật tính toán nhanh và hiệu quả. Nhiều phương pháp mới được
phát triển để xử lý các bài toán quy mô lớn (Pagerank của Google
hoạt động với ma trận nhiều tỷ chiều).
November 2016: Sunway TaihuLight
93,014 TFlops, 10,649,600 cores
November 2016: Cray XK7 Titan computer,
17,590 TFlops, 560640 processors.
23
24. Machine learning
24
(Source: Eric Xing lecture)
§ Mục đích của học máy là xây dựng các hệ máy
tính có khả năng học tập như con người.
§ Given
o { 𝒙", 𝑦" }, 𝒙" is description of an object in
some space, 𝑦" ∈ {C),C*,…,C+} or 𝑦" ∈ ℝ
is viewed as label of 𝒙", 𝑖 = 1, … , 𝑛.
o Examples: Set of electronic medical records.
• Find
o Function 𝑝 𝑦 𝒙) for labeled data and 𝑝 𝒙
for unlabeled data.
o Diagnosis or treatment regimen for a patient.
26. Sự phát triển của học máy
1949 1956 1958 1968 1970 1972 1982 1986 1990 19971941 1960 1970 1980 1990 2000 20171950
Neural modeling
Pattern Recognition emerged
Rote learning
Minsky criticism
Symbolic concept induction
Math discovery AM
Supervised learning
Unsupervised learning
PAC learning
ICML (1982)
NN, GA, EBL, CBL
Experimental comparisons
Revival of non-symbolic learning
Multi strategy learning
Reinforcement learning
Statistical learning
Successful applications
Active & online learning
Data mining
ILP
Kernel methods
Bayesian methods
Probabilistic graphical models
Nonparametric Bayesian
Ensemble methods
Transfer learning
Semi-supervised learning
Structured prediction
MIML
IR & ranking
Dimensionality reduction
Deep learning
Sparse learning
ECML (1989) KDD (1995) ACML (2009)PAKDD (1997)
Abduction, Analogy
dark age renaissanceenthusiasm maturity fast development
26
27. Tự động khám phá, phát hiện các tri thức tiềm ẩn từ
các tập dữ liệu lớn và đa dạng.
Data mining metaphor:
Extracting ore from
rock
Khai phá dữ liệu – Data Mining
Large and
unstructured
real-life data
Databases
Statistics
Machine Learning
KDD
27
28. 28
Dữ liệu kinh doanh
“Nhiều đàn ông trẻ tìm mua bia và bỉm trong siêu thị”
Đang mùa World Cup, những ông bố trẻ mua bia và bỉm để cuối
tuần vừa trông con vừa xem bóng đá.
Tìm ra quy luật từ dữ liệu kinh doanh
Dữ liệu kinh doanh Phân tích Đàn ông 20-30 tuổi Bỉm Bia
sắp xếp bia và bỉm gần nhau
31. Ba phạm trù của AI
1. Bắt chước con người (Human-imitative)
2. Tăng trí thông minh (Intelligence Augmentation)
3. Hạ tầng của thông minh (Intelligence Infrastructure)
31
https://medium.com/syncedreview/michael-i-jordan-interview-clarity-of-thought-on-ai
Những vấn
đề nền tảng
này đã có
nhiều đột phá
32. Ba phạm trù của AI
1. Bắt chước con người (Human-imitative)
2. Tăng trí thông minh (Intelligence Augmentation)
3. Hạ tầng của thông minh (Intelligence Infrastructure)
32
https://medium.com/syncedreview/michael-i-jordan-interview-clarity-of-thought-on-ai
Tài chính Khám chữa bệnh
33. Ba phạm trù của AI
1. Bắt chước con người (Human-imitative)
2. Tăng trí thông minh (Intelligence Augmentation)
3. Hạ tầng của thông minh (Intelligence Infrastructure)
33
https://medium.com/syncedreview/michael-i-jordan-interview-clarity-of-thought-on-ai
Hạ tầng AI gắn với IoTDữ liệu là hạ tầng của AI
34. Nội dung
1. Thời chuyển đổi số
2. Khoa học dữ liệu
3. Đào tạo và dùng khoa học dữ liệu trong
kinh tế số
34
35. Các thành phần tham gia kinh tế số
Doanh nghiệp
Doanh nhân và nhà đầu tư
• Đầu tư ứng dụng kỹ thuật
• Ứng dụng mô hình kinh
doanh mới
Cá nhân
• Khách hàng/người dùng
• Chủ sở hữu
• Người tham gia qua mạng
• Nhân viên/người lao động
Người làm chính sách
Chính phủ, liên hiệp, hiệp hội, tổ
chức phi chính phủ...
Nhà sáng tạo
• Trường Viện
• Trung tâm đào tạo
• Nhà khoa học dữ liệu
(data scientists)
• Người phân tích dữ liệu
(data analysts)
36. Công việc liên quan khoa học dữ liệu
Doanh nghiệp
Doanh nhân và nhà đầu tư
• Đầu tư ứng dụng kỹ thuật
• Ứng dụng mô hình kinh
doanh mới
Cá nhân
• Khách hàng/người dùng
• Chủ sở hữu
• Người tham gia qua mạng
• Nhân viên/người lao động
Nhà sáng tạo
• Trường Viện
• Trung tâm đào tạo
• Nhà khoa học dữ liệu
(data scientists)
• Người phân tích dữ liệu
(data analysts)
Người làm chính sách
Chính phủ, liên hiệp, hiệp hội, tổ
chức phi chính phủ...
37. Xu hướng về BA, BI, DS và AI
Data science Artificial intelligence
Business intelligence Business analytics
38. Sáu bài toán của doanh nghiệp
Vận hành
sản xuất
Tài chính
Khách hàng
Nhân sự Bán hàng
Thị trường
01
02
03
04
05
06
39. Đem khoa học dữ liệu vào doanh nghiệp
Phân tích
mô tả
Phân tích
dự báo
Phân tích
khuyến cáo
Sản xuất
Tài chính
Thị trường
Khách hàng
Nhân sự
Bán hàng Phân tích
kinh doanh
40. Sáu bài toán của doanh nghiệp
Khách hàng01
02
03
04
05
06 Sự hài lòng của khách hàng
P1
P2
P3
Khách hàng trung thành
Phân khúc khách hàng
Kênh bán và khách hàng
P4
P5
P6
Mất khách
Thu hút khách hàng
41. Sáu bài toán của doanh nghiệp
§ Doanh nghiệp có đang cung
cấp đúng những sản phẩm,
dịch vụ mà cái khách hàng
mong muốn?
§ Khách hàng có hài lòng về trải
nghiệm khi mua sản phẩm,
dịch vụ của doanh nghiệp?
§ Khách hàng có hài lòng về sản
phẩm, dịch vụ của doanh
nghiệp? Họ hài lòng ở mức độ
nào và đâu là yếu tố khiến họ
hài lòng nhất? Nếu không thì
nguyên nhân là vì sao?
Khách hàng01
02
03
04
05
06 Sự hài lòng của khách hàngP1
P2
P3
Khách hàng trung thành
Phân khúc khách hàng
Kênh bán và khách hàngP4
P5
P6
Mất khách
Thu hút khách hàng
42. Bring BA to SMEs
Customer01
02
03
04
05
06 Customer satisfaction
P1
P2
P3
Customer lifetime value
Customer segmentation
Sales channel
P4
P5
P6
Customer churn
Customer Acquisition
44. Đào tạo nhân lực số
JVN: Thạc sĩ về Khoa học Dữ liệu
45. Đào tạo nhân lực số
JVN: Thạc sĩ về Tài chính Định lượng
46. 46
Data Scientist: The Sexiest Job of the 21st Century
(Harvard Business Review, October 2012)
TAKE HOME MESSAGE
n Data science is a key in the digital
transformation. The combination of math,
computer science and domain knowledge
makes its power.
n Education of data science aims to provide
leaners with analysis knowledge while
business analytics aims to provide business
solutions to enterprises.
n Both are keys in the digital transformation
(and related to all of us).