SlideShare ist ein Scribd-Unternehmen logo
1 von 27
Downloaden Sie, um offline zu lesen
datasci.co
Data Science Program
讓公共服務變聰明的
《資料科學計畫》
2014.07.19
Etu 負責人  DSP 執委
蔣居裕 (Fred Chiang)
@fredchiang / fredchiang@etusolution.com
datasci.co
Data Science Program
故事的開始
2	
  
datasci.co
Data Science Program
伯朗沒了,雲端未成,資料科學先行
3	
  
datasci.co
Data Science Program
http://www.etusolution.com/training
Etu Training – 針對 Hadoop Big Data
L1-B 全員的 Big Data 第一天
L1-R 行銷者的精準推薦第一天
L1-A 技術人員的 Etu Appliance 第一天
L1-D 軟體開發者的 Hadoop 第一天
L1-H 軟體開發者的 NoSQL-HBase 第一天
L1-M 軟體開發者的 MapReduce 第一天
L1-V 資料分析者的 Visualization 第一天
L1-L 資料分析者的 RHadoop 第一天
L2-P 軟體開發者前進 Pig
L2-I 軟體開發者前進 Hive
L2-H 軟體開發者前進 NoSQL-HBase
L2-V 資料分析者前進 Visualization
L2-L 資料分析者前進 RHadoop
4	
  
Small Data 就不需要資料科學嗎?
datasci.co
Data Science Program
處理者
分析者
Source: Next-Gen Data Scientist, Dr. Rachel Schutt
70%~85% 的工作時間
資料科學 End-to-End 流程
5	
  
策略者
策略者
datasci.co
Data Science Program
DSP 緣起華山 – 2013.5.16
精誠在「科技釀造,寫意人生」
活動中提出「生活數據創新平台」
6	
  
datasci.co
Data Science Program
Data Weekend #5 – 2013.8.17
http://www.slideshare.net/fchiangtw/data-weekend-5
7	
  
datasci.co
Data Science Program
Data Weekend #6 – 2013.9.28
8	
  
datasci.co
Data Science Program
《資料科學團隊養成計畫》
Data Science Program (DSP)
人才為本
應用為價值
在3年內,為台灣培養300位
資料科學團隊成員
9	
  
CSR
Open
Development
datasci.co
Data Science Program
最後籌備期:2013.09.29 ~ 2013.12.13
執行委員會
執行長 (CEO) / 執行秘書
行政部
營運長 (COO)
教學部
課程長 (CCO)
行銷部
行銷長 (CMO)
顧問團
顧問長
10	
  
datasci.co
Data Science Program
codefortomorrow.org
11	
  
datasci.co
Data Science Program
DSP 已開課程 (持續開發中)
1.  Team Training:《團訓班》
2.  Data ETL and Analysis with Python:《資料爬理析 Python 實戰班》;
兩天上手政府資料分析
3.  Finding Stories with Data Analysis:《看資料找故事工作坊》;
以政府採購標案為例 (Aug2-3)
12	
  
datasci.co
Data Science Program
資料科學 (Data Science) 的要素
分工
團隊
人
 知識
技能
工具
資料
Domain
Pain
Point
Value
Up
心法
13	
  
datasci.co
Data Science Program
http://www.etusolution.com/DSP/edm_dsp2.html
14	
  
datasci.co
Data Science Program
專業分工組隊
•  Campaigner
•  Analyst
•  Hygienist
•  Designer
15	
  
datasci.co
Data Science Program
datasci.co
Data Science Program
Dataset 1:內政部不動產實價登錄資料
•  民國 101.08 ~ 102.09
•  全台灣
•  租賃、買賣、預售
•  約 47 萬筆資料
17	
  
datasci.co
Data Science Program
Dataset 2:PIXNET Hackathon 開放資料
1.  熱門照片的相關資料 (metadata)
2.  相片的 EXIF 資料
3.  人氣部落格的詮釋資料 (metadata)
4.  人氣部落格的訪客記錄 (visitor logs)
* 部落格與相片的內容資料,可以透過 PIXNET API 取得。
18	
  
datasci.co
Data Science Program
Data Fiesta:DSP 結訓成果交流
19	
  
datasci.co
Data Science Program
Team Project
團訓班第 1 期 團訓班第 2 期
#1
我要成為天聾人股份有限公司
《Bargaining Power》
無殼蝸牛聯盟
《房價正義》
#2
遊戲茄子
《驚爆房地產》
航海王
《部落客銀行》
#3
逆轉人生全球顧問股份有限公司
《小資男女翻身計畫》
愛。住易
《找尋銀髮幸福宅》
#4
光點選址服務
《小火鍋創業選址模型》
小資“救世“組
《千金買房‧萬金買鄰》
#5
財團法人避稅剋星
《土地買賣稅費異常資料查詢平台》
Captain
《Hot Zone》
20	
  
datasci.co
Data Science Program
愛。住易 -《找尋銀髮幸福宅》
Infographic download: http://goo.gl/fKdXXi
21	
  
datasci.co
Data Science Program
我從 DSP 團訓班學到的事
1.  人才不缺;缺的是組織力
2.  教育不缺;缺的是跨學科 End-to-End 串連
3.  資料不缺;缺的是直接有力的開放策略
4.  洞見不缺;缺的是行動
22	
  
datasci.co
Data Science Program
多或少
1  多一點生活,少一點憤義
2  多一點策略,少一點包裝
3  多一點資料,少一點想像
4  多一點關聯,少一點加總
23	
  
datasci.co
Data Science Program
資料與價值
個人資料
Quantified
-self Data
企業資料
Corporate
Data
NGO 資料
NGO Data
政府資料
Government
Data
個人價值
 商業價值
 社會價值
國家戰略價值
24	
  
datasci.co
Data Science Program
No Data, No Science
Please be Smart, Government
we need the real (open) data for
many things good
25	
  
datasci.co
Data Science Program
DSP 的近期未來發展
1  開發更多新課程,挖掘更多新講師
2  發展企業與學校夥伴關係
3  朝向社會企業法人化
4  發展社群與志工
26	
  
datasci.co
Data Science Program
thank you
27	
  

Weitere ähnliche Inhalte

Was ist angesagt?

SITCON開源城社群大闖關-臺灣資料工程協會
SITCON開源城社群大闖關-臺灣資料工程協會SITCON開源城社群大闖關-臺灣資料工程協會
SITCON開源城社群大闖關-臺灣資料工程協會
Anna Yen
 
大數據獲利模式 Ch 2
大數據獲利模式 Ch 2大數據獲利模式 Ch 2
大數據獲利模式 Ch 2
Hans Shih
 

Was ist angesagt? (20)

從統計到資料科學
從統計到資料科學從統計到資料科學
從統計到資料科學
 
資料科學推廣教育的實踐
資料科學推廣教育的實踐資料科學推廣教育的實踐
資料科學推廣教育的實踐
 
20170430 python爬蟲攻防戰-攻防與金融大數據分析班
20170430 python爬蟲攻防戰-攻防與金融大數據分析班20170430 python爬蟲攻防戰-攻防與金融大數據分析班
20170430 python爬蟲攻防戰-攻防與金融大數據分析班
 
Data Science: Z > B 的資料科學
Data Science: Z > B 的資料科學Data Science: Z > B 的資料科學
Data Science: Z > B 的資料科學
 
数据的价值和灵魂
数据的价值和灵魂数据的价值和灵魂
数据的价值和灵魂
 
Big Data vs. Open Data
Big Data vs. Open DataBig Data vs. Open Data
Big Data vs. Open Data
 
Big Data 現象,以及現象中的我們
Big Data 現象,以及現象中的我們Big Data 現象,以及現象中的我們
Big Data 現象,以及現象中的我們
 
資料在手,希望無窮
資料在手,希望無窮資料在手,希望無窮
資料在手,希望無窮
 
浅谈数据科学
浅谈数据科学浅谈数据科学
浅谈数据科学
 
大數據與資料科學人才現況與趨勢
大數據與資料科學人才現況與趨勢大數據與資料科學人才現況與趨勢
大數據與資料科學人才現況與趨勢
 
Power BI x R
Power BI x RPower BI x R
Power BI x R
 
What is data engineer?資料工程師是什麼?
What is data engineer?資料工程師是什麼?What is data engineer?資料工程師是什麼?
What is data engineer?資料工程師是什麼?
 
SITCON開源城社群大闖關-臺灣資料工程協會
SITCON開源城社群大闖關-臺灣資料工程協會SITCON開源城社群大闖關-臺灣資料工程協會
SITCON開源城社群大闖關-臺灣資料工程協會
 
Z > B 的資料科學
Z > B 的資料科學Z > B 的資料科學
Z > B 的資料科學
 
何謂大數據
何謂大數據何謂大數據
何謂大數據
 
大數據獲利模式 Ch 2
大數據獲利模式 Ch 2大數據獲利模式 Ch 2
大數據獲利模式 Ch 2
 
從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合
 
李慕約&王向榮/如何備料:資料的抓取、清理以及串接
李慕約&王向榮/如何備料:資料的抓取、清理以及串接李慕約&王向榮/如何備料:資料的抓取、清理以及串接
李慕約&王向榮/如何備料:資料的抓取、清理以及串接
 
資料價值 — 一位資料產品經理的視野
資料價值 — 一位資料產品經理的視野資料價值 — 一位資料產品經理的視野
資料價值 — 一位資料產品經理的視野
 
# 手把手 Python 資料分析 I
# 手把手 Python 資料分析 I# 手把手 Python 資料分析 I
# 手把手 Python 資料分析 I
 

Andere mochten auch

Andere mochten auch (14)

Management of Disease Prevention Supplies 政府防疫物資公私協力新模式(王開弘)
Management of Disease Prevention Supplies 政府防疫物資公私協力新模式(王開弘)Management of Disease Prevention Supplies 政府防疫物資公私協力新模式(王開弘)
Management of Disease Prevention Supplies 政府防疫物資公私協力新模式(王開弘)
 
How Can Goverments Be Smart
How Can Goverments Be SmartHow Can Goverments Be Smart
How Can Goverments Be Smart
 
GovJam 與公民共創價值的小撇步(汪建均)
GovJam 與公民共創價值的小撇步(汪建均)GovJam 與公民共創價值的小撇步(汪建均)
GovJam 與公民共創價值的小撇步(汪建均)
 
【病後人生】2014/07/19 政府開竅SmartGov Sharing
【病後人生】2014/07/19 政府開竅SmartGov Sharing【病後人生】2014/07/19 政府開竅SmartGov Sharing
【病後人生】2014/07/19 政府開竅SmartGov Sharing
 
One-Stop Shopping Public Services 跨區服務免奔波(吳肇銘)
One-Stop Shopping Public Services 跨區服務免奔波(吳肇銘)One-Stop Shopping Public Services 跨區服務免奔波(吳肇銘)
One-Stop Shopping Public Services 跨區服務免奔波(吳肇銘)
 
Government Digital Service 英國政府數位服務策略及設計準則(蔡明哲)
Government Digital Service 英國政府數位服務策略及設計準則(蔡明哲)Government Digital Service 英國政府數位服務策略及設計準則(蔡明哲)
Government Digital Service 英國政府數位服務策略及設計準則(蔡明哲)
 
採購開竅 - Follow the Money
採購開竅 - Follow the Money採購開竅 - Follow the Money
採購開竅 - Follow the Money
 
Universal Design for Public Services 公共服務如何導入通用設計(余虹儀)
Universal Design for Public Services 公共服務如何導入通用設計(余虹儀)Universal Design for Public Services 公共服務如何導入通用設計(余虹儀)
Universal Design for Public Services 公共服務如何導入通用設計(余虹儀)
 
採購開竅 - 採購輔助決策 (資料行者)
採購開竅 - 採購輔助決策 (資料行者)採購開竅 - 採購輔助決策 (資料行者)
採購開竅 - 採購輔助決策 (資料行者)
 
採購開竅 - OK Tasigle
採購開竅 - OK Tasigle採購開竅 - OK Tasigle
採購開竅 - OK Tasigle
 
採購開竅 - 叫我最有利標
採購開竅 - 叫我最有利標採購開竅 - 叫我最有利標
採購開竅 - 叫我最有利標
 
Lessons Learned from OGP Summit 2016
Lessons Learned from OGP Summit 2016Lessons Learned from OGP Summit 2016
Lessons Learned from OGP Summit 2016
 
採購開竅 - 標案天眼通
採購開竅 - 標案天眼通採購開竅 - 標案天眼通
採購開竅 - 標案天眼通
 
林峰正/智慧型工程管考系統 : 資料分析經驗談
林峰正/智慧型工程管考系統 : 資料分析經驗談林峰正/智慧型工程管考系統 : 資料分析經驗談
林峰正/智慧型工程管考系統 : 資料分析經驗談
 

Ähnlich wie The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)

2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
Jazz Yao-Tsung Wang
 
DSP Wellcome
DSP WellcomeDSP Wellcome
DSP Wellcome
Tim Hong
 
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
Etu Solution
 
Pyconf2014 lightening
Pyconf2014 lighteningPyconf2014 lightening
Pyconf2014 lightening
Shih-En Chou
 

Ähnlich wie The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕) (20)

廣宣學堂Python金融爬蟲原理班 20170416
廣宣學堂Python金融爬蟲原理班 20170416廣宣學堂Python金融爬蟲原理班 20170416
廣宣學堂Python金融爬蟲原理班 20170416
 
逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
 
Intro to Python - BMI Case Practice
Intro to Python - BMI Case PracticeIntro to Python - BMI Case Practice
Intro to Python - BMI Case Practice
 
那些你知道的,但還沒看過的 Big Data 風景
那些你知道的,但還沒看過的 Big Data 風景那些你知道的,但還沒看過的 Big Data 風景
那些你知道的,但還沒看過的 Big Data 風景
 
網頁爬蟲入門 Python web crawler at 淡江大學 20170930
網頁爬蟲入門 Python web crawler at 淡江大學 20170930網頁爬蟲入門 Python web crawler at 淡江大學 20170930
網頁爬蟲入門 Python web crawler at 淡江大學 20170930
 
Hadoop
HadoopHadoop
Hadoop
 
DSP Wellcome
DSP WellcomeDSP Wellcome
DSP Wellcome
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享
 
IT445_Week_11.pdf
IT445_Week_11.pdfIT445_Week_11.pdf
IT445_Week_11.pdf
 
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
 
開場致詞 -- 2014 台灣資料科學愛好者年會
開場致詞 -- 2014 台灣資料科學愛好者年會開場致詞 -- 2014 台灣資料科學愛好者年會
開場致詞 -- 2014 台灣資料科學愛好者年會
 
20151016 中興大學 big data + machine learning
20151016 中興大學 big data + machine learning20151016 中興大學 big data + machine learning
20151016 中興大學 big data + machine learning
 
Introduction to postgresql community
Introduction to postgresql communityIntroduction to postgresql community
Introduction to postgresql community
 
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
 
Data Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTUREData Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTURE
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲
 
Pyconf2014 lightening
Pyconf2014 lighteningPyconf2014 lightening
Pyconf2014 lightening
 
Emc keynote 1130 1200
Emc keynote 1130 1200Emc keynote 1130 1200
Emc keynote 1130 1200
 
数据科学运营:企业人工智能之旅
数据科学运营:企业人工智能之旅数据科学运营:企业人工智能之旅
数据科学运营:企业人工智能之旅
 

Mehr von codefortomorrow

Mehr von codefortomorrow (16)

NCC 網路治理研討會 2014
NCC 網路治理研討會 2014NCC 網路治理研討會 2014
NCC 網路治理研討會 2014
 
CfH 網路座談會 201412B
CfH 網路座談會 201412BCfH 網路座談會 201412B
CfH 網路座談會 201412B
 
CfH 網路座談 201412 第一份簡報
CfH 網路座談 201412 第一份簡報CfH 網路座談 201412 第一份簡報
CfH 網路座談 201412 第一份簡報
 
開放數據助力生態
開放數據助力生態開放數據助力生態
開放數據助力生態
 
ICANN & IANA
ICANN & IANAICANN & IANA
ICANN & IANA
 
Cyber Attack Analysis
Cyber Attack AnalysisCyber Attack Analysis
Cyber Attack Analysis
 
NTUST.CC University Student Course Selection Services 大學選課系統(謝宜峯)
NTUST.CC University Student Course Selection Services 大學選課系統(謝宜峯)NTUST.CC University Student Course Selection Services 大學選課系統(謝宜峯)
NTUST.CC University Student Course Selection Services 大學選課系統(謝宜峯)
 
After That Day 病後人生(羅佩琪)
After That Day 病後人生(羅佩琪)After That Day 病後人生(羅佩琪)
After That Day 病後人生(羅佩琪)
 
SmartGov Public
SmartGov PublicSmartGov Public
SmartGov Public
 
以時空觀點分析到院前死亡病人的送醫選擇與存活情況
以時空觀點分析到院前死亡病人的送醫選擇與存活情況以時空觀點分析到院前死亡病人的送醫選擇與存活情況
以時空觀點分析到院前死亡病人的送醫選擇與存活情況
 
微觀之開放資料
微觀之開放資料微觀之開放資料
微觀之開放資料
 
LiDAR Introduction @ #DataWeekend
LiDAR Introduction @ #DataWeekendLiDAR Introduction @ #DataWeekend
LiDAR Introduction @ #DataWeekend
 
Ushahidi x Geothings @ #DataWeekend
Ushahidi x Geothings @ #DataWeekendUshahidi x Geothings @ #DataWeekend
Ushahidi x Geothings @ #DataWeekend
 
Quantified Help: Self-Tracking for Newbies
Quantified Help: Self-Tracking for NewbiesQuantified Help: Self-Tracking for Newbies
Quantified Help: Self-Tracking for Newbies
 
OKFN Taiwan
OKFN TaiwanOKFN Taiwan
OKFN Taiwan
 
PGi Tableau
PGi TableauPGi Tableau
PGi Tableau
 

The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)

Hinweis der Redaktion

  1. 伯朗沒了,雲端未成,資料科學先行
  2. Today, Code for Tomorrow has hosted more than 10 projects and DSP is the most significant one.
  3. Right now, we have two courses: the first one is Team Training, our flagship; the second one is “Data ETL and Analysis with Python”. And more courses are under planning, like “Data Jouralism”.