SlideShare ist ein Scribd-Unternehmen logo
1 von 28
Downloaden Sie, um offline zu lesen
Big Data
失敗與成功的真相
Gene Hong/2014-04-22
aka
食夢黑貘
洪進吉
考/唸過的系所
理: 數學(, 應數), 化學, 天文, 海洋, 資科, 物理
工: 資工, 電機, 電子
商: 商數
管: 管科, 資管
文: 圖書館, 翻譯, 教育評鑑
法: 社會, 宗教
資料探勘相關工作經驗
魅力站
博客來
聯絡家
網祿
EZPrice
領域
Performance Tuning (效能調校)
Behavior Prediction (行為預測)
Intelligent Agent (智慧代理者)
Database Management (資料庫管理)
Webmaster (網站管理者)
Semantic Web (語意網路)
Search Engine Optimization (搜尋引擎最佳化)
Information Retrievals (資訊獲取)
最近作品
網點: 用 Data Mining 來看 SEO
網智: 用 語意網路 來做跨站導讀
網誌: 用 Google Analytics 來輔助分析網站
訪來客: 用 Facebook API 來看使用者分群
林克傳說: 用社群網站的連結分享來看訊息傳遞
正在進行中
工作建議: 從交友與閱讀資訊探勘
即時約會: 預測會與自己最接近的朋友
景點人潮: 預測某景點可能的遊客數
商品導讀: 從個人文字趨向來做消費建議
林克傳說應用 之 服貿系列
服貿跑馬燈
服貿東西軍
服貿媒體光譜分佈圖
甚麼是 Big Data
為甚麼 Big Data 被認為失敗
Big Data 有很多人都宣稱在做
不了解的人已被既定印像限制住了
宣稱用 Big Data 的服務都沒甚麼效用
用 Big Data 來募資已經募不到錢
真的在用 Big Data 嗎?
數量級
時間區間
即時性
應用範圍
實用性
演算法
企業組織鍊失去的環節
Business Developer
Product Manager
System Analyzer
Programmer
User/Operator
智慧與資料
推論與歸納
Condition Base vs Rule Base
量級
Relation (Distance)
因子分析
系統分析的謬誤
從上到下的系統分析
目標與須求的鍊結
規格書
Big Data 的 Variety 與 Veracity
可行性分析
Big Data 的流程
1. 確立資料源
2. 尋找聚合點
3. 模式與模型識別
4. 資料規劃 (儲存, 計算)
5. 使用者須求
6. 開發
Big Data 階段
搜集資料
儲存資料
除錯資料
計算資料
呈現資料
解讀資料
資料認知的謬誤與改變
資料革命: Big Data, Linked Data, Open Data, Data Mining 五講之一 (Data
Revolution)
次級資料
1. 我們有時只能從已抓的資料下手, 而不是最實際的資料
2. 這種指數的計算是簡化其複雜度, 一定會失去一些意義
3. 我們可以視其須要及適用度, 去調整演算法或資料搜集
4. 對於資料的可能性與適用性, 我們還須要一段路來學習
Data Pool
Google Search Result
Facebook (SNS) API
Web Mining
Open Data
訪來客經驗
資料能抓的跟你所想的不一樣
一定有方法可以接近目標
只是這方法可能代價很高
NP-Hard
林克傳說
1. 近朱者赤, 近貘者黑
2.民意透明化
3. 全民政治
成果
1. 最值得你唸的文章
2. 跟你最像的朋友
3. 議題熱度與趨勢
林克傳說經驗
資料延伸的 Scale 是相當可怕的
資料的多樣性真的很巨大
資料跟實用的落差
中間產品就很有用了
Big Data How Big?
資料抓取 10^11
資料儲存 10^9
資料整理 10^7
資料計算 10^5
資料呈現 10^3
Full Stack Maker
Hardware and OS
DB, Programmer
SA, UI/UX
PM, Manager
Marketing, Advertisment
Social, Content
Hackathon
Yahoo Open Hackday
Open Data Hackathon
g0v Hackathon
內部 Hackathon
Q^A
謝謝大家

Weitere ähnliche Inhalte

Was ist angesagt?

Data Science: Z > B 的資料科學
Data Science: Z > B 的資料科學Data Science: Z > B 的資料科學
Data Science: Z > B 的資料科學ckliu
 
大數據開發流程
大數據開發流程大數據開發流程
大數據開發流程Gene Hong
 
Data for social good – data driven charity
Data for social good – data driven charityData for social good – data driven charity
Data for social good – data driven charityDSP智庫驅動
 
D4SG creates new opportunities for public service
D4SG creates new opportunities for public serviceD4SG creates new opportunities for public service
D4SG creates new opportunities for public serviceDSP智庫驅動
 
Location Intelligence for Public Policy
Location Intelligence for Public PolicyLocation Intelligence for Public Policy
Location Intelligence for Public PolicyDSP智庫驅動
 
DSP資料科學教學模式分享
DSP資料科學教學模式分享DSP資料科學教學模式分享
DSP資料科學教學模式分享DSP智庫驅動
 

Was ist angesagt? (6)

Data Science: Z > B 的資料科學
Data Science: Z > B 的資料科學Data Science: Z > B 的資料科學
Data Science: Z > B 的資料科學
 
大數據開發流程
大數據開發流程大數據開發流程
大數據開發流程
 
Data for social good – data driven charity
Data for social good – data driven charityData for social good – data driven charity
Data for social good – data driven charity
 
D4SG creates new opportunities for public service
D4SG creates new opportunities for public serviceD4SG creates new opportunities for public service
D4SG creates new opportunities for public service
 
Location Intelligence for Public Policy
Location Intelligence for Public PolicyLocation Intelligence for Public Policy
Location Intelligence for Public Policy
 
DSP資料科學教學模式分享
DSP資料科學教學模式分享DSP資料科學教學模式分享
DSP資料科學教學模式分享
 

Ähnlich wie Big Data 成功與失敗的真相

從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合Gene Hong
 
Yisou intro
Yisou introYisou intro
Yisou introSong Hou
 
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路Net Tuesday Taiwan
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況Jazz Yao-Tsung Wang
 
[DSC 2016] 系列活動:李祈均 / 人類行為大數據分析
[DSC 2016] 系列活動:李祈均 / 人類行為大數據分析[DSC 2016] 系列活動:李祈均 / 人類行為大數據分析
[DSC 2016] 系列活動:李祈均 / 人類行為大數據分析台灣資料科學年會
 
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧Mix Taiwan
 

Ähnlich wie Big Data 成功與失敗的真相 (7)

從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合
 
Yisou intro
Yisou introYisou intro
Yisou intro
 
雲端知識蒐集達人-0928
雲端知識蒐集達人-0928雲端知識蒐集達人-0928
雲端知識蒐集達人-0928
 
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
 
[DSC 2016] 系列活動:李祈均 / 人類行為大數據分析
[DSC 2016] 系列活動:李祈均 / 人類行為大數據分析[DSC 2016] 系列活動:李祈均 / 人類行為大數據分析
[DSC 2016] 系列活動:李祈均 / 人類行為大數據分析
 
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
 

Mehr von Gene Hong

如何用 AI 建議探索, with Google Search Console and ChatGPT
如何用 AI 建議探索, with Google Search Console  and ChatGPT如何用 AI 建議探索, with Google Search Console  and ChatGPT
如何用 AI 建議探索, with Google Search Console and ChatGPTGene Hong
 
如何建立資訊戰儀表板
如何建立資訊戰儀表板如何建立資訊戰儀表板
如何建立資訊戰儀表板Gene Hong
 
社群與新聞 資料分析 實作課程
社群與新聞 資料分析 實作課程社群與新聞 資料分析 實作課程
社群與新聞 資料分析 實作課程Gene Hong
 
從社群數據到內部開發
從社群數據到內部開發從社群數據到內部開發
從社群數據到內部開發Gene Hong
 
網眾 Ver. 0.2
網眾 Ver. 0.2網眾 Ver. 0.2
網眾 Ver. 0.2Gene Hong
 
從專家到社群 即時資訊採集分析系統
從專家到社群 即時資訊採集分析系統從專家到社群 即時資訊採集分析系統
從專家到社群 即時資訊採集分析系統Gene Hong
 
網路選戰手冊
網路選戰手冊網路選戰手冊
網路選戰手冊Gene Hong
 
從 GA 的 API 來看 SEO 的 KPI ver 2.0
從 GA 的 API 來看 SEO 的 KPI ver 2.0從 GA 的 API 來看 SEO 的 KPI ver 2.0
從 GA 的 API 來看 SEO 的 KPI ver 2.0Gene Hong
 
網路數據於新媒體之應用 Gene
網路數據於新媒體之應用 Gene網路數據於新媒體之應用 Gene
網路數據於新媒體之應用 GeneGene Hong
 
開放政府與開放公民
開放政府與開放公民開放政府與開放公民
開放政府與開放公民Gene Hong
 
從臉書看選舉
從臉書看選舉從臉書看選舉
從臉書看選舉Gene Hong
 
從社群資訊獲取行為來分析個人意見傾向
從社群資訊獲取行為來分析個人意見傾向從社群資訊獲取行為來分析個人意見傾向
從社群資訊獲取行為來分析個人意見傾向Gene Hong
 
從 GA 的 API 來看 SEO 的 KPI 加強版!
從 GA 的 API 來看 SEO 的 KPI 加強版!從 GA 的 API 來看 SEO 的 KPI 加強版!
從 GA 的 API 來看 SEO 的 KPI 加強版!Gene Hong
 
網域切割注意事項
網域切割注意事項網域切割注意事項
網域切割注意事項Gene Hong
 
從 GA 的 API 來看 SEO 的 KPI
從 GA 的 API 來看 SEO 的 KPI從 GA 的 API 來看 SEO 的 KPI
從 GA 的 API 來看 SEO 的 KPIGene Hong
 
媒體 與 社群的資料分析
媒體 與 社群的資料分析媒體 與 社群的資料分析
媒體 與 社群的資料分析Gene Hong
 
Seo 最重要的檢查項目
Seo 最重要的檢查項目Seo 最重要的檢查項目
Seo 最重要的檢查項目Gene Hong
 
從開放公民看 新媒體&新政治
從開放公民看 新媒體&新政治從開放公民看 新媒體&新政治
從開放公民看 新媒體&新政治Gene Hong
 
Open civic 開放公民
Open civic 開放公民Open civic 開放公民
Open civic 開放公民Gene Hong
 

Mehr von Gene Hong (20)

如何用 AI 建議探索, with Google Search Console and ChatGPT
如何用 AI 建議探索, with Google Search Console  and ChatGPT如何用 AI 建議探索, with Google Search Console  and ChatGPT
如何用 AI 建議探索, with Google Search Console and ChatGPT
 
如何建立資訊戰儀表板
如何建立資訊戰儀表板如何建立資訊戰儀表板
如何建立資訊戰儀表板
 
社群與新聞 資料分析 實作課程
社群與新聞 資料分析 實作課程社群與新聞 資料分析 實作課程
社群與新聞 資料分析 實作課程
 
從社群數據到內部開發
從社群數據到內部開發從社群數據到內部開發
從社群數據到內部開發
 
網眾 Ver. 0.2
網眾 Ver. 0.2網眾 Ver. 0.2
網眾 Ver. 0.2
 
從專家到社群 即時資訊採集分析系統
從專家到社群 即時資訊採集分析系統從專家到社群 即時資訊採集分析系統
從專家到社群 即時資訊採集分析系統
 
網路選戰手冊
網路選戰手冊網路選戰手冊
網路選戰手冊
 
從 GA 的 API 來看 SEO 的 KPI ver 2.0
從 GA 的 API 來看 SEO 的 KPI ver 2.0從 GA 的 API 來看 SEO 的 KPI ver 2.0
從 GA 的 API 來看 SEO 的 KPI ver 2.0
 
網路數據於新媒體之應用 Gene
網路數據於新媒體之應用 Gene網路數據於新媒體之應用 Gene
網路數據於新媒體之應用 Gene
 
開放政府與開放公民
開放政府與開放公民開放政府與開放公民
開放政府與開放公民
 
從臉書看選舉
從臉書看選舉從臉書看選舉
從臉書看選舉
 
從社群資訊獲取行為來分析個人意見傾向
從社群資訊獲取行為來分析個人意見傾向從社群資訊獲取行為來分析個人意見傾向
從社群資訊獲取行為來分析個人意見傾向
 
從 GA 的 API 來看 SEO 的 KPI 加強版!
從 GA 的 API 來看 SEO 的 KPI 加強版!從 GA 的 API 來看 SEO 的 KPI 加強版!
從 GA 的 API 來看 SEO 的 KPI 加強版!
 
網域切割注意事項
網域切割注意事項網域切割注意事項
網域切割注意事項
 
從 GA 的 API 來看 SEO 的 KPI
從 GA 的 API 來看 SEO 的 KPI從 GA 的 API 來看 SEO 的 KPI
從 GA 的 API 來看 SEO 的 KPI
 
媒體 與 社群的資料分析
媒體 與 社群的資料分析媒體 與 社群的資料分析
媒體 與 社群的資料分析
 
Seo 最重要的檢查項目
Seo 最重要的檢查項目Seo 最重要的檢查項目
Seo 最重要的檢查項目
 
從開放公民看 新媒體&新政治
從開放公民看 新媒體&新政治從開放公民看 新媒體&新政治
從開放公民看 新媒體&新政治
 
Open civic 開放公民
Open civic 開放公民Open civic 開放公民
Open civic 開放公民
 
Seo in brie
Seo in brieSeo in brie
Seo in brie
 

Big Data 成功與失敗的真相