Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

社交媒體研究與鉅量資料分析

社交媒體研究近年發展趨勢

  • Loggen Sie sich ein, um Kommentare anzuzeigen.

社交媒體研究與鉅量資料分析

  1. 1. 社交媒體研究與鉅量資料分析 玄奘大學大眾傳播學系 鄭宇君 2015.1.8 1
  2. 2. 演講架構 • 社交媒體研究 – Social networking sites – Mobile communities • 鉅量資料分析 – What is big data? – Computational turn 2
  3. 3. Social media and big data 3
  4. 4. What is social media? • 泛指基於網際網路架構,促進 社會互動的媒介,如 Facebook、Twitter、Plurk, 做為公眾集體連繫與交換訊息 的平台,又稱社交網絡服務 (Social Networking Service, 簡稱SNS); • Flickr、Youtube等相片、影 音分享軟體,及wiki, tag等多 人共筆、彙整群眾智慧的軟體 或技術也算在內。 • http://en.wikipedia.org/wiki/Soci al_media 2015/1/26
  5. 5. What is Big Data? • Google在 2014 年執行數以兆計的搜尋工作。 • 如果一年就像一幅拼圖,這些搜尋字詞會拼湊出 什麼景色呢? • Google - Year in Search 2014 • https://www.google.com.tw/trends 5
  6. 6. Google Trend: 2005-2014 6
  7. 7. 社交媒體具有雙重連結 • 人的連結: 1) 從線下社群到線上社群: 如:Facebook 2) 延伸連結: 如:朋友的朋友 3) 平台推薦連結: 使用者可能感興趣的人 4) 追蹤名人連結 • 平台(技術)的連結: 1) 與其他平台連結: 如:Youtube, Flickr 2) 與內容網站連結: 如:新聞網站 3) 與其他應用程式連結: 如: 遊戲 4) 其他網絡與SNS平台連結: 如: 使用FB帳號登入、直 接分享到FB 2015/1/26
  8. 8. 連結促進了分享與交換  在社交媒體中,人們分享那些東西? 文字、照片、影音內容、資訊、商品 對話、情感、意義、協力工作、社群感、認同  在社交媒體中,平台之間交換那些東西? Data: Texts, photos, videos, URLs, interactions, Metadata: user logs, transitional data, access info – 社交媒體的技術型式鼓勵分享,「分享」的意識形 態構成了社交媒體的標準生態模式。 8
  9. 9. Twitter大事記 Twitter 7年來的界面設計之改變 2006 Twitter誕生 2007 使用者自創#hashtag, RT 2009 飛機迫降哈德遜河,目擊者用Twitter轉播現場狀況 2009 歐普拉等名人跟著使用Twitter 2011 阿拉伯之春—推翻埃及穆巴拉克政權 2011 日本311地震海嘯 2012 倫敦奧運官方用Twitter直播賽事 2012 歐巴馬連任美國總統(史上最多Retweet) 2014 奧斯卡主持人艾倫與明星自拍(史上最快達百萬RT) https://2014.twitter.com/perspectives
  10. 10. Facebook 2014 回顧  德國奪下冠軍的世界盃  伊波拉病毒(Ebola virus outbreak)  巴西大選  Robin Williams(於 2014 年 8 月 11 日逝世)  冰桶挑戰 Ice Bucket Challenge  加薩戰爭(Conflict in Gaza)  馬航事件(MH17 以及 MH37 )  Super Bowl  Michael Brown/Ferguson  Sochi Winter Olympics • http://yearinreview.fb.com/ 10
  11. 11. 社交媒體匯集了群體力量 • 社群新聞( social journalism): 透過群眾外包由公民提供各種新聞線索,不斷改寫新聞 的內涵。 Guardian open journalism • 災難事件的集體協作: 災難地圖、尋人網站 • 群眾查證與流言過濾: 倫敦暴動、真假災難照片 • 社交媒體與社會抗爭: 阿拉伯之春、太陽花學運 • Twitter go CRAZY during Brazil v Germany 2014
  12. 12. Methodology for social media 12
  13. 13. 社交媒體研究的主要取徑 • 研究使用者的數位行為 (以個體人為單位) – 問卷調查 (如: Pew research) – 質化研究 (針對兒童、青少年的影響) • 研究用戶的數位足跡 (data/metadata) – 分析User logs 找出使用者行為模式 – 結合non-human data (設備、地點等相關資料) 13
  14. 14. Digital footprints • 使用者的數位足跡愈來愈多: 貼文、按讚、瀏覽影 音、打卡(地理位置)、加為好友(社會網絡)。 • 人文社會研究開始引進鉅量資料(big data)的分析 概念 • 傳統社會科學與資料科學研究有不同的方法論預 設,二者結合會帶來那些契機與挑戰?
  15. 15. 從數位足跡找出真實使用者 • 使用者數位足跡的碎片化 • 網路用戶不等於現實世界的完整個體人 – 一個人可以有多重帳號 – 一個帳號由多人共用 – 機構帳號、機器人帳號 Q: 研究者該如何從碎裂的使用者足跡資料中, 勾勒出真實使用者的傳播活動樣貌?
  16. 16. 數位資料收集與分析 資料收集 資料清洗 資料儲存 資料分析 16
  17. 17. Computational turn • Big data: – 大數據、海量數據、鉅量資料 – 大量 (Volume) : 盡可能完整的資料 – 龐雜(Variety) : 非結構化資料 – 快速(Velocity) :即時資料 – 不確定性 (Veracity) :雜訊多 • Computational turn (Berry, 2011) 鉅量資料重新形塑了知識建構與研究流程,及人們處理 資訊與分類方式,促使人文及社會科學研究也產生「向 運算轉」 17
  18. 18. 社交媒體鉅量資料研究與傳統社會科學「量 化」研究之差異 – 多數人「表層資料」v.s. 少數人「深度資料」 – 介於二者中間的,則是統計學與抽樣的概念。 – 問卷難以反映使用者填答實際媒體使用細節, 如: 一天看了幾次手機 Manovinch, 2011
  19. 19. 社會科學常態分佈曲線的預設 • 傳播社會科學之統計分析單位:個體人 – 常態分佈曲線:平均值+1.96 – 大數法則: 母體/樣本 – 尋找「均值人」
  20. 20. Normal Distribution 20
  21. 21. 網際網路世界的分佈特徵 21 冪律分佈(power-law distribution) 絕大多數的低連結度節點與少數的高連結度超級節點(hub) 如: 長尾理論、80-20%法則、1-9-90法則
  22. 22. 連結的數量 節 點 的 數 量 多數節點只 有少許連結 少數節點具 有大量連結 冪律分佈 (Power Law Distribution) 你、我等 消費者 名人 生產者 代表人物 改自Barabási(2002:71)無尺度網絡(scale-free networks),轉引自Hartley, 2012: 188 社交媒體的使用者分佈
  23. 23. 尋找社交媒體中的「離散人」 • 「離散人」難以用隨機抽樣的方式找出,因為可 能會抽到大量不活躍或難以掌握的使用者。 • 透過社會網絡分析(social network analysis),找 出整體網絡中具有高連結度的使用者 • 透過使用者記錄分析(user log analysis),找出智 慧型手機中不同類型使用行為(拍照、社交、遊 戲)的重度使用者(power users)
  24. 24. 24 社會網絡分析尋找 高連結度使用者 不同語言社群的社會網絡 關係 • TW 與 CN社會網絡的 主要節點:網路社群的 意見領袖 • JA網絡的主要節點: 新 聞記者與新聞機構 • 相較於JA獨立於整體 網絡之外,TW與 CN雖 可辦識為不同網絡, 但彼此仍有密切互動 關係 Tool: Gephi Source: RT & @reply tweets (鄭宇君、陳百齡,2014)
  25. 25. 從數位足跡探討傳播活動之困難與限制  研究者難以進用或取得傳輸資料,多半只有 Google, Facebook等公司擁有  使用者的隱私與研究倫理問題  沒有留下數位足跡的使用者行為資料無法取得, 包括心理、社會、情感層面等面向的傳播活動, 必須結合深度訪談、參與觀察等質化資料,才能 詮釋傳播活動對人的意義  資料科學家與人文社會學者的資料分析落差
  26. 26. 鉅量資料的迷思 • Data 數量愈大愈好? – 過於龐大的資料,增加資料篩選的難度 – 最好是開始就能精確設計資料收集方式 • 有了鉅量資料分析,還需不需要理論? – 理論可協助研究者進行有效研究設計 – 不是所有的問題,都適合用鉅量資料分析回答 • 母體/樣本的關係 – 抽樣是否適當,取決研究設計與問題的契合度 – 如: 選擇Twitter, Youtube, Facebook,微博
  27. 27. 社交媒體資料分析的應用 – 政治參與 – 天然與人為的災難傳播,甚至提早告知地震 – 與傳統媒體的互動 – 品牌傳播,特別是危機偵測 – Social TV :線上影音流量與社群討論分析 27
  28. 28. 案例: 追蹤Twitter謠言如何擴散? 28 衛報資料新聞學: 2011倫敦暴動,Twitter上七個謠言如何擴散與被群眾驗證
  29. 29. Network analysis on Twitter 29 2014 年以巴Gaza衝突時,支持以色列與巴勒斯坦的陣營如何各自跟自己支持者對話 Messages passed along in one side of the graph will never reach the other.
  30. 30. Selfiecity 照片的鉅量資料分析 • http://selfiecity.net/#intro (Manovich, 2014 ) • Instgram:比較不同城市人們 的自拍像,共約12萬張照片 • BANGKOK, BERLIN, MOSCOW, NEW YORK, • SAO PAULO 30 研究發現:  真正自拍照片的比例比想像中少,只佔4%,  女性自拍比男性多,特別是莫斯科,女性自拍是男性的4.6倍,  曼谷、聖保羅城市的自拍照,微笑比例高於其他城市,莫斯科微笑比例最低。
  31. 31. 結語: 探索新的世界 善用data / metadata發展 出描述現象的 新語言 31
  32. 32. Q&A 32
  33. 33. 敬請指教 colisa@gmail.com Twitter:@colisa 33

×