SlideShare ist ein Scribd-Unternehmen logo
1 von 34
Downloaden Sie, um offline zu lesen
複数のモダリティを考慮した
災害関連ツイートのノイズ除去に関する研究
関西大学大学院
総合情報学研究科
森野 穣
災害大国
https://www.jihoken.co.jp/kasai/jishinmadoguchi/cat1/247/
※地震の窓口調べ
過去5年間の激甚災害指定は40件以上
438
39
84
71
109
141
78 90
48
62
327
148
177
39
101
115
89
190
173
283
77
344
129
337
0
100
200
300
400
500
600
700
1
9
9
3
1
9
9
4
1
9
9
5
1
9
9
6
1
9
9
7
1
9
9
8
1
9
9
9
2
0
0
0
2
0
0
1
2
0
0
2
2
0
0
3
2
0
0
4
2
0
0
5
2
0
0
6
2
0
0
7
2
0
0
8
2
0
0
9
2
0
1
0
2
0
1
1
2
0
1
2
2
0
1
3
2
0
1
4
2
0
1
5
2
0
1
6
2
0
1
7
2
0
1
8
※内閣府「令和元年版防災白書」より
自然災害による死亡者数・行方不明者数の推移
6437 22515
防災のデジタル化促進に向けて
1
災害対応のために想定すべき課題レイヤ
※デジタル・防災技術ワーキンググループ 未来構想チーム 提言 http://www.bousai.go.jp/kaigirep/teigen/pdf/teigen_03.pdf
2
災害対応のために想定すべき課題レイヤ
※デジタル・防災技術ワーキンググループ 未来構想チーム 提言 http://www.bousai.go.jp/kaigirep/teigen/pdf/teigen_03.pdf
3
見えてきた実課題
1. 自然災害の十分な予測ができない
2. 先の状況が読めず、対応が後手に回るケースがある
3. 行政・民間で準備している物資や機材の量や能力が分からない
4. 「正常性バイアス」により住民の逃げ遅れが発生
5. デジタルに不可欠な電気・通信が利用不可の可能性
6. 行政機関等の機能不全の可能性
地方自治体の対応力の差
7. 発災直後には情報が少なく、災害対応での適切な判断が困難
何が起きて,どれだけ被害が出て,被災者の居場所もわからない
※デジタル・防災技術ワーキンググループ 未来構想チーム 提言
4
災害発生前に対応が必要な課題
災害発生後に対応が必要な課題
見えてきた実課題
1. 自然災害の十分な予測ができない
2. 先の状況が読めず、対応が後手に回るケースがある
3. 行政・民間で準備している物資や機材の量や能力が分からない
4. 「正常性バイアス」により住民の逃げ遅れが発生
5. デジタルに不可欠な電気・通信が利用不可の可能性
6. 行政機関等の機能不全の可能性
地方自治体の対応力の差
7. 発災直後には情報が少なく、災害対応での適切な判断が困難
何が起きて,どれだけ被害が出て,被災者の居場所もわからない
5
災害発生前に対応が必要な課題
災害発生後に対応が必要な課題
背景: 災害時におけるSNS利用の可能性
自治体によるSNSの活用
情報発信
• 警報・注意喚起
• 支援等に係る情報
情報収集
• 救援要請
• 被害情報の把握
672
852
934 941
1090
1145
0
200
400
600
800
1000
1200
2014 2015 2016 2017 2018 2019
災害対応でSNSを情報発信に活用した
市区町村数の推移1
1. https://www.kantei.go.jp/jp/singi/it2/senmon_bunka/pdf/2019SNSjititai_chousa.pd
※内閣官房IT総合戦略室(現デジタル庁)調べ
6
背景: 災害時におけるSNS利用の可能性
自治体によるSNSの活用
情報発信
• 警報・注意喚起
• 支援等に係る情報
情報収集
• 救援要請
• 被害情報の把握
2. https://www.kantei.go.jp/jp/singi/it2/senmon_bunka/pdf/2019SNSjititai_chousa.pd
107
28
301
522
156
0 200 400 600
実災害で活用している
防災訓練や実証実験で
活用している
活用について,検討中
関心はあるが,
検討したことはない
検討したことはない
災害対応においてSNSを活用した
情報収集の実施状況(市町村数2019年度)2
※内閣官房IT総合戦略室(現デジタル庁)調べ
7
情報過多の原因
• デマの拡散
• ニュース報道や他メディアの影響
• 被災地以外からの無関係な発信
問題: 情報過多による情報埋没
自治体によるSNS活用の現状
SNSを利用した情報収集には
マンパワーで対応
2019年台風19号 長野県
50件の救助に繋がる
一方で,
「教訓はどこに/5 災害救援 SNSの功罪」, 毎日新聞, https://mainichi.jp/articles/20210111/ddm/010/040/006000c
8
問題: 情報埋没に対する対策
Twitterユーザによる埋没対策
• 置かれている状況の明確な描写
• 番地までの詳細な住所・建物名
• #救助(ハッシュタグ)などの利用
• 現在の状況を示す写真(被害状況など)
事前に機械的な情報選別が必要
自治体はマンパワーで, 画像や本文から複合的に判断
9
問題: 情報埋没に対するアプローチ
必要な情報をピンポイントで抽出
位置情報・地名・#救助 に着目
10
3:2018 年西日本豪雨災害における「#救助」ツイートの実態:2017 年 7 月九州北部豪雨災害との比較分析
位置情報付きツイート
全体の0.18%ほど
地名入ツイート
119,661件ツイート中 466件
ニュースや消防庁による発表が大多数
うち,救助要請ツイートは37件 #救助ツイート 内訳
1
2
3
1:都市におけるジオタグ付きツイートの統計 (<特集>人と環境に見る 高次元データフローの生成と解析)
2:救助要請ツイートの特徴の検証—令和 2 年 7 月豪雨を対象に—
問題: 情報埋没に対するアプローチ
必要な情報をピンポイントで抽出
位置情報・地名・#救助 に着目
11
3:2018 年西日本豪雨災害における「#救助」ツイートの実態:2017 年 7 月九州北部豪雨災害との比較分析
位置情報付きツイート
全体の0.18%ほど
地名入ツイート
119,661件ツイート中 466件
ニュースや消防庁による発表が大多数
うち,救助要請ツイートは37件 #救助ツイート 内訳
1
2
3
1:都市におけるジオタグ付きツイートの統計 (<特集>人と環境に見る 高次元データフローの生成と解析)
2:救助要請ツイートの特徴の検証—令和 2 年 7 月豪雨を対象に—
分析のためのツイートが確保できない
ニュース報道などの2次情報が多い
必要な情報を取りこぼす懸念
多く含まれる 無関係な情報の特徴を明らかにし,
無関係な情報を削落する必要がある
投稿されたテキストと画像を利用することで,
無関係なツイートが判別可能になるのか
それらをノイズとして扱うことはできるのか
SNS投稿のテキスト特徴・画像特徴から複合的に判断し
見るべき情報の絶対数を減らすことで,
被害状況や救助を求める投稿の抽出精度が向上する可能性
RQ: テキスト特徴と画像特徴による情報抽出
画像モダリティ
テキストモダリティ 12
試み:調査方針
調査1: 画像の分類 ノイズの調査
調査2:“被害”情報の分類
“被害”ツイートに関する調査.どの程度存在して,どのような特徴があるのか
“被害”ツイートにもノイズとなる情報は存在するのか
画像:災害時の Twitter に投稿された画像および動画の調査を行う
テキスト:分類に特徴的な単語は現れるのか.
Twitter に投稿された画像の特徴とテキストの特徴を定量的に特徴量化するために,
各モダリティごとに情報が明らかになっている必要がある
13
試み: 画像を分類し,テキストの特徴を分析
画像の分類について
人手(情報学部生4人)によって分類した
作業量:延300時間超
テキストの特徴について
TF-IDF, COS類似度を算出し,クラスごとに特徴が見られるか
投稿される画像と文章を用いて,
ノイズとして扱う情報を明らかにする
14
対象災害
令和2年7月豪雨3 7月3日から7月31日4
九州北部地方を中心に広い範囲で大雨
収集方法: キーワードによる収集
対象キーワード:「救助」or「避難」
対象期間: 7月1〜15日
収集したツイートデータ
計 476,827件
収集ツイート
3.「令和2年7月3日から豪雨へ名称を定めることについて」, 気象庁, https://www.jma.go.jp/jma/press/2007/09b/20200709_heavyrainname_ref.pdf
4.「令和2年7月豪雨の期間について」, 気象庁, https://www.jma.go.jp/jma/press/2008/04a/20200804_heavyrainperiod.pdf
ツイート数 画像付きツイート数
救助ツイート 110,261 18,197
避難ツイート 370,531 34,777
全ツイート(重複削除後) 476,827 47,434
15
調査1.画像の分類: 人手による分類
画像の分類の観点
1. 災害に関連するか
2. メインに写っているものが何か
3. ニュースに関連するか
指示した分類画像
A) 逆L字 が映り込んだ画像
B) テレビのニュースをカメラで撮影した画像
C) メディア媒体を問わず,ニュースに関する画像
D) アニメや漫画などの画像
A)逆L字 画像例
16
調査1.画像の分類: 分類クラス例
画像の分類方法
1ツイート最大4枚の画像または動画
画像1ずつ人目で確認して分類を行った
その際,ツイートテキストの確認行わず
ただし,
分類クラスで重複したツイートが存在
クラス名(抜粋)
Any ニュース
Twitter
その他SNS
ゲーム
テレビのニュース
二次元画像
人
救助
被害
避難
風景
自衛隊
天気図
防災グッズ
文書
ポスター
乗り物
17
調査1.画像の分類: 分類クラス例
画像の分類方法
1ツイート最大4枚の画像または動画
画像1ずつ人目で確認して分類を行った
その際,ツイートテキストの確認行わず
そのため,
複数の分類クラスで重複したツイートが存在
クラス名(抜粋)
Any ニュース
Twitter
その他SNS
ゲーム
テレビのニュース
二次元画像
人
救助
被害
避難
風景
自衛隊
天気図
防災グッズ
文書
ポスター
乗り物
18
調査1.画像の分類: 分類クラス例
画像の分類方法
1ツイート最題4枚の画像または動画
画像1ずつ人目で確認して分類を行った
その際,ツイートテキストの確認行わず
そのため,
複数の分類クラスで重複したツイートが存在
クラス名(抜粋)
Any ニュース
Twitter
その他SNS
ゲーム
テレビのニュース
二次元画像
人
救助
被害
避難
風景
自衛隊
天気図
防災グッズ
文書
ポスター
乗り物
19
調査1. テキスト特徴: 画像分類クラスをもとに
TF-IDFの算出
分類されたクラスの画像の元になったツイート群を用いる
その際,名詞のみを抽出(8割のクラスで頻出した単語を除く)
表1 TF-IDF 上位5単語抜粋
20
調査1. テキスト特徴: TF-IDF値から明らかになったこと
最もツイート数および,画像数が多い分類クラス
ゲーム
ゲーム内の機能を示す言葉が多く含まれる
表1 TF-IDF 上位5単語抜粋
21
調査1. テキスト特徴: TF-IDF値から明らかになったこと
テレビニュース
TF-IDFの数値は低いものの,前代未聞・安倍 特徴的な単語が見られた
表1 TF-IDF 上位5単語抜粋
22
救助
自衛隊の派遣に関する単語
防災グッズ
防災グッズに関する単語
逆L字
実際の報道に関する単語
調査1. テキスト特徴: TF-IDF値から明らかになったこと
TF-IDF上位は一応地名
欲しい投稿は実被害
23
調査1. テキスト特徴: COS類似度の算出
被害は
多くのクラス間で重複する
表2 COS類似度が高い傾向のあるクラス抜粋
分類した画像付きツイートの性質
複数の分類クラスのツイートが存在
COS類似度を見ることで
• クラスが類似したツイートか
• どのクラスで重複したか
24
調査2. 被害: 被害画像の細分化
被害の画像のみ細分化して再分類
その際,元ツイートを参照
新たに追加された分類クラス抜粋
• 自治体発信
• ライブカメラ
• ネットニュース発信
• テレビのニュース発信
• ユーザが撮影したもの
• 分類不可(外国語で投稿されているもの)
• 元ツイートが消去されていたもの
これらの分類クラスのみで
TF-IDFの算出
25
表3 際分類した被害ツイート
TF-IDF 上位5単語抜粋 (論文中では表5)
調査2. 被害: 被害画像の細分化
204
※青数字はツイート数
2689 209
95 153 101
66
被害 -テレビニュース
熊本県多摩郡特別養護老人ホーム 千寿園に関するニュース
第6位 “取材”(0.1565)
その他の分類では低い値
26
表3 際分類した被害ツイート
TF-IDF 上位5単語抜粋 (論文中では表5)
調査2. 被害: 被害画像の細分化
204
※青数字はツイート数
2689 209
95 153 101
66
被害 –自治体発信
自治体が災害情報を発信する場合,具体的な被害のみではなく
災害という大きな区分で発信する傾向
第1位 “災害”(0.4000)
その他の分類では低い値
27
表3 際分類した被害ツイート
TF-IDF 上位5単語抜粋 (論文中では表5)
調査2. 被害: 被害画像の細分化
204
※青数字はツイート数
2689 209
95 153 101
66
被害 –元ツイート消去
救助を求めるツイートは,時間が経つor救助されることで,消去される傾向
第2位 “お願い”(0.2008)
救助を”お願いします”
というツイート多数
28
表3 際分類した被害ツイート
TF-IDF 上位5単語抜粋 (論文中では表5)
調査2. 被害: 被害画像の細分化
204
※青数字はツイート数
2689 209
95 153 101
66
被害 –ユーザが撮影
特筆すべき値や,単語は認められない
分類クラスの特徴のみから
ユーザが撮影した投稿の
抽出は困難
29
調査1の知見 ノイズ情報:ツイート数
分類結果から
ゲームなどの無関係な投稿が多く存在する
ニュースなどで報道された投稿が多く存在する
テキスト特徴から
各分類クラスの特徴となる単語が確認できた
30
単純なテキスト処理で抽出可能
ノイズとして扱うことが容易
修士論文内
調査2の知見 被害:フィルタリング後の想定ツイート数
修士論文内
31
結論:
分類結果から
• ゲームなどの無関係な投稿が多く存在する
• ニュースなどで報道された投稿が多く存在する
テキスト特徴から
• 各分類クラスの特徴となる単語が確認できた
被害画像の再分類の結果から
• 被害の投稿画像は細分化が可能
一方で,
• ユーザが撮影した被害画像の
ピンポイントな特徴化・抽出は困難
32
単純なテキスト処理で
抽出可能
ノイズとして扱うことが
容易
ノイズを削除
ユーザが撮影した被害は
残すべき情報
結果的に抽出精度向上
まとめ
• 背景:災害時の自治体によるSNS利用の増加
情報発信と情報収集
• 問題:情報過多による情報埋没
マンパワーによる現状の情報収集の困難さ
• 目的:マンパワーの軽減を目的としたツイートフィルタリング
取より捨 ノイズとして扱うこと
画像とテキスト双方を考慮
関係のないツイートを見せないことで生まれる効果
• テキスト特徴と画像特徴の考慮
ピンポイントで災害被害・救援のツイートの特徴抽出は現状困難
• 分類クラスの特徴からユーザが撮影した被害投稿の抽出は困難
無関係なツイートの特徴は比較的出やすい
• 無関係なツイートのフィルタリング後のツイート数
33

Weitere ähnliche Inhalte

Mehr von Matsushita Laboratory

TaketoFujikawa_10thComicComputing2023
TaketoFujikawa_10thComicComputing2023TaketoFujikawa_10thComicComputing2023
TaketoFujikawa_10thComicComputing2023Matsushita Laboratory
 
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパスMatsushita Laboratory
 
ChinaTakahashi_Exploration cycle finding a better dining experience: a frame...
 ChinaTakahashi_Exploration cyclefinding a better dining experience:a frame... ChinaTakahashi_Exploration cyclefinding a better dining experience:a frame...
ChinaTakahashi_Exploration cycle finding a better dining experience: a frame...Matsushita Laboratory
 
Unification of Terminology for Accurate Communication among Experts --- Basic...
Unification of Terminology for Accurate Communication among Experts --- Basic...Unification of Terminology for Accurate Communication among Experts --- Basic...
Unification of Terminology for Accurate Communication among Experts --- Basic...Matsushita Laboratory
 
JSAI2023_企画セッション(仕掛学)資料
JSAI2023_企画セッション(仕掛学)資料JSAI2023_企画セッション(仕掛学)資料
JSAI2023_企画セッション(仕掛学)資料Matsushita Laboratory
 
触感に関わる共感覚的表現と基本6感情の対応関係の検証
触感に関わる共感覚的表現と基本6感情の対応関係の検証触感に関わる共感覚的表現と基本6感情の対応関係の検証
触感に関わる共感覚的表現と基本6感情の対応関係の検証Matsushita Laboratory
 
レシピの手順に着目した 複数の器特徴の推定
レシピの手順に着目した 複数の器特徴の推定レシピの手順に着目した 複数の器特徴の推定
レシピの手順に着目した 複数の器特徴の推定Matsushita Laboratory
 
複数の質感を複合的に提示可能な触覚提示デバイス
複数の質感を複合的に提示可能な触覚提示デバイス複数の質感を複合的に提示可能な触覚提示デバイス
複数の質感を複合的に提示可能な触覚提示デバイスMatsushita Laboratory
 
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究Matsushita Laboratory
 
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究Matsushita Laboratory
 
Kokogatari:実環境を介したリレー小説執筆ツール
Kokogatari:実環境を介したリレー小説執筆ツールKokogatari:実環境を介したリレー小説執筆ツール
Kokogatari:実環境を介したリレー小説執筆ツールMatsushita Laboratory
 
Visualization of the Relationship Between Lectures and Laboratories Using SSNMF
Visualization of the Relationship Between Lectures and Laboratories Using SSNMFVisualization of the Relationship Between Lectures and Laboratories Using SSNMF
Visualization of the Relationship Between Lectures and Laboratories Using SSNMFMatsushita Laboratory
 

Mehr von Matsushita Laboratory (20)

TaketoFujikawa_10thComicComputing2023
TaketoFujikawa_10thComicComputing2023TaketoFujikawa_10thComicComputing2023
TaketoFujikawa_10thComicComputing2023
 
SayakaHayashi_FIT2023
SayakaHayashi_FIT2023SayakaHayashi_FIT2023
SayakaHayashi_FIT2023
 
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
 
ReonHata_JSAI2023
ReonHata_JSAI2023ReonHata_JSAI2023
ReonHata_JSAI2023
 
HarukiShinkawa_FIT2023
HarukiShinkawa_FIT2023HarukiShinkawa_FIT2023
HarukiShinkawa_FIT2023
 
ChinaTakahashi_Exploration cycle finding a better dining experience: a frame...
 ChinaTakahashi_Exploration cyclefinding a better dining experience:a frame... ChinaTakahashi_Exploration cyclefinding a better dining experience:a frame...
ChinaTakahashi_Exploration cycle finding a better dining experience: a frame...
 
TaketoFujikawa_KES2023
TaketoFujikawa_KES2023TaketoFujikawa_KES2023
TaketoFujikawa_KES2023
 
Unification of Terminology for Accurate Communication among Experts --- Basic...
Unification of Terminology for Accurate Communication among Experts --- Basic...Unification of Terminology for Accurate Communication among Experts --- Basic...
Unification of Terminology for Accurate Communication among Experts --- Basic...
 
JSAI2023_企画セッション(仕掛学)資料
JSAI2023_企画セッション(仕掛学)資料JSAI2023_企画セッション(仕掛学)資料
JSAI2023_企画セッション(仕掛学)資料
 
触感に関わる共感覚的表現と基本6感情の対応関係の検証
触感に関わる共感覚的表現と基本6感情の対応関係の検証触感に関わる共感覚的表現と基本6感情の対応関係の検証
触感に関わる共感覚的表現と基本6感情の対応関係の検証
 
レシピの手順に着目した 複数の器特徴の推定
レシピの手順に着目した 複数の器特徴の推定レシピの手順に着目した 複数の器特徴の推定
レシピの手順に着目した 複数の器特徴の推定
 
TaketoFujikawa_comic2023
TaketoFujikawa_comic2023TaketoFujikawa_comic2023
TaketoFujikawa_comic2023
 
複数の質感を複合的に提示可能な触覚提示デバイス
複数の質感を複合的に提示可能な触覚提示デバイス複数の質感を複合的に提示可能な触覚提示デバイス
複数の質感を複合的に提示可能な触覚提示デバイス
 
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
 
RyotaHiguchi_MasterThesis2023
RyotaHiguchi_MasterThesis2023RyotaHiguchi_MasterThesis2023
RyotaHiguchi_MasterThesis2023
 
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
 
Kokogatari:実環境を介したリレー小説執筆ツール
Kokogatari:実環境を介したリレー小説執筆ツールKokogatari:実環境を介したリレー小説執筆ツール
Kokogatari:実環境を介したリレー小説執筆ツール
 
Visualization of the Relationship Between Lectures and Laboratories Using SSNMF
Visualization of the Relationship Between Lectures and Laboratories Using SSNMFVisualization of the Relationship Between Lectures and Laboratories Using SSNMF
Visualization of the Relationship Between Lectures and Laboratories Using SSNMF
 
iiWAS2022_Miyagawa
iiWAS2022_MiyagawaiiWAS2022_Miyagawa
iiWAS2022_Miyagawa
 
reIDR2022_takahashi.pdf
reIDR2022_takahashi.pdfreIDR2022_takahashi.pdf
reIDR2022_takahashi.pdf
 

Morino_MT