ReonHata_JSAI2023

M
Matsushita LaboratoryMatsushita Laboratory
皮肉文検出のための皮肉状況の検出
関西大学
◯畑 玲音 ・森野 穣 ・松下 光範
・悪口を言う「誹謗」とデマを言う「中傷」の組み合わせ語
・罵倒,デマ,揶揄,皮肉,嫌がらせ,etc.
誹謗中傷
・SNSでの誹謗中傷が問題になっている
・通報から削除やアカウント凍結など対策
SNSでの誹謗中傷
1/31
・Twitterでは1分間に約34万件のツイート
・その中から誹謗中傷を見つけ通報は人手では限界
誹謗中傷の検出の研究が行われている
・自動的に誹謗中傷を検出することで迅速な対応
対策の限界
・悪口単語の検出,感情分析,係り受け解析
2/31
・誹謗中傷のうち皮肉の検出が難しい
対象の欠点や弱点を遠回しに批判する言語現象
皮肉
ネガティブな対象
(ゴミ屋敷)
ポジティブな対象
(新築の家)
否定表現
(汚い家だね)
肯定表現
(綺麗な家だね)
⽪⾁
例)ゴミ屋敷で綺麗な家だね
検出における問題
3/31
・皮肉は文の表層的な意味とその意図が一致しない
・悪口単語を含まないことが多い
・感情分析ではポジティブな単語を含む
皮肉の検出は難しい
誹謗中傷検出においての皮肉
「君は講義中にゲーム出来て楽しそうだね」
楽しそうだね ≠ 講義に集中していないよねぇ
4/31
背景
・皮肉は肯定表現を用いている
→ 意図しない誹謗中傷が発生する可能性がある
調子が悪かった小谷 過去の動画を見て
「すごい」と投稿
小谷はその肯定表現を
皮肉に捉え誹謗中傷となる
誹謗中傷における皮肉検出の有用性
5/31
[1]肥合智史, 嶋田和孝: 皮肉検出のための皮肉の対象の推定, 研究報告ドキュメントコミュニケーション(DC), Vol. 2018, No. 2, pp. 1–5 (2018).
・皮肉対象が含まれる文を皮肉として検出
肥合ら:皮肉検出のための皮肉の対象の推定[1]
「始発から遅延なんて 幸先がいいですね 」
肯定表現
・皮肉対象が非明示だと検出できない
「 君 は講義中にゲーム出来て 楽しそうだね 」
皮肉対象 肯定表現
皮肉の検出
6/31
皮肉対象の推定
・「対象」と「肯定表現」が同じでも皮肉対象が判断可能
・字面で見るとどちらも「君」が「楽しそう」
楽しそうだね」
ご飯を食べるときに
非皮肉
対象 肯定表現
講義中にゲーム出来て
対象 肯定表現
皮肉 楽しそうだね」
「君は
「君は
7/31
・「対象」と「肯定表現」以外の文に着目
皮肉対象の推定
対象を皮肉対象にさせるような内容が含まれていると仮説
楽しそうだね」
ご飯を食べるときに
非皮肉
対象 肯定表現
講義中にゲーム出来て
対象 肯定表現
皮肉 楽しそうだね」
「君は
「君は
8/31
・対象を皮肉対象にさせるような内容を検出
皮肉の検出
「君は講義中にゲーム出来て楽しそうだね」
対象の文を検出
「君は講義中にゲーム出来て楽しそうだね」
文の入力
皮肉として検出
9/31
テスト前に部屋を綺麗にするなんて
あなたは余裕ね
皮肉文
皮肉の構成要素
・皮肉文は二つの構成要素に分けれるのではないか
「 , 」
10/31
テスト前に部屋を綺麗にするなんて
あなたは余裕ね
皮肉文
皮肉の構成要素
・皮肉文は二つの構成要素に分けれるのではないか
「 , 」
11/31
テストの点数が悪い
時間が全くない
テスト勉強をしていない
コンテクストな情報が必要
皮肉の構成要素〜皮肉表現〜
・皮肉文は二つの構成要素に分けれるのではないか
・単体では皮肉にも肯定表現にもなる
・評価表現(N/P)=「皮肉表現」
テスト前に部屋を綺麗にするなんて
あなたは余裕ね
皮肉文
「 , 」
12/31
皮肉を構成しうる状況
=
皮肉状況
テスト前に部屋を綺麗にするなんて
あなたは余裕ね
皮肉文
皮肉の構成要素〜皮肉状況〜
・皮肉文は二つの構成要素に分けれるのではないか
「 , 」
・評価が皮肉になる条件節
・状況を説明している部分
13/31
皮肉状況
テスト前に部屋を綺麗にするなんて
構成要素から皮肉の検出
・コンテクストが集約されていると仮説
・「という皮肉」をつけて皮肉だと判断することができる
皮肉状況を検出することで
皮肉の検出が可能??
=
テスト勉強をしていない,テストの点数が悪い,時間がない
14/31
・皮肉状況と非皮肉状況を分類することにより検出を行う
状況を表す文から皮肉状況の検出を検証
本研究
皮肉状況の検出
・目的:皮肉状況に特徴があり検出できるのかを検証
15/31
②皮肉文に含まれる皮肉状況が検出
①状況文を皮肉状況と非皮肉状況に分類
提案手法
皮肉・非皮肉状況の分類器
学習
入力
皮肉状況
出力
状況文コーパス
①
皮肉状況文コーパス
②
16/31
提案手法
皮肉・非皮肉状況の分類器
学習
状況文コーパス
①
・文章から皮肉状況が検出できるのか
・状況文コーパスを構築,分類器を作成を行う
・状況文コーパスを学習:テスト=8:2に分けて検証
①状況文を皮肉状況と非皮肉状況に分類
皮肉状況
非皮肉状況
分類
17/31
②皮肉文に含まれる皮肉状況が検出
①状況文を皮肉状況と非皮肉状況に分類
提案手法
皮肉・非皮肉状況の分類器
学習
入力
皮肉状況
出力
状況文コーパス
①
皮肉状況文コーパス
②
18/31
②皮肉文に含まれる皮肉状況が検出
提案手法
皮肉・非皮肉状況の分類器
入力
皮肉状況
出力
皮肉状況文コーパス
②
・皮肉を検出するために有効か検証
・皮肉状況文コーパスを構築,分類器で検証
・皮肉状況文コーパスの皮肉状況が検出可能かを検証
19/31
・Twitter APIで「という奇跡」をクエリとして取得
非皮肉状況
・皮肉状況と同様の処理で抽出
状況文コーパス:状況(皮肉・非皮肉)を表す文の集合 各2,500件
・Twitter APIで「という皮肉」をクエリとして取得
皮肉状況
・「という皮肉」を削除することで皮肉状況の抽出
コーパスの作成〜状況文コーパス 〜
ex)「 裁判官が法を犯す という皮肉」
ex)「 推しと会話できる という奇跡」
20/31
皮肉状況文コーパス:皮肉文に含まれる皮肉状況文の集合 3094件
・「(皮肉)」,「#皮肉」をクエリとして取得 ※クエリの単語は削除
皮肉文
・クラウドソーシングを用いて2/3人以上が皮肉と判断した文を使用
皮肉文 = + 皮肉状況
皮肉文 「あなたは余裕ね,テスト前に部屋を綺麗にするなんて」
皮肉文に含まれる皮肉状況
コーパスの作成〜皮肉状況文コーパス 〜
皮肉表現
21/31
皮肉状況文コーパス:皮肉文に含まれる皮肉状況文の集合 3094件
・「(皮肉)」,「#皮肉」をクエリとして取得 ※クエリの単語は削除
皮肉文
・クラウドソーシングを用いて2/3人以上が皮肉と判断した文を使用
皮肉文 = + 皮肉状況
皮肉文 「あなたは余裕ね,テスト前に部屋を綺麗にするなんて」
皮肉文に含まれる皮肉状況
コーパスの作成〜皮肉状況文コーパス 〜
22/31
・Yahoo!クラウドソーシングを用いて皮肉表現の記述を求めた
皮肉状況
・皮肉表現を削除すると皮肉状況が残らない文は除外
ex) 「日本ってつくづく平和ですね」→「日本って」
皮肉状況文コーパス:皮肉文に含まれる皮肉状況文の集合 3094件
コーパスの作成〜皮肉状況文コーパス 〜
削除
皮肉文 「あなたは余裕ね,テスト前に部屋を綺麗にするなんて」
23/31
・状況文を皮肉状況と非皮肉状況に分類する分類器
・状況文コーパスのうち各2,000件を用いて学習
・文脈を理解する事ができる
BERT
・少ないデータでも扱いやすい
分類器の作成
・学習にはBERTを使用
24/31
・その文だけでは状況を判断できない文
・皮肉として用いられてる奇跡的状況
・状況文コーパスの分類をした分類器の正解率0.867
結果と考察
皮肉と誤判断した例
例「寝て起きたら症状が回復する(という奇跡)」
例「合致している情報が何一つない(という奇跡)」
25/31
・その文だけでは状況を判断できない文
・皮肉として用いられてる奇跡的状況
・状況文コーパスの分類をした分類器の正解率0.867
結果と考察
皮肉と誤判断した例
例「寝て起きたら症状が回復する(という奇跡)」
例「合致している情報が何一つ(という奇跡)」
・皮肉状況だけでなく評価表現も含めた検出を行う
・「奇跡」以外の非皮肉文を含めた学習が必要
26/31
・ポジティブな内容の皮肉状況
・前処理で必要情報の誤削除
・状況文コーパスの分類をした分類器の正解率0.867
結果と考察
非皮肉と誤判断した例
例「私は真顔の方が綺麗(という皮肉)」
例「良い子はみんなご褒美をもらえる(という皮肉)」
27/31
・ポジティブな内容の皮肉状況
・前処理で必要情報の誤削除
・状況文コーパスの分類をした分類器の正解率0.867
結果と考察
非皮肉と誤判断した例
例「私は真顔の方が綺麗(という皮肉)」
例「良い子はみんなご褒美をもらえる(という皮肉)」
・「〜の方が」などのパターンによる検出
・コーパスの作成方法の再検討
28/31
結果と考察
・皮肉に含まれる皮肉状況を検出した正解率0.788
・想像できる背景や前提知識が必要
非皮肉と誤判断した例
例「ご近所さんはすでにビニールプールで大はしゃぎ」
・非皮肉状況に類似した文
例「居眠りしても年収1000万超えできる」
29/31
結果と考察
・皮肉に含まれる皮肉状況を検出した正解率0.788
・想像できる背景や前提知識が必要
非皮肉と誤判断した例
例「ご近所さんはすでにビニールプールで大はしゃぎ」
・非皮肉状況に類似した文
例「居眠りしても年収1000万超えできる」
・コンテクストや前提知識を組み込んだ検出
・「奇跡」以外の非皮肉文を含めた学習が必要
30/31
ネガティブ状況から皮肉状況の検出
皮肉状況の検出から皮肉の検出を検証
・皮肉状況が含まれる文を皮肉として検出
検出した文が皮肉状況か検証
・状況文のネガポジによる判断が行われた可能性がある
展望
皮肉対象が存在しない皮肉の検出
31/31
背景 : SNSでの誹謗中傷が問題,皮肉の検出が困難
大問題 : 皮肉状況に着目して皮肉の検出を試みる
小問題 : 皮肉状況の検出を試みる
実装 : 状況文・皮肉状況文コーパスの作成,分類器の作成
実験 : 分類器の精度検証,皮肉文の皮肉状況の検出可能か検証
結果 : 状況文であるとき皮肉状況の検出可能
展望 :検出した文が皮肉状況か検証,皮肉状況から皮肉の検出
まとめ
1 von 33

Recomendados

TaketoFujikawa_10thComicComputing2023 von
TaketoFujikawa_10thComicComputing2023TaketoFujikawa_10thComicComputing2023
TaketoFujikawa_10thComicComputing2023Matsushita Laboratory
97 views24 Folien
SayakaHayashi_FIT2023 von
SayakaHayashi_FIT2023SayakaHayashi_FIT2023
SayakaHayashi_FIT2023Matsushita Laboratory
19 views19 Folien
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス von
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパスMatsushita Laboratory
48 views23 Folien
HarukiShinkawa_FIT2023 von
HarukiShinkawa_FIT2023HarukiShinkawa_FIT2023
HarukiShinkawa_FIT2023Matsushita Laboratory
51 views24 Folien
Exploration cycle finding a better dining experience: a framework of meal-pl... von
 Exploration cyclefinding a better dining experience:a framework of meal-pl... Exploration cyclefinding a better dining experience:a framework of meal-pl...
Exploration cycle finding a better dining experience: a framework of meal-pl...Matsushita Laboratory
98 views24 Folien
TaketoFujikawa_KES2023 von
TaketoFujikawa_KES2023TaketoFujikawa_KES2023
TaketoFujikawa_KES2023Matsushita Laboratory
450 views26 Folien

Más contenido relacionado

Más de Matsushita Laboratory

触感に関わる共感覚的表現と基本6感情の対応関係の検証 von
触感に関わる共感覚的表現と基本6感情の対応関係の検証触感に関わる共感覚的表現と基本6感情の対応関係の検証
触感に関わる共感覚的表現と基本6感情の対応関係の検証Matsushita Laboratory
152 views24 Folien
レシピの手順に着目した 複数の器特徴の推定 von
レシピの手順に着目した 複数の器特徴の推定レシピの手順に着目した 複数の器特徴の推定
レシピの手順に着目した 複数の器特徴の推定Matsushita Laboratory
122 views24 Folien
TaketoFujikawa_comic2023 von
TaketoFujikawa_comic2023TaketoFujikawa_comic2023
TaketoFujikawa_comic2023Matsushita Laboratory
96 views35 Folien
複数の質感を複合的に提示可能な触覚提示デバイス von
複数の質感を複合的に提示可能な触覚提示デバイス複数の質感を複合的に提示可能な触覚提示デバイス
複数の質感を複合的に提示可能な触覚提示デバイスMatsushita Laboratory
245 views26 Folien
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究 von
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究Matsushita Laboratory
214 views52 Folien
RyotaHiguchi_MasterThesis2023 von
RyotaHiguchi_MasterThesis2023RyotaHiguchi_MasterThesis2023
RyotaHiguchi_MasterThesis2023Matsushita Laboratory
96 views24 Folien

Más de Matsushita Laboratory(20)

触感に関わる共感覚的表現と基本6感情の対応関係の検証 von Matsushita Laboratory
触感に関わる共感覚的表現と基本6感情の対応関係の検証触感に関わる共感覚的表現と基本6感情の対応関係の検証
触感に関わる共感覚的表現と基本6感情の対応関係の検証
レシピの手順に着目した 複数の器特徴の推定 von Matsushita Laboratory
レシピの手順に着目した 複数の器特徴の推定レシピの手順に着目した 複数の器特徴の推定
レシピの手順に着目した 複数の器特徴の推定
複数の質感を複合的に提示可能な触覚提示デバイス von Matsushita Laboratory
複数の質感を複合的に提示可能な触覚提示デバイス複数の質感を複合的に提示可能な触覚提示デバイス
複数の質感を複合的に提示可能な触覚提示デバイス
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究 von Matsushita Laboratory
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究 von Matsushita Laboratory
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
Kokogatari:実環境を介したリレー小説執筆ツール von Matsushita Laboratory
Kokogatari:実環境を介したリレー小説執筆ツールKokogatari:実環境を介したリレー小説執筆ツール
Kokogatari:実環境を介したリレー小説執筆ツール
Visualization of the Relationship Between Lectures and Laboratories Using SSNMF von Matsushita Laboratory
Visualization of the Relationship Between Lectures and Laboratories Using SSNMFVisualization of the Relationship Between Lectures and Laboratories Using SSNMF
Visualization of the Relationship Between Lectures and Laboratories Using SSNMF
理学療法初学者の支援を目的とした動作分析テキストの構造の可視化 von Matsushita Laboratory
理学療法初学者の支援を目的とした動作分析テキストの構造の可視化理学療法初学者の支援を目的とした動作分析テキストの構造の可視化
理学療法初学者の支援を目的とした動作分析テキストの構造の可視化
半教師ありNMFを用いた裁判事例に関連する憲法条項の推定 von Matsushita Laboratory
半教師ありNMFを用いた裁判事例に関連する憲法条項の推定半教師ありNMFを用いた裁判事例に関連する憲法条項の推定
半教師ありNMFを用いた裁判事例に関連する憲法条項の推定
学術論文の特徴を用いた データセット特性の表現に関する研究 von Matsushita Laboratory
学術論文の特徴を用いた データセット特性の表現に関する研究学術論文の特徴を用いた データセット特性の表現に関する研究
学術論文の特徴を用いた データセット特性の表現に関する研究

Último

定例会スライド_キャチs 公開用.pdf von
定例会スライド_キャチs 公開用.pdf定例会スライド_キャチs 公開用.pdf
定例会スライド_キャチs 公開用.pdfKeio Robotics Association
135 views64 Folien
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」 von
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PC Cluster Consortium
27 views36 Folien
Windows 11 information that can be used at the development site von
Windows 11 information that can be used at the development siteWindows 11 information that can be used at the development site
Windows 11 information that can be used at the development siteAtomu Hidaka
90 views41 Folien
SSH応用編_20231129.pdf von
SSH応用編_20231129.pdfSSH応用編_20231129.pdf
SSH応用編_20231129.pdficebreaker4
405 views13 Folien
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向 von
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Hitachi, Ltd. OSS Solution Center.
101 views26 Folien
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」 von
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PC Cluster Consortium
66 views12 Folien

Último(12)

PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」 von PC Cluster Consortium
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
Windows 11 information that can be used at the development site von Atomu Hidaka
Windows 11 information that can be used at the development siteWindows 11 information that can be used at the development site
Windows 11 information that can be used at the development site
Atomu Hidaka90 views
SSH応用編_20231129.pdf von icebreaker4
SSH応用編_20231129.pdfSSH応用編_20231129.pdf
SSH応用編_20231129.pdf
icebreaker4405 views
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」 von PC Cluster Consortium
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
SNMPセキュリティ超入門 von mkoda
SNMPセキュリティ超入門SNMPセキュリティ超入門
SNMPセキュリティ超入門
mkoda479 views
The Things Stack説明資料 by The Things Industries von CRI Japan, Inc.
The Things Stack説明資料 by The Things IndustriesThe Things Stack説明資料 by The Things Industries
The Things Stack説明資料 by The Things Industries
CRI Japan, Inc.78 views
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料) von NTT DATA Technology & Innovation
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20... von NTT DATA Technology & Innovation
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
光コラボは契約してはいけない von Takuya Matsunaga
光コラボは契約してはいけない光コラボは契約してはいけない
光コラボは契約してはいけない
Takuya Matsunaga27 views

ReonHata_JSAI2023