SlideShare a Scribd company logo
1 of 22
AIを騙す
~敵対的サンプル
~
東京大学大学院
情報理工学系研究科
数理情報学専攻
福地成彦
コンテンツ
1. 自己紹介
2. 敵対的サンプルとは
3. 作り方
4. 防ぎ方
5. 敵対的サンプルの原因
6. 精度 vs 安全性
7. ニューラルネットワークの特性
8. まとめ
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 2
自己紹介
 福地成彦 (Fukuchi Akihiko)
 東京大学大学院情報理工学系研究科数字情報学専攻修士課程
 専門:reservoir computing, NLP
 今回話す内容は趣味
 つぶグミが好き
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 3
以下の画像は何?
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 4
1.パンダ
2.プードル
3.テナガザル
I. J. Goodfellow, J. Shlens, and C. Szegedy, “Explaining and Harnessing
Adversarial Examples,” Dec. 2014.
画像1
GoogleNetは以下の画像を何と判定する?
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 6
1.パンダ
2.プードル
3.テナガザル
画像2
敵対的サンプルとは
 機械学習のモデルが間違って識別するように加工された入力
 大抵の場合、ヒトにはわからない程度に加工されている
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 7
テナガザル
+ =
I. J. Goodfellow, J. Shlens, and C. Szegedy, “Explaining and Harnessing
Adversarial Examples,” Dec. 2014.
作り方
攻撃対象のネットワークにアクセスできる場合
(何でも良いから不正解にしたい場合)
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 8
パンダ
P(c|x)
cross entropy (予測と正解の差 )
cross entropy を上げる
+
モデルが無くても攻撃できる; 敵対的サンプルの転移性
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 11
モデルAパンダ プードル
モデルB
(未知)
プードル
プードル
防御方法の一例; ADVERSARIAL TRAINING
敵対的サンプルを防ぎたいなら、敵対的サンプルを学習させればよい
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 12
プードルパンダ
パンダプードル ではなく
* 敵対的サンプルなどのノイズで
外乱されないことを「ロバスト」
という
なぜ敵対的生成ができるのか?
複数の原因が指摘されている
 Batch normalization
 多次元性
 ニューラルネットワークの線形性
 ニューラルネットワークの精度
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 13
精度 VS 安全性
 D. Tsipras, S. Santurkar, L. Engstrom, A.
Turner, and A. Madry, “Robustness May Be
at Odds with Accuracy,” 2018.
 Adversarial trainingを行ったCNNは標準の
学習をしたCNNに比べて低精度
 精度と敵対的サンプルへの防御力は両立
しない!?
* CNN: 畳み込みニューラルネットワーク
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 14
精度 VS 安全性
 D. Su, H. Zhang, H. Chen, J. Yi, P. Y. Chen, and Y.
Gao, “Is robustness the cost of accuracy? – A
comprehensive study on the robustness of 18
deep image classification models,” Lect. Notes
Comput. Sci. (including Subser. Lect. Notes Artif.
Intell. Lect. Notes Bioinformatics), vol. 11216
LNCS, pp. 644–661, Aug. 2018.
 CNNのモデルのロバスト性の比較
 標準の精度が高いモデルが高いほ
ど敵対的サンプルの攻撃に弱い
 精度と安全性のトレードオフ
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 15
そもそもCNNはヒトと違う特徴を見てる
 R. Geirhos, P. Rubisch, C. Michaelis, M. Bethge, F. A. Wichmann, and W. Brendel, “ImageNet-trained
CNNs are biased towards texture; increasing shape bias improves accuracy and robustness,” Nov. 2018.
 CNNはテクスチャを判断の根拠にしがち。あまり形(空間的な配置)を見ていない。
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 16
CNNは何を見ているんだ?
 A. Ilyas, S. Santurkar, D. Tsipras, L. Engstrom, B.
Tran, and A. Madry, “Adversarial Examples Are
Not Bugs, They Are Features,” May 2019.
 Adversarial trainingをしたネットワークを用い
て、敵対的サンプルに対して「ロバストな特徴
量」と「ロバストでない特徴量」を抽出
 人間には知覚できないような「弱い」特徴量を
使うことで、高精度を出しているのでは?
*「ロバストでない特徴量」については批判的な議論もある
L. Engstrom et al., “A Discussion of ‘Adversarial Examples Are Not Bugs, They Are Features,’” Distill,
vol. 4, no. 8, p. e19, Aug. 2019.
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 17
“airplane’’ “ship’’ “dog’’ “frog’’“truck’’
DbDNR
bDR
(a)
まとめ
 敵対的サンプル (adversarial examples)は機械学習のモデルが間違って識別す
るように加工された入力
 手元にターゲットとなるモデルがなくても敵対的サンプルが可能
 Adversarial trainingをすれば、ある程度防御可能
 敵対的サンプルの原因はいくつか指摘されている
 CNNの高精度の裏には、敵対的サンプルに対する脆弱性が隠れているかも
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 18
参考文献
 [1] A. Ilyas, S. Santurkar, D. Tsipras, L. Engstrom, B. Tran, and A. Madry, “Adversarial Examples Are Not Bugs, They Are Features,” May 2019.
 [2] D. Hendrycks and T. Dietterich, “Benchmarking Neural Network Robustness to Common Corruptions and Perturbations,” 2019.
 [3] D. Su, H. Zhang, H. Chen, J. Yi, P. Y. Chen, and Y. Gao, “Is robustness the cost of accuracy? – A comprehensive study on the robustness of 18 deep image
classification models,” Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics), vol. 11216 LNCS, pp. 644–661, Aug. 2018.
 [4] M. A. Alcorn et al., “Strike (with) a Pose: Neural Networks Are Easily Fooled by Strange Poses of Familiar Objects,” Nov. 2018.
 [5] S. Thys, W. Van Ranst, and T. Goedemé, “Fooling automated surveillance cameras: adversarial patches to attack person detection,” 2019.
 [6] D. Tsipras, S. Santurkar, L. Engstrom, A. Turner, and A. Madry, “Robustness May Be at Odds with Accuracy,” 2018.
 [7] R. Geirhos, P. Rubisch, C. Michaelis, M. Bethge, F. A. Wichmann, and W. Brendel, “ImageNet-trained CNNs are biased towards texture; increasing shape bias
improves accuracy and robustness,” Nov. 2018.
 [8] A. Athalye, L. Engstrom, A. Ilyas, and K. Kwok, “Synthesizing Robust Adversarial Examples,” 2018.
 [9] I. J. Goodfellow, J. Shlens, and C. Szegedy, “Explaining and Harnessing Adversarial Examples,” Dec. 2014.
 [10] L. Engstrom, A. Ilyas, S. Santurkar, D. Tsipras, B. Tran, and A. Madry, “Learning Perceptually-Aligned Representations via Adversarial Robustness,” 2019.
 [11] N. Papernot, P. McDaniel, I. Goodfellow, S. Jha, Z. B. Celik, and A. Swami, “Practical Black-Box Attacks against Machine Learning,” Feb. 2016.
 [12] S. Santurkar, D. Tsipras, B. Tran, A. Ilyas, L. Engstrom, and A. Madry, “Computer Vision with a Single (Robust) Classifier,” Jun. 2019.
 [13] L. Engstrom et al., “A Discussion of ‘Adversarial Examples Are Not Bugs, They Are Features,’” Distill, vol. 4, no. 8, p. e19, Aug. 2019.
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 19
ご清聴ありがとうございました
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 20
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 21
作り方
攻撃対象のネットワークにアクセスできる場合
(特定のラベルに誤識別させたい場合)
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 22
プードル
P(c|x)
cross entropy (予測と正解の差 )
cross entropy
を下げる
+
いろいろな敵対的サンプル
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 23
物体検出器で人間と識別されないようなパッチを作成
S. Thys, W. Van Ranst, and T. Goedemé, “Fooling automated surveillance cameras: adversarial patches to attack person detection,” 2019.
いろいろな敵対的サンプル
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 24
ニューラルネットワークが誤識別するような置物を3Dプリンターで印刷
A. Athalye, L. Engstrom, A. Ilyas, and K. Kwok, “Synthesizing Robust Adversarial Examples,” 2018.
いろいろな敵対的サンプル
2019/11/29ADVERSARIAL EXAMPLE, FUKUCHI AKIHIKO 25
M. A. Alcorn et al., “Strike (with) a Pose: Neural Networks Are
Easily Fooled by Strange Poses of Familiar Objects,” Nov.
2018.
ニューラルネットワークが誤識別するような3D オブジェクトの配置を生成

More Related Content

Recently uploaded

Recently uploaded (7)

業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 

Featured

Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Saba Software
 
Introduction to C Programming Language
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming Language
Simplilearn
 

Featured (20)

How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
 
Introduction to C Programming Language
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming Language
 

[全脳アーキテクチャ若手の会45回カジュアルトーク]敵対的サンプル