SlideShare a Scribd company logo
1 of 15
Download to read offline
複数人物姿勢推定におけるKnowledge Distillation
を用いた教師ラベル補正手法の提案
 加藤 直樹1, 2 李 天琦2  西野 剛平2 内田 祐介2
1慶應義塾大学 2株式会社ディー・エヌ・エー
研究目的
複数人物姿勢推定の高精度化
ベースとするアルゴリズム:OpenPose [Cao+ 2017]
• 画像中の複数人物の姿勢を高速かつ高精度に推定することが可能な
ボトムアップ型の姿勢推定アルゴリズム
• 関節点同士の結び付けのためにPart Affinity Fields (PAFs)を提案
CNNでPAFsを推定することによりコンテキストを考慮した上での
関節点同士の割り当てスコア算出が可能となった
Part Affinity Field
1引用1 [Zhe Cao, et al., 2017]
• Confidence Map
関節点の種類毎に作成される
各ヒートマップはアノテーションされた関節点座標を中心としたガウス
分布により生成される
• Part Affinity Field
対応関係にある関節点ペア(Limb)の種類毎に作成される
結びつける関節点ペア間の矩形内の各画素において単位ベクトル, それ
以外の画素では零ベクトルとして生成される
Part Affinity Field(左肩-左肘)Confidence Map(左肩)
• L2ロスを用いてモデルを学習
OpenPose: CNNの学習対象と学習方法
2引用1 [Zhe Cao, et al., 2017]
OpenPose:Parsing
• Confidence Mapsから各関節候補点を検出
• Part Affinity Fieldsを用いて関節候補点を結びつけ
3引用1 [Zhe Cao, et al., 2017]
教師ラベルの問題点
アノテーションから生成した教師ラベルが持つ問題点
(a) 画像外に関節点が存在するために生成できないPAFが存在する
(b) オクルージョンなどに起因するアノテーションの欠損
(c) 混雑領域を表すマスクの欠損
(a)
(b) (c)
このような教師ラベルはモデルの学習に悪影響を与える
不適切な教師ラベルの例(Confidence Maps, PAFsを重ねて表示) 4
学習済みモデルが持つ汎化性能
学習済みモデルの出力の方がアノテーションから生成した教師ラベル
よりも適切な推定となっている場合が存在する
学習済みモデルの出力を用いて教師ラベルをより適切なものへと補正する
関節点アノテーション 教師ラベル 学習済みモデルの出力
5
• 教師ラベルと学習済みモデルの出力のMax演算によりラベルを補正
ヒートマップは関節点の種類毎, PAFsはLimbの種類毎にラベルの補正を行う
画素毎に教師ラベルと学習済みモデルの出力のノルムの大きな方を採用する
•教師ラベルの不完全な箇所を補完することを意図
提案手法:教師ラベルの補正
学習済みモデルの出力補正後の教師ラベル
,= max( )
補正前の教師ラベル
6
教師ラベル補正結果例
関節点アノテーション 補正前の教師ラベル 補正後の教師ラベル
7
評価実験
• データセット
COCO 2017データセット
• 評価指標
AP:Object Keypoint Similarity (OKS) の閾値を10段階に変化させたと
きのAverage Precisionの平均値
AP50, AP75:OKSの閾値を0.5, 0.75としたときのAverage Precision
APM, APL:中サイズの人物, 大サイズの人物に対するAverage Precision
• 使用モデル
CMU-Pose (パラメータ数52.3M)
生徒モデル, 教師モデル共に同一のモデルを使用
• 比較手法
通常の学習:通常の教師ラベルによる学習
Distillation:通常のDistillation(後述)
ラベル補正:補正された教師ラベルによる学習
8
比較手法
通常の学習 Distillation
提案手法:ラベル補正 cf. Data Distillation
教師の出力を用いてラベル無しデータへ教師ラ
ベルを付与し, 学習データを増やす
重み和
9
[Geoffrey Hinton, et al., 2015]
[Ilija Radosavovic, et al., 2018]
実験結果
COCOデータセットでの比較実験結果
Distillationにおけるλの値は教師モデルの出力から算出したロスの比率を表す
• 教師ラベルの補正により通常の学習と比べ2.3%の精度向上
• Distillation (λ = 0.5) では通常のラベルから求めたロスがモデルの学習に
悪影響を与える分精度が低下
• Distillation (λ = 1) では既存の教師ラベルを用いないため精度が低下
• ラベル補正による既存の教師ラベルを活かした学習の効果性を実証
10
ラベル補正が有効に働いた例
11
関節点アノテーション 補正前の教師ラベル 補正後の教師ラベル教師モデルの出力
ラベル補正が有効に働かなかった例
12
関節点アノテーション 補正前の教師ラベル 補正後の教師ラベル教師モデルの出力
まとめ
• Confidence Maps, PAFsを用いた複数人物姿勢推定手法における不適
切な教師ラベルの存在を指摘
画像外に関節点が存在するために生成できないPAFが存在
オクルージョンなどに起因するアノテーションの欠損
混雑領域を表すマスクの欠損
• Knowledge Distillationによる教師ラベルの補正手法を提案
通常ラベルと教師モデル出力のMax演算により教師ラベルの欠損を補完
• 提案手法によりCOCOデータセットにおいて2.3%の精度向上を達成
関節点アノテーション 補正前の教師ラベル 補正後の教師ラベル
13
参考文献
[1] Zhe Cao, et al., Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields,
in CVPR, 2017.
https://arxiv.org/abs/1611.08050.pdf
[2] Geoffrey Hinton et al., Distilling the Knowledge in a Neural Network, 2015.
https://arxiv.org/abs/1503.02531.pdf
[3] Ilija Radosavovic, et al., Data Distillation: Towards Omni-Supervised Learning, in
CVPR, 2018.
https://arxiv.org/abs/1712.04440.pdf
14

More Related Content

Recently uploaded

Recently uploaded (12)

論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 

Featured

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

複数人物姿勢推定におけるKnowledge Distillationを用いた教師ラベル補正手法の提案