Suche senden
Hochladen
Training object class detectors with click supervision
•
0 gefällt mir
•
29,348 views
Takanori Ogata
Folgen
ハワイ輪読会 2017資料
Weniger lesen
Mehr lesen
Technologie
Melden
Teilen
Melden
Teilen
1 von 30
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Empfohlen
高速な物体候補領域提案手法 (Fast Object Proposal Methods)
高速な物体候補領域提案手法 (Fast Object Proposal Methods)
Takao Yamanaka
DNNの曖昧性に関する研究動向
DNNの曖昧性に関する研究動向
Naoki Matsunaga
Rethinking and Beyond ImageNet
Rethinking and Beyond ImageNet
cvpaper. challenge
【DL輪読会】ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders
【DL輪読会】ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders
Deep Learning JP
[DL輪読会]A closer look at few shot classification
[DL輪読会]A closer look at few shot classification
Deep Learning JP
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII
[DL輪読会]A Style-Based Generator Architecture for Generative Adversarial Networks
[DL輪読会]A Style-Based Generator Architecture for Generative Adversarial Networks
Deep Learning JP
Empfohlen
高速な物体候補領域提案手法 (Fast Object Proposal Methods)
高速な物体候補領域提案手法 (Fast Object Proposal Methods)
Takao Yamanaka
DNNの曖昧性に関する研究動向
DNNの曖昧性に関する研究動向
Naoki Matsunaga
Rethinking and Beyond ImageNet
Rethinking and Beyond ImageNet
cvpaper. challenge
【DL輪読会】ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders
【DL輪読会】ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders
Deep Learning JP
[DL輪読会]A closer look at few shot classification
[DL輪読会]A closer look at few shot classification
Deep Learning JP
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII
[DL輪読会]A Style-Based Generator Architecture for Generative Adversarial Networks
[DL輪読会]A Style-Based Generator Architecture for Generative Adversarial Networks
Deep Learning JP
【論文読み会】Universal Language Model Fine-tuning for Text Classification
【論文読み会】Universal Language Model Fine-tuning for Text Classification
ARISE analytics
Neural networks and deep learning
Neural networks and deep learning
Jörgen Sandig
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
Deep Learning JP
MixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised Learning
harmonylab
Noisy Labels と戦う深層学習
Noisy Labels と戦う深層学習
Plot Hong
Conditional CycleGANによる食事画像変換
Conditional CycleGANによる食事画像変換
Ryosuke Tanno
[DL Hacks]Self-Attention Generative Adversarial Networks
[DL Hacks]Self-Attention Generative Adversarial Networks
Deep Learning JP
【DL輪読会】Dropout Reduces Underfitting
【DL輪読会】Dropout Reduces Underfitting
Deep Learning JP
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
Deep Learning JP
An introduction to Machine Learning (and a little bit of Deep Learning)
An introduction to Machine Learning (and a little bit of Deep Learning)
Thomas da Silva Paula
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
Takuji Tahara
[DL輪読会]StarGAN: Unified Generative Adversarial Networks for Multi-Domain Ima...
[DL輪読会]StarGAN: Unified Generative Adversarial Networks for Multi-Domain Ima...
Deep Learning JP
MS COCO Dataset Introduction
MS COCO Dataset Introduction
Shinagawa Seitaro
semantic segmentation サーベイ
semantic segmentation サーベイ
yohei okawa
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
Deep Learning JP
Introduction to batch normalization
Introduction to batch normalization
Jamie (Taka) Wang
[DL輪読会]Objects as Points
[DL輪読会]Objects as Points
Deep Learning JP
異常検知と変化検知の1~3章をまとめてみた
異常検知と変化検知の1~3章をまとめてみた
Takahiro Yoshizawa
Towards Performant Video Recognition
Towards Performant Video Recognition
cvpaper. challenge
[DL輪読会]Collaborative Deep Metric Learning for Video Understanding(KDD2018)
[DL輪読会]Collaborative Deep Metric Learning for Video Understanding(KDD2018)
Deep Learning JP
Vision and Language(メタサーベイ )
Vision and Language(メタサーベイ )
cvpaper. challenge
Weitere ähnliche Inhalte
Was ist angesagt?
【論文読み会】Universal Language Model Fine-tuning for Text Classification
【論文読み会】Universal Language Model Fine-tuning for Text Classification
ARISE analytics
Neural networks and deep learning
Neural networks and deep learning
Jörgen Sandig
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
Deep Learning JP
MixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised Learning
harmonylab
Noisy Labels と戦う深層学習
Noisy Labels と戦う深層学習
Plot Hong
Conditional CycleGANによる食事画像変換
Conditional CycleGANによる食事画像変換
Ryosuke Tanno
[DL Hacks]Self-Attention Generative Adversarial Networks
[DL Hacks]Self-Attention Generative Adversarial Networks
Deep Learning JP
【DL輪読会】Dropout Reduces Underfitting
【DL輪読会】Dropout Reduces Underfitting
Deep Learning JP
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
Deep Learning JP
An introduction to Machine Learning (and a little bit of Deep Learning)
An introduction to Machine Learning (and a little bit of Deep Learning)
Thomas da Silva Paula
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
Takuji Tahara
[DL輪読会]StarGAN: Unified Generative Adversarial Networks for Multi-Domain Ima...
[DL輪読会]StarGAN: Unified Generative Adversarial Networks for Multi-Domain Ima...
Deep Learning JP
MS COCO Dataset Introduction
MS COCO Dataset Introduction
Shinagawa Seitaro
semantic segmentation サーベイ
semantic segmentation サーベイ
yohei okawa
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
Deep Learning JP
Introduction to batch normalization
Introduction to batch normalization
Jamie (Taka) Wang
[DL輪読会]Objects as Points
[DL輪読会]Objects as Points
Deep Learning JP
異常検知と変化検知の1~3章をまとめてみた
異常検知と変化検知の1~3章をまとめてみた
Takahiro Yoshizawa
Towards Performant Video Recognition
Towards Performant Video Recognition
cvpaper. challenge
Was ist angesagt?
(20)
【論文読み会】Universal Language Model Fine-tuning for Text Classification
【論文読み会】Universal Language Model Fine-tuning for Text Classification
Neural networks and deep learning
Neural networks and deep learning
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
MixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised Learning
Noisy Labels と戦う深層学習
Noisy Labels と戦う深層学習
Conditional CycleGANによる食事画像変換
Conditional CycleGANによる食事画像変換
[DL Hacks]Self-Attention Generative Adversarial Networks
[DL Hacks]Self-Attention Generative Adversarial Networks
【DL輪読会】Dropout Reduces Underfitting
【DL輪読会】Dropout Reduces Underfitting
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
An introduction to Machine Learning (and a little bit of Deep Learning)
An introduction to Machine Learning (and a little bit of Deep Learning)
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
[DL輪読会]StarGAN: Unified Generative Adversarial Networks for Multi-Domain Ima...
[DL輪読会]StarGAN: Unified Generative Adversarial Networks for Multi-Domain Ima...
MS COCO Dataset Introduction
MS COCO Dataset Introduction
semantic segmentation サーベイ
semantic segmentation サーベイ
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
Introduction to batch normalization
Introduction to batch normalization
[DL輪読会]Objects as Points
[DL輪読会]Objects as Points
異常検知と変化検知の1~3章をまとめてみた
異常検知と変化検知の1~3章をまとめてみた
Towards Performant Video Recognition
Towards Performant Video Recognition
Ähnlich wie Training object class detectors with click supervision
[DL輪読会]Collaborative Deep Metric Learning for Video Understanding(KDD2018)
[DL輪読会]Collaborative Deep Metric Learning for Video Understanding(KDD2018)
Deep Learning JP
Vision and Language(メタサーベイ )
Vision and Language(メタサーベイ )
cvpaper. challenge
Invariant Information Clustering for Unsupervised Image Classification and Se...
Invariant Information Clustering for Unsupervised Image Classification and Se...
harmonylab
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
Toru Tamaki
生活支援ロボットにおける大規模データ収集に向けて
生活支援ロボットにおける大規模データ収集に向けて
Komei Sugiura
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
オトナのプログラミング勉強会 オトナのDeep Learning 2016-11
オトナのプログラミング勉強会 オトナのDeep Learning 2016-11
Katsuhiro Morishita
Webリソースを利用したDeep Learning ~地図タイルを例として
Webリソースを利用したDeep Learning ~地図タイルを例として
IWASAKI NOBUSUKE
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
Deep Learning JP
オブジェクト指向講座
オブジェクト指向講座
Kaito Sato
Ähnlich wie Training object class detectors with click supervision
(10)
[DL輪読会]Collaborative Deep Metric Learning for Video Understanding(KDD2018)
[DL輪読会]Collaborative Deep Metric Learning for Video Understanding(KDD2018)
Vision and Language(メタサーベイ )
Vision and Language(メタサーベイ )
Invariant Information Clustering for Unsupervised Image Classification and Se...
Invariant Information Clustering for Unsupervised Image Classification and Se...
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
生活支援ロボットにおける大規模データ収集に向けて
生活支援ロボットにおける大規模データ収集に向けて
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
オトナのプログラミング勉強会 オトナのDeep Learning 2016-11
オトナのプログラミング勉強会 オトナのDeep Learning 2016-11
Webリソースを利用したDeep Learning ~地図タイルを例として
Webリソースを利用したDeep Learning ~地図タイルを例として
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
オブジェクト指向講座
オブジェクト指向講座
Mehr von Takanori Ogata
20210108 Tread: Circuits
20210108 Tread: Circuits
Takanori Ogata
20200704 Deep Snake for Real-Time Instance Segmentation
20200704 Deep Snake for Real-Time Instance Segmentation
Takanori Ogata
CVPR2019読み会@関東CV
CVPR2019読み会@関東CV
Takanori Ogata
190412 Annotation Survey@関東CV勉強会
190412 Annotation Survey@関東CV勉強会
Takanori Ogata
190410 ML@LOFT
190410 ML@LOFT
Takanori Ogata
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
Takanori Ogata
Unsupervised learning of object landmarks by factorized spatial embeddings
Unsupervised learning of object landmarks by factorized spatial embeddings
Takanori Ogata
Annotating object instances with a polygon rnn
Annotating object instances with a polygon rnn
Takanori Ogata
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
Takanori Ogata
160924 Deep Learning Tuningathon
160924 Deep Learning Tuningathon
Takanori Ogata
Convolutional Pose Machines
Convolutional Pose Machines
Takanori Ogata
Deep Learningライブラリ 色々つかってみた感想まとめ
Deep Learningライブラリ 色々つかってみた感想まとめ
Takanori Ogata
Cv20160205
Cv20160205
Takanori Ogata
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
Takanori Ogata
DeepAKB
DeepAKB
Takanori Ogata
Mehr von Takanori Ogata
(15)
20210108 Tread: Circuits
20210108 Tread: Circuits
20200704 Deep Snake for Real-Time Instance Segmentation
20200704 Deep Snake for Real-Time Instance Segmentation
CVPR2019読み会@関東CV
CVPR2019読み会@関東CV
190412 Annotation Survey@関東CV勉強会
190412 Annotation Survey@関東CV勉強会
190410 ML@LOFT
190410 ML@LOFT
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
Unsupervised learning of object landmarks by factorized spatial embeddings
Unsupervised learning of object landmarks by factorized spatial embeddings
Annotating object instances with a polygon rnn
Annotating object instances with a polygon rnn
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
160924 Deep Learning Tuningathon
160924 Deep Learning Tuningathon
Convolutional Pose Machines
Convolutional Pose Machines
Deep Learningライブラリ 色々つかってみた感想まとめ
Deep Learningライブラリ 色々つかってみた感想まとめ
Cv20160205
Cv20160205
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
DeepAKB
DeepAKB
Kürzlich hochgeladen
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
Kürzlich hochgeladen
(12)
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Training object class detectors with click supervision
1.
Training object class
detectors with click supervision ハワイ輪読会 2017 @conta_
2.
緒方 貴紀 (@conta_) CRO@ABEJA, Inc. Computer
VisionやMachine Learningの研究開発やっています が最近は何をやっているのかわかりません Self Introduction
3.
4.
簡単なアノテーションを作成するだけで、特定の物体検出がそこそこうまく いくようになる手法の提案 物体検出の教師データを、物体の中心点(center-click annotation)のみ にし、Multiple Instance
Learning(MIL)を適応することで、 教師データをBounding Boxを利用した時と同等の精度で、 アノテーターの作業時間を9〜18倍改善した What's this?
5.
Deep Leanring ✕
一般物体検出は、大抵Bounding Boxを教師データとして与える => 大量のデータが必要なので、クラウドソーシングを活用 一般物体検出を学習させるときの課題
6.
Deep Leanring ✕
一般物体検出は、大抵Bounding Boxを教師データとして与える => 大量のデータが必要なので、クラウドソーシングを活用 でも、、、 WorkerがBounding Boxをannotationするの結構時間かかる(25.5s/box) チェックに時間かかる 作業結果のクオリティー担保むずい 一般物体検出を学習させるときの課題
7.
物体にBounding Boxをつけるのではなく、物体中心をクリックするだけ => アノテータの作業大幅削減! 検出器は、Weakly
Supervised Learning(MIL)を活用することでいい感じにできそう! 簡単なアノテーションで解決!
8.
データの集め方
9.
アノテーションをする際のWorkflow
10.
アノテーションをする際のWorkflow
11.
Instructions 物体を長方形で囲った時に中心となる位置にクリックしてね! とアノテーターへ伝える
12.
アノテーションをする際のWorkflow
13.
アノテーターに、図のような多角形の画像に対して、中心をアノテーション してもらい、アノテーション後に実際の中心とどれくらいずれているかの フィードバックを与える。 => 真値との誤差が20px以下になるまでくり返す このテストをクリアすると 実際の作業へ移ることができる Annotator training
14.
アノテーションをする際のWorkflow
15.
特定の枚数(ここでは20枚)を単位として、アノテーターに実際の作業(物体 中心のクリック)をしてもらう。 Qualityを担保するために、もともとGround Truthを持っているデータを バッチごとにランダムに混ぜて(Golden questions)精度計測をする。 =>
一定のQualityに満たない人のデータは受け付けない Annotating images
16.
Amazon Mechanical Turk
(AMT) で実験 PASCAL VOC 2007でデータを作成(14,612 clicks in total for the 5,011 trainval images) Annotation time: 平均1.87s/click、3.8時間でアノテーションを完了 Data collection
17.
物体検出器の作り方
18.
Multiple Instance Learning
(MIL) [Dietterich et al., 1997] positive bags(正解を1つ以上含む) と、negative bags(正解を含まない)を 用いた機械学習手法の一つ MILによる物体検出器作成 B. Babenko, M.-H. Yang, and S. Belongie. Visual Tracking with Online Multiple Instance Learning. In CVPR, 2009
19.
Pre-trainされたAlexNet CNNとSVMを使って下記の2ステップを交互に回す (I) re-localization 識別器Aをつかって、一番スコアの高くなる物体候補の位置を探す(Multi-folding/Objectness等で物体候 補を探す) (II)
re-training (I)で探した位置をPositiveとして、識別器AをSVMにて学習させる 一定回数イテレーションを回した後、(II)のフェーズで、識別器AをFast RCNNにして再学習 MILによる物体検出器作成 物体候補pのスコアは、識別器Aと物体候補らしさO*を使って、下記のように計算する *What is an object? In CVPR, 2010
20.
■Box center score アノテーションは必ずしも正確でないので、下記の式によって物体候補の尤度をスコアリング p:
proposal covering the object c_p: center point c: the click One-click supervision 中心点のアノテーション活用方法
21.
■Use in re-localization MILで物体検出を学習させるステップ時のre-localization
step時に、 Appearance(S_ap)だけでなく、この中心尤度(S_bc)の項も使う ■Use in initialization サンプルする物体検出候補は、画像全体からでなく、画像の境界をはみ出ない 大きさでサンプリングすることで良い精度になる。特に、クリックが画像の境界に 近い場合、より良いMILの初期値を得ることができる One-click supervision
22.
1人にアノテーションしてもらうより、2人にアノテーションしてもらったほうが精度良さ そうだよね! => 2人のアノテーションした物体中心位置の差をモデリング ■Box center
score 前述の式を c => c1 and c2に置き換えるだけ ただし、右写真のように2つのクリックが離れてた場合は、 しきい値d_maxを設けて、別々の物体として扱う Two-click supervision
23.
■Box area score 物体の大きさとアノテーションの誤差は相関がある(Fig.
4) => 2つのアノテーションの距離から物体候補を推定する(Fig. 6) μ: 物体エリアの対数を推定するfunction(後術)、a_p: 物体候補エリア (a_p - μ)は2つのエリアの対数比を表す ■Use in re-localization 前述と同じような形でトータルスコアに組み合わせる Two-click supervision
24.
クリックデータを活用するために必要なパラメータは下記の4つ σ_bc: d_max: σ_ba: μ(x): Learning score parameters
25.
クリックデータを活用するために必要なパラメータは下記の4つ σ_bc: d_max: σ_ba: μ(x): Learning score parameters Qualification
Testから計算 70px(Max error distanceが70pxぐらいだったので) 2クリックの距離と 物体エリアの対数比を 多項式回帰でfitting μ(x)のaverage errorを使う
26.
■PASCAL VOC 2007 20
classes / 5,011 training images / 4,952 test images. ■Evaluation - Correct Localization (CorLoc) 物体候補が正しい位置にあるか?(Bounding Boxの重なり度合い (i.e. IoU ≧ 0.5) )を測る *Training Imageに対して計測 - mAP 学習器が正しく動くか、Test Imageに対してmAPを計測 Experimental results
27.
Experimental results
28.
■MS COCO dataset 80
classes / 82,783 training images / 40,504 val images VOC 2007と同じ条件て計測 - Click supervision COCOのデータセットに対してはクリックアノテーションを シミュレーションで行った Experimental results
29.
物体中心位置を与えるだけで物体検出ができるようになるアルゴリズムの提案 - MILを活用することで弱教師あり学習で識別器を学習する - アノテーターのクリック位置から、統計値によって物体候補枠を推定 Weakly
Supervisedなメソッドより精度が大幅に向上 アノテーションを9-18倍高速にできた Conclusion
30.
(余談) vs SOTA
Object detection algorithm J. Redmon and A. Farhadi. Yolo9000: Better, faster, stronger
Jetzt herunterladen