SlideShare ist ein Scribd-Unternehmen logo
1 von 31
Downloaden Sie, um offline zu lesen
Copyright	©	DeNA	Co.,Ltd.	All	Rights	Reserved.	
ハワイ2017読み会	
Yusuke	Uchida	(@yu4u)	
⾏けないので画像で	
気分だけ盛り上げております
1	
Photo	by	(c)Tomo.Yun	
hBp://www.yunphoto.net
Scale-Aware	Face	Detec?on
2
背景
!  マルチスケールの物体検出(sliding window)
a.  1つのスケールの物体のみを検出する検出器+画像リスケール
b.  複数のスケールの物体を検出する検出器を全スケール分
c.  少数のスケールの物体を検出する検出器+画像ピラミッド
d.  マルチスケール・シングルショット検出器
(e.g. Faster R-CNN, SSD, YOLOv2)
3	
e.g.	HOG	
+	SVM
背景
!  マルチスケールの物体検出(sliding window)
a.  1つのスケールの物体のみを検出する検出器+画像リスケール
b.  複数のスケールの物体を検出する検出器を全スケール分
c.  少数のスケールの物体を検出する検出器+画像ピラミッド
d.  マルチスケール・シングルショット検出器
(e.g. Faster R-CNN, SSD, YOLOv2)
4	
e.g.	HOG	
+	SVM
マルチスケール処理は重い!	
(おおざっぱ)
アプローチ
!  Single-scale detectorベース
!  各スケールについて、画像中にそのスケールの顔が存在するかを判定し
顔が存在するスケールのみ検出を⾏う
5	
これらのスケールには顔が存在しないので、	
検出処理をスキップ
Scale	Proposal	Network	(SPN)
フレームワーク
6	
①(計算量のため)ダウンサンプル
した⼊⼒画像をSPNに⼊⼒し	
スケール候補を取得(⻑辺448px)
②SPNで検出されたスケール候補に	
対応する画像サイズのみをリサンプル
③各リサンプルされた画像に対し	
シングルスケールの顔検出
Scale	Proposal	Network
7	
なんでも良いので	
テキトーなFCN
HxWxCの特徴マップ	
Cはスケール数
Global	max	pooling→sigmoidで	[0,	1]	
そのスケールの顔が(最低1つ)
存在する確率
W
H
C
!  正解は、⻑さがスケール数のベクトル
!  各要素は、logスケールで⼀定間隔のスケール幅に対応し
そのスケール幅内に収まるスケールの顔が存在すれば1、otherwise 0
(厳密には違うので後述)
groundtruth
スケール選択
8	
ノイズの影響を減らすため移動平均	
からのnon-maximum	suppression
•  ビンの数は結構多い	
→顔のスケールで23〜29を60分割	
•  NMSの幅は顔検出器がカバーする
スケール幅より⼩さめ	
→36-72pxなのでlogスケールで幅1	
23 29
1
1
Non−maximum	suppression詳細
検出幅
NMS幅
<1
Scale	Proposal	Networkの特徴マップ
!  SPNに対しては明⽰的に顔の場所を教えていない
!  しかし、global average pooling前の特徴マップを⾒ると
そのスケール情報だけから顔の位置も学習している!(収束遅くない?
9	
各スケールの顔が	
あるかないかだけ
この部分は結局	
マルチスケールの顔検出器もどき	
(だったらこれだけで良い気も	
もしかしたら顔のサイズの共起性
をうまく利⽤できている?)
顔のbounding	boxおよびスケールについて
!  顔のスケールは顔のbounding boxの辺の⻑さで定義される
!  しかし、顔のbounding boxはかなり主観が⼊るため
全ての訓練データで⼀貫性をもたせることが難しい
!  これに対し、顔の5点のランドマークから⾃動的にbounding boxを定義
する
⁃  利⽤するランドマーク:左⽬、右⽬、⿐、⼝元(左右)
!  5点のランドマークにより定義される正⽅形のbounding box
(中⼼+スケール):
10
SPNの出⼒の正解について
!  理想的にはそのスケール幅内に収まるスケールの顔が存在すれば1、
otherwise 0
!  ノイズがあるのでガウシアンかけてmax
!  個⼈的には近接ビンは1にして、
⼀定以上遠いところは0で、
それ以外はロス0とかのほうが好き
11	
23 29
学習データの	
顔のスケール
顔のbounding	boxについて(余談
!  データセットによってポリシーが違う
データセット間のbounding boxの違いを吸収するだけでも精度が向上
(本質的?⾒た⽬上?)
Face detection without bells and whistles, ECCVʼ14.
https://www.slideshare.net/yonetani/face-detection-without-bells-and-whistles
!  ⼀義的なbounding boxの定義は重要
12
Mul?/Single	Scale	Region	Proposal	Network	(RPN)
!  Faster R-CNN、SSD、YOLO等
(アンカーがスケールの違いのみのケース)
!  本論⽂ではスケール数=1
13	
W
H
C
GoogLeNetベース	
Incepeon3bまで	
SPNは更に	
フィルタ数を1/4
スケール数	×	4	
存在確率 + 中⼼座標	(x,	y)	
+	スケール
このセルに中⼼があり	
スケールが特定の範囲
内の顔の存在確率	
存在するとすればその	
中⼼座標とスケール
→
実験
!  テストデータセット
⁃  FDDB, AFW, MALF
!  訓練データセット
⁃  インターネットから700K(!)画像収集、うち350Kが顔を含む
⁃  AFLWも追加
⁃  顔を含まないインターネットの350KとCOCOデータセットを
ネガティブサンプルとして利⽤
!  ⽐較⼿法
⁃  SA-RPN (Scale-Aware RPN)
•  提案⼿法
⁃  Multi-Scale Testing RPN (MST-RPN)
•  画像を6スケールにリサイズしてsingle-scale RPN
⁃  Single-Shot Multi-Anchor RPN (RPN)
•  6アンカーのmulti-scaleのRPN
14
Scale	Proposal	Networkの評価
15	
平均scale	proposal数 vs	recall	
1	scaleでrecall	0.8くらい	
=顔が複数あっても同じスケール
顔のサイズ vs	⾒逃し率	
⾒逃しているのは⼩さい顔が多い
State-of-the-artとの⽐較
!  train-valid-testに分かれていないテストデータだけのデータセット
!  ⼤体提案⼿法群が⼀番良いよ
!  MST-RPNが⼀番いいよ(scale proposalが6の提案⼿法のようなもの)
16	
SA-RPN:	0.938	
MST	RPN:	0.928	
RPN:	0.912
SA-RPN:	0.882	
MST-RPN:	0.892	
RPN:	0.871
SA-RPN:	0.988	
MST-RPN:	0.992	
RPN:	0.982
処理時間
!  平均処理時間はSA-RPN(提案⼿法)が⼀番短い
!  MST-RPNは重いがRPNと⽐較してそこまで⼤きく違わない
17
感想
!  スケール選択は⾯⽩い(再現率が⼼配だが意外に⼤丈夫そう)
⁃  選択スケールが細かいところが意外
⁃  ⼀般物体はスケール⾊々なので難しそう
!  細かいパラメータが書いてない!
⁃  Confidenceのしきい値とか、平均proposal数とか
!  現実問題ではスケールが結構限定されているケースが多い
!  SPNとRPNが断絶している
⁃  同じようなことをやっているのでくっつけられそうだが
画像のリサイズが結構細かいスケールで⾏われるので難しそう
18
結局何がきいてるのかというと
!  最⼩スケールでの検出がスキップできる
19	
遅いのは⼤体こいつのせい
Finding	Tiny	Faces
20
キャッチーな結果!
21
WIDER	FACEデータセットでのSotA
22	
Faster	R-CNNが最⾼精度だが	
論⽂の情報量がなさすぎ
アプローチ
!  ⼩さな顔も⾒つけるために…
⁃  ⼊⼒画像を2倍にアプコンした画像も認識に使う
⁃  さらに⼩さな顔専⽤の検出器を使う
!  ポイントは上記だが、それに⾄る実験の納得性が⾼い
23
検出の基本はHeatmap	Predic?on(さっきと同じ)
!  Faster R-CNN、SSD、YOLO等
(アンカーがスケールの違いのみのケース)
!  GitHub上のコードではres3 + deconvしたres4=⼊⼒の1/8、
スケール25(feature mapの解像度は1種類)
24	
W
H
C
ResNet101	
ResNet50	
VGG16
スケール数	×	5	
存在確率 +	(x,	y,	w,	h)
このセルに中⼼があり	
スケールが特定の範囲
内の顔の存在確率	
存在するとすればその	
中⼼座標とスケール
→
コンテキストの影響(⼈間の認識精度)
!  異なるスケールの顔について、コンテキスト情報を変化させて
「⼈間の」顔・⾮顔の分類能⼒を検証
!  コンテキスト重要!!
25	
オリジナル ×3 300px
コンテキストの影響(heatmap	predic?on)
!  異なるスケールのfeature mapを統合したheatmap prediction精度
!  コンテキストを増やすほど精度が向上する
⁃  ⼩さい顔でres5まで追加すると精度低下→過学習によるもの
!  ⼩さい顔は⼩さい受容野でも精度が⾼い(顔がまるまる⼊るので
!  ⼩さい顔のほうがゲインが⼤きい=⼈の精度とconsistent
26	
+18.9%
+1.5%
Foveal	structureの影響
!  Foveal structure=マルチスケールの特徴を統合していること
⁃  中⼼のほうが情報量が⾼くなるので⽬の中⼼窩のアナロジー
!  単純に受容野を⼤きく取るだけではなくマルチスケール特徴が重要
⁃  顔のスケールに応じて⾃動で重要なスケール特徴を選択している
⁃  ある程度⼈が設計しても良いかも
27
リサイズされた画像に対する認識率
!  ⼤きな顔に対し、⼩さくリサイズしてから検出するほうが精度が⾼い
⁃  学習データのサイズの違い
!  ⼩さい顔は、⼤きくリサイズしてから検出するほうが精度が⾼い
⁃  こちらはfine-tune元のImageNetの物体サイズに引きづられている
※顔は⼩さいほうがデータが多い、ImageNetは中くらいの物体が多い
28
各スケールの顔を検出する際にベストな解像度
29	
元画像での顔のスケール	
精度	
⼤きい顔はx0.5	
中くらいの顔はx1	
⼩さい顔はx2	
のスケールで検出すると良い
x0.5を	
検出器A
x1を	
検出器A
x2を	
検出器A
x2を	
検出器B
極⼩の顔は20px以下の顔を	
検出する専⽤の検出器を利⽤
全体像
30
実験結果
!  FIDER FACEとFDDBでSotA
31	
Hardクラスで差が⼤きい	
=⼩さい顔で稼いでいる

Weitere ähnliche Inhalte

Was ist angesagt?

ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争Yosuke Shinya
 
3次元計測とフィルタリング
3次元計測とフィルタリング3次元計測とフィルタリング
3次元計測とフィルタリングNorishige Fukushima
 
転移学習ランキング・ドメイン適応
転移学習ランキング・ドメイン適応転移学習ランキング・ドメイン適応
転移学習ランキング・ドメイン適応Elpo González Valbuena
 
物体検出の歴史(R-CNNからSSD・YOLOまで)
物体検出の歴史(R-CNNからSSD・YOLOまで)物体検出の歴史(R-CNNからSSD・YOLOまで)
物体検出の歴史(R-CNNからSSD・YOLOまで)HironoriKanazawa
 
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII
 
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留するモデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留するTakahiro Kubo
 
Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Fumihiko Takahashi
 
帰納バイアスが成立する条件
帰納バイアスが成立する条件帰納バイアスが成立する条件
帰納バイアスが成立する条件Shinobu KINJO
 
Triplet Lossによる Person Re-identification
Triplet Lossによる Person Re-identificationTriplet Lossによる Person Re-identification
Triplet Lossによる Person Re-identificationtancoro
 
物体検出エラーの分析ツール TIDE
物体検出エラーの分析ツール TIDE物体検出エラーの分析ツール TIDE
物体検出エラーの分析ツール TIDEGuoqingLiu9
 
物体検出フレームワークMMDetectionで快適な開発
物体検出フレームワークMMDetectionで快適な開発物体検出フレームワークMMDetectionで快適な開発
物体検出フレームワークMMDetectionで快適な開発Tatsuya Suzuki
 
SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用SSII
 
[DL輪読会]Objects as Points
[DL輪読会]Objects as Points[DL輪読会]Objects as Points
[DL輪読会]Objects as PointsDeep Learning JP
 
Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide ...
Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide ...Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide ...
Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide ...harmonylab
 
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2Preferred Networks
 
統計的学習手法よる人検出
統計的学習手法よる人検出統計的学習手法よる人検出
統計的学習手法よる人検出Hironobu Fujiyoshi
 
introduction to Dueling network
introduction to Dueling networkintroduction to Dueling network
introduction to Dueling networkWEBFARMER. ltd.
 
【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)
【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)
【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)Deep Learning JP
 

Was ist angesagt? (20)

ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争
 
3次元計測とフィルタリング
3次元計測とフィルタリング3次元計測とフィルタリング
3次元計測とフィルタリング
 
転移学習ランキング・ドメイン適応
転移学習ランキング・ドメイン適応転移学習ランキング・ドメイン適応
転移学習ランキング・ドメイン適応
 
物体検出の歴史(R-CNNからSSD・YOLOまで)
物体検出の歴史(R-CNNからSSD・YOLOまで)物体検出の歴史(R-CNNからSSD・YOLOまで)
物体検出の歴史(R-CNNからSSD・YOLOまで)
 
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
 
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留するモデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留する
 
Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究
 
帰納バイアスが成立する条件
帰納バイアスが成立する条件帰納バイアスが成立する条件
帰納バイアスが成立する条件
 
Triplet Lossによる Person Re-identification
Triplet Lossによる Person Re-identificationTriplet Lossによる Person Re-identification
Triplet Lossによる Person Re-identification
 
物体検出エラーの分析ツール TIDE
物体検出エラーの分析ツール TIDE物体検出エラーの分析ツール TIDE
物体検出エラーの分析ツール TIDE
 
物体検出フレームワークMMDetectionで快適な開発
物体検出フレームワークMMDetectionで快適な開発物体検出フレームワークMMDetectionで快適な開発
物体検出フレームワークMMDetectionで快適な開発
 
SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用
 
[DL輪読会]Objects as Points
[DL輪読会]Objects as Points[DL輪読会]Objects as Points
[DL輪読会]Objects as Points
 
Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide ...
Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide ...Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide ...
Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide ...
 
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
 
統計的学習手法よる人検出
統計的学習手法よる人検出統計的学習手法よる人検出
統計的学習手法よる人検出
 
KCFの紹介
KCFの紹介KCFの紹介
KCFの紹介
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
 
introduction to Dueling network
introduction to Dueling networkintroduction to Dueling network
introduction to Dueling network
 
【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)
【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)
【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)
 

Mehr von Yusuke Uchida

近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision TransformerYusuke Uchida
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Yusuke Uchida
 
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話Yusuke Uchida
 
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
SIGNATE オフロードコンペ 精度認識部門 3rd Place SolutionSIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
SIGNATE オフロードコンペ 精度認識部門 3rd Place SolutionYusuke Uchida
 
SIGNATE 鰹節コンペ2nd Place Solution
SIGNATE 鰹節コンペ2nd Place SolutionSIGNATE 鰹節コンペ2nd Place Solution
SIGNATE 鰹節コンペ2nd Place SolutionYusuke Uchida
 
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術Yusuke Uchida
 
SuperGlue; Learning Feature Matching with Graph Neural Networks (CVPR'20)
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
SuperGlue; Learning Feature Matching with Graph Neural Networks (CVPR'20)Yusuke Uchida
 
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learningSemi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learningYusuke Uchida
 
Deep Fakes Detection
Deep Fakes DetectionDeep Fakes Detection
Deep Fakes DetectionYusuke Uchida
 
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019Yusuke Uchida
 
モデル高速化百選
モデル高速化百選モデル高速化百選
モデル高速化百選Yusuke Uchida
 
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化Yusuke Uchida
 
Humpback whale identification challenge反省会
Humpback whale identification challenge反省会Humpback whale identification challenge反省会
Humpback whale identification challenge反省会Yusuke Uchida
 
DeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジDeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジYusuke Uchida
 
コンピュータビジョン技術の実応用とビジネス
コンピュータビジョン技術の実応用とビジネスコンピュータビジョン技術の実応用とビジネス
コンピュータビジョン技術の実応用とビジネスYusuke Uchida
 
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...Yusuke Uchida
 
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用Yusuke Uchida
 
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向Yusuke Uchida
 
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)Yusuke Uchida
 
モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化Yusuke Uchida
 

Mehr von Yusuke Uchida (20)

近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
 
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
SIGNATE オフロードコンペ 精度認識部門 3rd Place SolutionSIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
 
SIGNATE 鰹節コンペ2nd Place Solution
SIGNATE 鰹節コンペ2nd Place SolutionSIGNATE 鰹節コンペ2nd Place Solution
SIGNATE 鰹節コンペ2nd Place Solution
 
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術
 
SuperGlue; Learning Feature Matching with Graph Neural Networks (CVPR'20)
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
SuperGlue; Learning Feature Matching with Graph Neural Networks (CVPR'20)
 
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learningSemi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learning
 
Deep Fakes Detection
Deep Fakes DetectionDeep Fakes Detection
Deep Fakes Detection
 
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019
 
モデル高速化百選
モデル高速化百選モデル高速化百選
モデル高速化百選
 
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
 
Humpback whale identification challenge反省会
Humpback whale identification challenge反省会Humpback whale identification challenge反省会
Humpback whale identification challenge反省会
 
DeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジDeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジ
 
コンピュータビジョン技術の実応用とビジネス
コンピュータビジョン技術の実応用とビジネスコンピュータビジョン技術の実応用とビジネス
コンピュータビジョン技術の実応用とビジネス
 
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
 
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
 
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
 
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
 
モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化
 

Kürzlich hochgeladen

Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Hiroshi Tomioka
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 

Kürzlich hochgeladen (11)

Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

"Scale Aware Face Detection"と"Finding Tiny Faces" (CVPR'17) の解説