Submit Search
Upload
Optim インターンシップ 機械学習による画像の領域分割
•
0 likes
•
16,915 views
O
optim_internship
Follow
株式会社オプティム 2016Summer Internship 参加学生様のインターンシップ成果報告です。 今回は、R&Dに配属された学生様の成果スライドのご紹介です。
Read less
Read more
Technology
Slideshow view
Report
Share
Slideshow view
Report
Share
1 of 22
Recommended
Lighting talk chainer hands on
Lighting talk chainer hands on
Ogushi Masaya
Chainer meetup lt
Chainer meetup lt
Ace12358
Chainer Contribution Guide
Chainer Contribution Guide
Kenta Oono
PFN Spring Internship Final Report: Autonomous Drive by Deep RL
PFN Spring Internship Final Report: Autonomous Drive by Deep RL
Naoto Yoshida
ディープラーニングにおける学習の高速化の重要性とその手法
ディープラーニングにおける学習の高速化の重要性とその手法
Yuko Fujiyama
Capitalicoでのchainer 1.1 → 1.5 バージョンアップ事例
Capitalicoでのchainer 1.1 → 1.5 バージョンアップ事例
Jun-ya Norimatsu
ボケるRNNを学習したい (Chainer meetup 01)
ボケるRNNを学習したい (Chainer meetup 01)
Motoki Sato
Chainer Development Plan 2015/12
Chainer Development Plan 2015/12
Seiya Tokui
Recommended
Lighting talk chainer hands on
Lighting talk chainer hands on
Ogushi Masaya
Chainer meetup lt
Chainer meetup lt
Ace12358
Chainer Contribution Guide
Chainer Contribution Guide
Kenta Oono
PFN Spring Internship Final Report: Autonomous Drive by Deep RL
PFN Spring Internship Final Report: Autonomous Drive by Deep RL
Naoto Yoshida
ディープラーニングにおける学習の高速化の重要性とその手法
ディープラーニングにおける学習の高速化の重要性とその手法
Yuko Fujiyama
Capitalicoでのchainer 1.1 → 1.5 バージョンアップ事例
Capitalicoでのchainer 1.1 → 1.5 バージョンアップ事例
Jun-ya Norimatsu
ボケるRNNを学習したい (Chainer meetup 01)
ボケるRNNを学習したい (Chainer meetup 01)
Motoki Sato
Chainer Development Plan 2015/12
Chainer Development Plan 2015/12
Seiya Tokui
Chainer入門と最近の機能
Chainer入門と最近の機能
Yuya Unno
CuPy解説
CuPy解説
Ryosuke Okuta
Introduction to DEEPstation the GUI Deep learning environment for chainer
Introduction to DEEPstation the GUI Deep learning environment for chainer
Ryo Shimizu
深層学習ライブラリのプログラミングモデル
深層学習ライブラリのプログラミングモデル
Yuta Kashino
Test
Test
Masaki Ogura
実践コンピュータビジョン 9章 画像の領域分割
実践コンピュータビジョン 9章 画像の領域分割
yaju88
平滑化処理の繰り返しによる画像セグメンテーションのためのグラフカット
平滑化処理の繰り返しによる画像セグメンテーションのためのグラフカット
MPRG_Chubu_University
逆求人説明会資料
逆求人説明会資料
Sei Gaku
向平卓矢について - 2015/12/23 ITエンジニア高専 逆求人
向平卓矢について - 2015/12/23 ITエンジニア高専 逆求人
Takuya Mukohira
OpenCVの基礎
OpenCVの基礎
領一 和泉田
OpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみた
徹 上野山
すごい自己紹介
すごい自己紹介
Hikaru Wada
野澤陽介(Yosuke nozawa)|自己紹介スライド 2014ver
野澤陽介(Yosuke nozawa)|自己紹介スライド 2014ver
取締役
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
tm_2648
SORACOM LoRaWAN Conference 2017 | LoRaゲートウェイとデバイス 〜デバイス開発と、無線連携〜
SORACOM LoRaWAN Conference 2017 | LoRaゲートウェイとデバイス 〜デバイス開発と、無線連携〜
SORACOM,INC
現在のDNNにおける未解決問題
現在のDNNにおける未解決問題
Daisuke Okanohara
On the benchmark of Chainer
On the benchmark of Chainer
Kenta Oono
OpenCV 3.0 on iOS
OpenCV 3.0 on iOS
Shuichi Tsutsumi
君はyarn.lockをコミットしているか?
君はyarn.lockをコミットしているか?
Teppei Sato
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
Norishige Fukushima
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
More Related Content
Viewers also liked
Chainer入門と最近の機能
Chainer入門と最近の機能
Yuya Unno
CuPy解説
CuPy解説
Ryosuke Okuta
Introduction to DEEPstation the GUI Deep learning environment for chainer
Introduction to DEEPstation the GUI Deep learning environment for chainer
Ryo Shimizu
深層学習ライブラリのプログラミングモデル
深層学習ライブラリのプログラミングモデル
Yuta Kashino
Test
Test
Masaki Ogura
実践コンピュータビジョン 9章 画像の領域分割
実践コンピュータビジョン 9章 画像の領域分割
yaju88
平滑化処理の繰り返しによる画像セグメンテーションのためのグラフカット
平滑化処理の繰り返しによる画像セグメンテーションのためのグラフカット
MPRG_Chubu_University
逆求人説明会資料
逆求人説明会資料
Sei Gaku
向平卓矢について - 2015/12/23 ITエンジニア高専 逆求人
向平卓矢について - 2015/12/23 ITエンジニア高専 逆求人
Takuya Mukohira
OpenCVの基礎
OpenCVの基礎
領一 和泉田
OpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみた
徹 上野山
すごい自己紹介
すごい自己紹介
Hikaru Wada
野澤陽介(Yosuke nozawa)|自己紹介スライド 2014ver
野澤陽介(Yosuke nozawa)|自己紹介スライド 2014ver
取締役
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
tm_2648
SORACOM LoRaWAN Conference 2017 | LoRaゲートウェイとデバイス 〜デバイス開発と、無線連携〜
SORACOM LoRaWAN Conference 2017 | LoRaゲートウェイとデバイス 〜デバイス開発と、無線連携〜
SORACOM,INC
現在のDNNにおける未解決問題
現在のDNNにおける未解決問題
Daisuke Okanohara
On the benchmark of Chainer
On the benchmark of Chainer
Kenta Oono
OpenCV 3.0 on iOS
OpenCV 3.0 on iOS
Shuichi Tsutsumi
君はyarn.lockをコミットしているか?
君はyarn.lockをコミットしているか?
Teppei Sato
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
Norishige Fukushima
Viewers also liked
(20)
Chainer入門と最近の機能
Chainer入門と最近の機能
CuPy解説
CuPy解説
Introduction to DEEPstation the GUI Deep learning environment for chainer
Introduction to DEEPstation the GUI Deep learning environment for chainer
深層学習ライブラリのプログラミングモデル
深層学習ライブラリのプログラミングモデル
Test
Test
実践コンピュータビジョン 9章 画像の領域分割
実践コンピュータビジョン 9章 画像の領域分割
平滑化処理の繰り返しによる画像セグメンテーションのためのグラフカット
平滑化処理の繰り返しによる画像セグメンテーションのためのグラフカット
逆求人説明会資料
逆求人説明会資料
向平卓矢について - 2015/12/23 ITエンジニア高専 逆求人
向平卓矢について - 2015/12/23 ITエンジニア高専 逆求人
OpenCVの基礎
OpenCVの基礎
OpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみた
すごい自己紹介
すごい自己紹介
野澤陽介(Yosuke nozawa)|自己紹介スライド 2014ver
野澤陽介(Yosuke nozawa)|自己紹介スライド 2014ver
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料
SORACOM LoRaWAN Conference 2017 | LoRaゲートウェイとデバイス 〜デバイス開発と、無線連携〜
SORACOM LoRaWAN Conference 2017 | LoRaゲートウェイとデバイス 〜デバイス開発と、無線連携〜
現在のDNNにおける未解決問題
現在のDNNにおける未解決問題
On the benchmark of Chainer
On the benchmark of Chainer
OpenCV 3.0 on iOS
OpenCV 3.0 on iOS
君はyarn.lockをコミットしているか?
君はyarn.lockをコミットしているか?
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
Recently uploaded
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
Recently uploaded
(11)
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
Optim インターンシップ 機械学習による画像の領域分割
1.
Copyright © 2016
OPTiM Co. All Rights Reserved. OPTiM インターンシップ最終報告 機械学習による画像の領域分割 O大学大学院 情報科学研究科 M1 H.S 1 2016/10/01
2.
• 名前:H.S 修士1年 •
所属:O大学大学院 情報科学研究科 • 機械学習・最適化・コンピュータビジョン 2 自己紹介 Copyright © 2016 OPTiM Co. All Rights Reserved.
3.
背景・目的 3Copyright © 2016
OPTiM Co. All Rights Reserved.
4.
4 背景 - 画像処理における物体認識 物体カテゴリ認識
物体検出 物体領域抽出 顔の位置 顔(人体)の領域 輪郭 画像が顔を含むか否か Copyright © 2016 OPTiM Co. All Rights Reserved.
5.
• ピクセルごとのラベリングを畳み込み層のみ(DCNN)で実装 5 背景 -
論文紹介 - SegNet Badrinarayanan, Vijay, Ankur Handa, and Roberto Cipolla. "Segnet: A deep convolutional encoder-decoder architecture for robust semantic pixel-wise labelling." arXiv preprint arXiv:1505.07293 (2015). Copyright © 2016 OPTiM Co. All Rights Reserved.
6.
• 空撮画像によるセグメンテーション • カラー画像、高度画像 •
農業 • 農作物と雑草などを分離 • 測量 • 地面や道路、森林など、車両などを分離 6 目的 - 空撮画像のセグメンテーション Copyright © 2016 OPTiM Co. All Rights Reserved.
7.
提案手法 7Copyright © 2016
OPTiM Co. All Rights Reserved.
8.
• 画像をウィンドウに分割 • ウィンドウごとにラベリング •
分類問題として解く • PROS • 機械学習の代表的なアプローチ (多数の手法が提案されている) • CONS • “分類”に適さない入出力関係 • ピクセルごとに推定 → 処理時間が増大 8 提案手法 - 概要 Copyright © 2016 OPTiM Co. All Rights Reserved.
9.
9 提案手法 - 詳細 最大の面積を占めるラベル ↓ 入力画像のラベル INPUT
Max Pooling Fully Connected … … 102 12 3 ネットワーク構造(CNN Convolution1(5x5) Convolution2(5x5) + Max Pooling 1x32x32 16x32x32 16x16x16 16x16x16 16x8x8 Copyright © 2016 OPTiM Co. All Rights Reserved.
10.
評価 10Copyright © 2016
OPTiM Co. All Rights Reserved.
11.
• NVIDIA Jetson
TK1 開発者用キット • GPU:326GFlops (VRAM:2GB) • CPU:64GFlops (Cortex-A15) • TDP:10W程度 11 評価 - 実行環境 DNNの計算は行列演算の繰り返し -> GPUによる高速化 Copyright © 2016 OPTiM Co. All Rights Reserved.
12.
• データセット • A/B
の2個の画像 • トレーニングデータ • Aからランダムに5000枚のバッチを切り出す • 評価 • 学習方法による精度への影響 • 処理時間 12 評価 - 概要 Copyright © 2016 OPTiM Co. All Rights Reserved.
13.
BA • 地面 • acc:0.959 •
recall:0.909 • 森林 • acc:0.779 • recall:0.905 • その他 • acc:0.992 • recall:0.978 • 平均 • acc:0.910 • recall:0.930 13 評価 - 推定結果 Copyright © 2016 OPTiM Co. All Rights Reserved. • 地面 • acc:0.991 • recall:0.980 • 森林 • acc:0.956 • recall:0.850 • その他 • acc:0.577 • recall:0.837 • 平均 • acc:0.841 • recall:0.889
14.
• Iter 1000:
学習不足 • Iter 4000: 学習がうまく進んでいた • Iter 8000: 過学習が見受けられた 14 評価 - イテレーション回数の影響 Copyright © 2016 OPTiM Co. All Rights Reserved.
15.
• トレーニングデータの正規化 • 深度画像をそのまま用いると過学習を招く •
バッチごとに平均が0になるように正規化 (分散はそのまま) 15 評価 - 過学習の解消 Copyright © 2016 OPTiM Co. All Rights Reserved.
16.
• 正規化を導入することで過学習を防げた (Iter:
8000) 16 評価 - トレーニングデータ正規化の効果 Copyright © 2016 OPTiM Co. All Rights Reserved.
17.
• 学習時間 • CPU
(Jetson) : 1.3iter / sec • GPU (Jetson) : 17.5iter / sec • 推定時間 • CPU (Jetson) : 8.0ms / image • GPU (Jetson) : 7.5ms / image 17 評価 - 処理速度 13倍 ※A全体を推定するのに60,000枚, 10分程度 ※推定ではミニバッチが活用できていない Copyright © 2016 OPTiM Co. All Rights Reserved.
18.
今後の課題 18Copyright © 2016
OPTiM Co. All Rights Reserved.
19.
• ネットワーク構造 (アップサンプリング系のレイヤー) •
入力データ (RGB画像、点群…) • 前処理 (データの性質に合わせた処理) • トレーニングデータ(手動、擬似生成、シミュレーション) 19 今後の課題 Copyright © 2016 OPTiM Co. All Rights Reserved.
20.
インターンシップの感想 20Copyright © 2016
OPTiM Co. All Rights Reserved.
21.
• 勉強会のSDK開発のお話は、まさに個人や大学における開発と企 業における開発の違いだと感じたので興味深かった • 菅谷社長とお話できて非常に勉強になりました •
まだまだ試してみたいことがたくさんあります • 前処理ひとつで精度が左右されるDNNの難しさを実感しました • これでうまくいった、うまくいかなかった、改善した、しなかっ たというひとつひとつの経験が興味深かった • とても短い2週間でした 21 インターンシップの感想 Copyright © 2016 OPTiM Co. All Rights Reserved.
22.
www.optim.co.jp 22Copyright © 2016
OPTiM Co. All Rights Reserved.