Suche senden
Hochladen
Generating Notifications for Missing Actions:Don’t forget to turn the lights off! (関東CV勉強会 ICCV 2015 読み会)
•
Als PPTX, PDF herunterladen
•
3 gefällt mir
•
2,571 views
Yoshitaka Ushiku
Folgen
僕のような物忘れが激しい人をサポートしてくれるかもしれない未来の話。
Weniger lesen
Mehr lesen
Technologie
Melden
Teilen
Melden
Teilen
1 von 31
Jetzt herunterladen
Empfohlen
We Are Humor Beings: Understanding and Predicting Visual Humor (関東CV勉強会 CVPR ...
We Are Humor Beings: Understanding and Predicting Visual Humor (関東CV勉強会 CVPR ...
Yoshitaka Ushiku
ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)
ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)
Yoshitaka Ushiku
今後のPRMU研究会を考える
今後のPRMU研究会を考える
Yoshitaka Ushiku
Unsupervised Object Discovery and Localization in the Wild:Part-Based Match...
Unsupervised Object Discovery and Localization in the Wild:Part-Based Match...
Yoshitaka Ushiku
Chainerのテスト環境とDockerでのCUDAの利用
Chainerのテスト環境とDockerでのCUDAの利用
Yuya Unno
子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得
Yuya Unno
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Yoshitaka Ushiku
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
株式会社メタップスホールディングス
Empfohlen
We Are Humor Beings: Understanding and Predicting Visual Humor (関東CV勉強会 CVPR ...
We Are Humor Beings: Understanding and Predicting Visual Humor (関東CV勉強会 CVPR ...
Yoshitaka Ushiku
ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)
ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)
Yoshitaka Ushiku
今後のPRMU研究会を考える
今後のPRMU研究会を考える
Yoshitaka Ushiku
Unsupervised Object Discovery and Localization in the Wild:Part-Based Match...
Unsupervised Object Discovery and Localization in the Wild:Part-Based Match...
Yoshitaka Ushiku
Chainerのテスト環境とDockerでのCUDAの利用
Chainerのテスト環境とDockerでのCUDAの利用
Yuya Unno
子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得
Yuya Unno
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Yoshitaka Ushiku
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
株式会社メタップスホールディングス
NIP2015読み会「End-To-End Memory Networks」
NIP2015読み会「End-To-End Memory Networks」
Yuya Unno
ピーFIの研究開発現場
ピーFIの研究開発現場
Yuya Unno
Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
Yoshitaka Ushiku
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
Toshihiko Yamasaki
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...
Yuya Unno
20210828 ポリモーフィズムってなに?【lt用】
20210828 ポリモーフィズムってなに?【lt用】
RyuzoYamate
文系私立大学生でも、プログラマーになりたい!
文系私立大学生でも、プログラマーになりたい!
Kyoka Fujiike
TensorFlowをざっくりLTしてみた
TensorFlowをざっくりLTしてみた
Mitsuki Ogasahara
深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴
Yuya Unno
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
Yuya Unno
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
Yuya Unno
Invate presentation
Invate presentation
ssuser141c26
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
Yuya Unno
ハイフレックス授業のススメ
ハイフレックス授業のススメ
kthrlab
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
Yasunori Ozaki
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール
Yuya Unno
あたし、まっちゃだいふく
あたし、まっちゃだいふく
rip jyr
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
Naoki Matsumoto
プッシュ通知の仕組みと利点
プッシュ通知の仕組みと利点
Tsubasa Yoshino
iOSのCI as a Service事情
iOSのCI as a Service事情
Hiroshi Maekawa
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
No Bu
Weitere ähnliche Inhalte
Was ist angesagt?
NIP2015読み会「End-To-End Memory Networks」
NIP2015読み会「End-To-End Memory Networks」
Yuya Unno
ピーFIの研究開発現場
ピーFIの研究開発現場
Yuya Unno
Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
Yoshitaka Ushiku
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
Toshihiko Yamasaki
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...
Yuya Unno
20210828 ポリモーフィズムってなに?【lt用】
20210828 ポリモーフィズムってなに?【lt用】
RyuzoYamate
文系私立大学生でも、プログラマーになりたい!
文系私立大学生でも、プログラマーになりたい!
Kyoka Fujiike
TensorFlowをざっくりLTしてみた
TensorFlowをざっくりLTしてみた
Mitsuki Ogasahara
深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴
Yuya Unno
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
Yuya Unno
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
Yuya Unno
Invate presentation
Invate presentation
ssuser141c26
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
Yuya Unno
ハイフレックス授業のススメ
ハイフレックス授業のススメ
kthrlab
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
Yasunori Ozaki
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール
Yuya Unno
あたし、まっちゃだいふく
あたし、まっちゃだいふく
rip jyr
Was ist angesagt?
(18)
NIP2015読み会「End-To-End Memory Networks」
NIP2015読み会「End-To-End Memory Networks」
ピーFIの研究開発現場
ピーFIの研究開発現場
Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...
20210828 ポリモーフィズムってなに?【lt用】
20210828 ポリモーフィズムってなに?【lt用】
文系私立大学生でも、プログラマーになりたい!
文系私立大学生でも、プログラマーになりたい!
TensorFlowをざっくりLTしてみた
TensorFlowをざっくりLTしてみた
深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
Invate presentation
Invate presentation
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ハイフレックス授業のススメ
ハイフレックス授業のススメ
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール
あたし、まっちゃだいふく
あたし、まっちゃだいふく
Ähnlich wie Generating Notifications for Missing Actions:Don’t forget to turn the lights off! (関東CV勉強会 ICCV 2015 読み会)
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
Naoki Matsumoto
プッシュ通知の仕組みと利点
プッシュ通知の仕組みと利点
Tsubasa Yoshino
iOSのCI as a Service事情
iOSのCI as a Service事情
Hiroshi Maekawa
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
No Bu
U40 名古屋会場 吉本
U40 名古屋会場 吉本
calil jp
5分で解るocp
5分で解るocp
Koichi Ise
第0回徳島スマホアプリ開発勉強会
第0回徳島スマホアプリ開発勉強会
健一 辰濱
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
Keiichiro Ono
Windows Phone勉強会@四日市へのお誘い
Windows Phone勉強会@四日市へのお誘い
Nobuaki Aoki
インタラクションのためのコンピュータビジョンのお仕事
インタラクションのためのコンピュータビジョンのお仕事
Yasunori Ozaki
Techcrunch hackathon 2013
Techcrunch hackathon 2013
Nao Tokui
Django から各種チャットツールに通知するライブラリを作った話
Django から各種チャットツールに通知するライブラリを作った話
Yusuke Miyazaki
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
Ayako Omori
福岡のIT系勉強会情報
福岡のIT系勉強会情報
健人 井関
2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source
Yoshiyuki Nakamura
IoTの見える化について そしてHoloLens
IoTの見える化について そしてHoloLens
佳孝 中田
Ähnlich wie Generating Notifications for Missing Actions:Don’t forget to turn the lights off! (関東CV勉強会 ICCV 2015 読み会)
(16)
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
プッシュ通知の仕組みと利点
プッシュ通知の仕組みと利点
iOSのCI as a Service事情
iOSのCI as a Service事情
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
U40 名古屋会場 吉本
U40 名古屋会場 吉本
5分で解るocp
5分で解るocp
第0回徳島スマホアプリ開発勉強会
第0回徳島スマホアプリ開発勉強会
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
Windows Phone勉強会@四日市へのお誘い
Windows Phone勉強会@四日市へのお誘い
インタラクションのためのコンピュータビジョンのお仕事
インタラクションのためのコンピュータビジョンのお仕事
Techcrunch hackathon 2013
Techcrunch hackathon 2013
Django から各種チャットツールに通知するライブラリを作った話
Django から各種チャットツールに通知するライブラリを作った話
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
福岡のIT系勉強会情報
福岡のIT系勉強会情報
2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source
IoTの見える化について そしてHoloLens
IoTの見える化について そしてHoloLens
Mehr von Yoshitaka Ushiku
機械学習を民主化する取り組み
機械学習を民主化する取り組み
Yoshitaka Ushiku
ドメイン適応の原理と応用
ドメイン適応の原理と応用
Yoshitaka Ushiku
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Yoshitaka Ushiku
これからの Vision & Language ~ Acadexit した4つの理由
これからの Vision & Language ~ Acadexit した4つの理由
Yoshitaka Ushiku
視覚と対話の融合研究
視覚と対話の融合研究
Yoshitaka Ushiku
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
Yoshitaka Ushiku
Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)
Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)
Yoshitaka Ushiku
Frontiers of Vision and Language: Bridging Images and Texts by Deep Learning
Frontiers of Vision and Language: Bridging Images and Texts by Deep Learning
Yoshitaka Ushiku
Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)
Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)
Yoshitaka Ushiku
Asymmetric Tri-training for Unsupervised Domain Adaptation
Asymmetric Tri-training for Unsupervised Domain Adaptation
Yoshitaka Ushiku
Recognize, Describe, and Generate: Introduction of Recent Work at MIL
Recognize, Describe, and Generate: Introduction of Recent Work at MIL
Yoshitaka Ushiku
Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線
Yoshitaka Ushiku
Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...
Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...
Yoshitaka Ushiku
画像キャプションの自動生成
画像キャプションの自動生成
Yoshitaka Ushiku
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
Yoshitaka Ushiku
Mehr von Yoshitaka Ushiku
(15)
機械学習を民主化する取り組み
機械学習を民主化する取り組み
ドメイン適応の原理と応用
ドメイン適応の原理と応用
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
これからの Vision & Language ~ Acadexit した4つの理由
これからの Vision & Language ~ Acadexit した4つの理由
視覚と対話の融合研究
視覚と対話の融合研究
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)
Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)
Frontiers of Vision and Language: Bridging Images and Texts by Deep Learning
Frontiers of Vision and Language: Bridging Images and Texts by Deep Learning
Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)
Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)
Asymmetric Tri-training for Unsupervised Domain Adaptation
Asymmetric Tri-training for Unsupervised Domain Adaptation
Recognize, Describe, and Generate: Introduction of Recent Work at MIL
Recognize, Describe, and Generate: Introduction of Recent Work at MIL
Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線
Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...
Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...
画像キャプションの自動生成
画像キャプションの自動生成
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
Kürzlich hochgeladen
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
Kürzlich hochgeladen
(11)
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
Generating Notifications for Missing Actions:Don’t forget to turn the lights off! (関東CV勉強会 ICCV 2015 読み会)
1.
ICCV 2015読み会 Generating Notifications
for Missing Actions: Don’t forget to turn the lights off! 牛久 祥孝 losnuevetoros
2.
お前は誰だ? ~2014.3 博士(情報理工学)、東京大学 • 画像説明文の自動生成 •
大規模画像分類 2014.4~ NTT コミュニケーション科学基礎研究所
3.
お前は誰だ? 今年度のkantocvイベント 5月 有名論文読み会 7月 CVPR2015読み会 10月
コンピュータビジョンのお仕事 2月 ICCV2015読み会 発表者枠で皆勤賞!
4.
connpassへの登録忘れもほぼ皆勤賞…
5.
誰かに自動で教えてほしい 論文読むって言ったけどまたconnpassの発表者枠登録してねーぞボケ
6.
本日の論文
7.
要求機能 • ユーザーの現在の行動を認識する – 終了する前に、なるべく早く →早期イベント認識 –
行動の切れ目はわからない →エゴモーション認識と動画分割の同時推定 • やり忘れた行動があるかどうかを判定し、 リスクが大きければアラートを出す – 予め一連の行動の関係性を学習しなければいけない →動作系列の認識
8.
要求機能 • ユーザーの現在の行動を認識する – 終了する前に、なるべく早く →早期イベント認識 –
行動の切れ目はわからない →エゴモーション認識と動画分割の同時推定 • やり忘れた行動があるかどうかを判定し、 リスクが大きければアラートを出す – 予め一連の行動の関係性を学習しなければいけない →動作系列の認識
9.
論文中の数式(番号付き)も 全て解説します!!!!
10.
アラート発報の判定 本論文唯一の番号付き数式!
11.
アラート発報の判定 • 時刻 における動作を識別した結果 •
時刻 から 経った後の 時刻 における動作を識別した結果 時刻 でアラートを発報するスコア (値が大きいと発報) バイアス
12.
アラート発報の判定 • 時刻 における動作を識別した結果 •
時刻 から 経った後の 時刻 における動作を識別した結果 ある動作の 始まり 途中 終わり
13.
アラート発報の判定 • 時刻 における動作を識別した結果 •
時刻 から 経った後の 時刻 における動作を識別した結果 ある動作の 始まり 途中 終わり 要するに… ある動作の終わり ↓ ある動作の始め となれば1をとる 他は0とか-1とか
14.
アラート発報の判定 • 時刻 における動作を識別した結果 •
時刻 から 経った後の 時刻 における動作を識別した結果 動作 と動作 の間のタイミングで なされるべきだった動作
15.
アラート発報の判定 • 時刻 における動作を識別した結果 •
時刻 から 経った後の 時刻 における動作を識別した結果 動作 と動作 の間のタイミングで なされるべきだった動作 動作 の前にその動作をやり忘れた ことによるコスト
16.
まだ謎なポイント • 忘れた動作とかそのコストはどう計算するの? →動作間依存関係の獲得へ • 動作
の推定はどうするの? – 動作の終わりとか始まりとかもどう学習するの? – そもそも、動画の分割はどうするの? →動作認識とセグメンテーションの同時推定へ
17.
まだ謎なポイント • 忘れた動作とかそのコストはどう計算するの? →動作間依存関係の獲得へ • 動作
の推定はどうするの? – 動作の終わりとか始まりとかもどう学習するの? – そもそも、動画の分割はどうするの? →動作認識とセグメンテーションの同時推定へ • 忘れた動作とかそのコストはどう計算するの? →動作間依存関係の獲得へ
18.
動作間依存関係の獲得 Flexible Ordered Graphの作成(ラテ作りを例に) •
ラテ作り中に起こりうる動作を列挙 • 問題なくラテを作れた時のエゴモーション +各時点での動作のラベル、を複数収集 • 動作間の順序をグラフで表現 – ノードは各動作 – エッジは: • 動作間の遷移を意味 • ある動作ペア の 遷移確率 の逆数
19.
忘れた動作とそのコストの推定 • ある動作 の前に別の動作
を実行しないコスト =動作 の後に動作 を実行する困難さ – ラテ作りでの例: 「ミルクを注ぐ」後に「スチームミルクを作る」のは困難 – コスト=経路中のエッジ重みの和の最小値
20.
忘れた動作とそのコストの推定 • ある動作 の前に別の動作
を実行しないコスト =動作 の後に動作 を実行する困難さ – ラテ作りでの例: 「ミルクを注ぐ」後に「スチームミルクを作る」のは困難 – コスト=経路中のエッジ重みの和の最小値
21.
まだ謎なポイント • 忘れた動作とかそのコストはどう計算するの? →動作間依存関係の獲得へ • 動作
の推定はどうするの? – 動作の終わりとか始まりとかもどう学習するの? – そもそも、動画の分割はどうするの? →動作認識とセグメンテーションの同時推定へ
22.
まだ謎なポイント • 忘れた動作とかそのコストはどう計算するの? →動作間依存関係の獲得へ • 動作
の推定はどうするの? – 動作の終わりとか始まりとかもどう学習するの? – そもそも、動画の分割はどうするの? →動作認識とセグメンテーションの同時推定へ • 動作 の推定はどうするの? – 動作の終わりとか始まりとかもどう学習するの? – そもそも、動画の分割はどうするの? →動作認識とセグメンテーションの同時推定へ
23.
動作認識+セグメンテーション • 動画像を微小な区間に分けてそれぞれを識別 – 𝑁フレームを𝐿フレームの区切りに分割 –
識別器は単純な線形SVM – クラスは動作ごとの始まり、途中、終わり 本論文だと、ラテ作りの基本動作29動作×3=87クラス
24.
動作認識+セグメンテーション • HMMの利用 – 各動作の仮定 •
「始まり」が必ず1区間 • 「途中」が0区間以上 • 「終わり」が必ず1区間 – 動作の遷移はViterbiで解ける 基本動作数×「始まり」「途中」「終わり」の3パターン
25.
実験設定 • ラテ作りデータセット – Looxcie
HDを装着 – 20名のラテ作り動画 • 約10万フレーム、15fps • 訓練サンプル:23本の完全な動画 • テストサンプル:18本の動作忘れあり動画 – 29の基本動作に基づいてラベル付け • 画像特徴量:Gist [Oliva+Torralba, 2006] – シーン認識でよく用いられる – エゴモーションでは、自身より視線の先のシーンの情報が有用 [AV Watch, http://av.watch.impress.co.jp/docs/news/20130321_592598.html]
26.
動作認識精度 セグメントがわかっている 各動作の「始まり」識別器を利用 各動作の初めの時点(オレンジ矢印)でアラートを出したいので 赤枠のビデオでの動作認識精度は重要 セグメントがわかっている HMMで系列の最適化 セグメントが未知 HMMで系列の最適化 緑枠のビデオでの動作認識精度 HMMで系列の最適化 緑枠のビデオでの動作認識精度 HMMで系列の最適化 後の動作から過去の動作認識を変更可
27.
動作認識精度 • 各動作の「始まり」「途中」「終わり」識別器 • 早期イベント認識の先行研究との比較 –
MMED [Hoai+De la Torre, CVPR 2012] – 定性的な違い: MMEDでは「始まり」「途中」「終わり」の区別と遷移ルールがない
28.
最終的なシステムとしての評価 ベースライン:もしランダムにアラートを出すと… • Precision 0.0007 •
Recall 0.1 ベースラインは超えるが、まだまだ難しいタスク 指摘した動作は 真に指摘するべき動作だったか 適切なタイミングの前後25フレームで 適切な動作をリマインドできたか
29.
まとめと所感 • 物忘れ防止システムへの挑戦的な取り組み • 実環境に即した設定 –
エゴモーション動画を対象 – セグメンテーションと動作認識の同時推定 – 動作の早期認識 一方で… • ラベル付けの段階でルールベースな匂いが • 同時に複数の動作をする場合を想定せず エスプレッソ作る操作しながら牛乳スチームするとか • 日常生活ではより複雑に動作が発生するのでは ラテ作りながらおやつ作って、合間にスマホいじって…
30.
まとめと所感 • 物忘れ防止システムへの挑戦的な取り組み • 実環境に即した設定 –
エゴモーション動画を対象 – セグメンテーションと動作認識の同時推定 – 動作の早期認識 一方で… • ラベル付けの段階でルールベースな匂いが • 同時に複数の動作をする場合を想定せず コーヒーマシン操作しながら牛乳注ぐとか • 日常生活ではより複雑に動作が発生するのでは ラテ作りながらおやつ作って、合間にスマホいじって… 強いコントリビューションがひとつでも、 明確に伝わればオーラルに採択される という例かも
31.
付録:ラテ作りの基本動作
Jetzt herunterladen