SlideShare ist ein Scribd-Unternehmen logo
1 von 31
ICCV 2015読み会
Generating Notifications for Missing Actions:
Don’t forget to turn the lights off!
牛久 祥孝
losnuevetoros
お前は誰だ?
~2014.3 博士(情報理工学)、東京大学
• 画像説明文の自動生成
• 大規模画像分類
2014.4~ NTT コミュニケーション科学基礎研究所
お前は誰だ?
今年度のkantocvイベント
5月 有名論文読み会
7月 CVPR2015読み会
10月 コンピュータビジョンのお仕事
2月 ICCV2015読み会
発表者枠で皆勤賞!
connpassへの登録忘れもほぼ皆勤賞…
誰かに自動で教えてほしい
論文読むって言ったけどまたconnpassの発表者枠登録してねーぞボケ
本日の論文
要求機能
• ユーザーの現在の行動を認識する
– 終了する前に、なるべく早く
→早期イベント認識
– 行動の切れ目はわからない
→エゴモーション認識と動画分割の同時推定
• やり忘れた行動があるかどうかを判定し、
リスクが大きければアラートを出す
– 予め一連の行動の関係性を学習しなければいけない
→動作系列の認識
要求機能
• ユーザーの現在の行動を認識する
– 終了する前に、なるべく早く
→早期イベント認識
– 行動の切れ目はわからない
→エゴモーション認識と動画分割の同時推定
• やり忘れた行動があるかどうかを判定し、
リスクが大きければアラートを出す
– 予め一連の行動の関係性を学習しなければいけない
→動作系列の認識
論文中の数式(番号付き)も
全て解説します!!!!
アラート発報の判定
本論文唯一の番号付き数式!
アラート発報の判定
• 時刻 における動作を識別した結果
• 時刻 から 経った後の
時刻 における動作を識別した結果
時刻 でアラートを発報するスコア
(値が大きいと発報)
バイアス
アラート発報の判定
• 時刻 における動作を識別した結果
• 時刻 から 経った後の
時刻 における動作を識別した結果
ある動作の
始まり
途中
終わり
アラート発報の判定
• 時刻 における動作を識別した結果
• 時刻 から 経った後の
時刻 における動作を識別した結果
ある動作の
始まり
途中
終わり
要するに…
ある動作の終わり
↓
ある動作の始め
となれば1をとる
他は0とか-1とか
アラート発報の判定
• 時刻 における動作を識別した結果
• 時刻 から 経った後の
時刻 における動作を識別した結果
動作 と動作 の間のタイミングで
なされるべきだった動作
アラート発報の判定
• 時刻 における動作を識別した結果
• 時刻 から 経った後の
時刻 における動作を識別した結果
動作 と動作 の間のタイミングで
なされるべきだった動作
動作 の前にその動作をやり忘れた
ことによるコスト
まだ謎なポイント
• 忘れた動作とかそのコストはどう計算するの?
→動作間依存関係の獲得へ
• 動作 の推定はどうするの?
– 動作の終わりとか始まりとかもどう学習するの?
– そもそも、動画の分割はどうするの?
→動作認識とセグメンテーションの同時推定へ
まだ謎なポイント
• 忘れた動作とかそのコストはどう計算するの?
→動作間依存関係の獲得へ
• 動作 の推定はどうするの?
– 動作の終わりとか始まりとかもどう学習するの?
– そもそも、動画の分割はどうするの?
→動作認識とセグメンテーションの同時推定へ
• 忘れた動作とかそのコストはどう計算するの?
→動作間依存関係の獲得へ
動作間依存関係の獲得
Flexible Ordered Graphの作成(ラテ作りを例に)
• ラテ作り中に起こりうる動作を列挙
• 問題なくラテを作れた時のエゴモーション
+各時点での動作のラベル、を複数収集
• 動作間の順序をグラフで表現
– ノードは各動作
– エッジは:
• 動作間の遷移を意味
• ある動作ペア の
遷移確率 の逆数
忘れた動作とそのコストの推定
• ある動作 の前に別の動作 を実行しないコスト
=動作 の後に動作 を実行する困難さ
– ラテ作りでの例:
「ミルクを注ぐ」後に「スチームミルクを作る」のは困難
– コスト=経路中のエッジ重みの和の最小値
忘れた動作とそのコストの推定
• ある動作 の前に別の動作 を実行しないコスト
=動作 の後に動作 を実行する困難さ
– ラテ作りでの例:
「ミルクを注ぐ」後に「スチームミルクを作る」のは困難
– コスト=経路中のエッジ重みの和の最小値
まだ謎なポイント
• 忘れた動作とかそのコストはどう計算するの?
→動作間依存関係の獲得へ
• 動作 の推定はどうするの?
– 動作の終わりとか始まりとかもどう学習するの?
– そもそも、動画の分割はどうするの?
→動作認識とセグメンテーションの同時推定へ
まだ謎なポイント
• 忘れた動作とかそのコストはどう計算するの?
→動作間依存関係の獲得へ
• 動作 の推定はどうするの?
– 動作の終わりとか始まりとかもどう学習するの?
– そもそも、動画の分割はどうするの?
→動作認識とセグメンテーションの同時推定へ
• 動作 の推定はどうするの?
– 動作の終わりとか始まりとかもどう学習するの?
– そもそも、動画の分割はどうするの?
→動作認識とセグメンテーションの同時推定へ
動作認識+セグメンテーション
• 動画像を微小な区間に分けてそれぞれを識別
– 𝑁フレームを𝐿フレームの区切りに分割
– 識別器は単純な線形SVM
– クラスは動作ごとの始まり、途中、終わり
本論文だと、ラテ作りの基本動作29動作×3=87クラス
動作認識+セグメンテーション
• HMMの利用
– 各動作の仮定
• 「始まり」が必ず1区間
• 「途中」が0区間以上
• 「終わり」が必ず1区間
– 動作の遷移はViterbiで解ける
基本動作数×「始まり」「途中」「終わり」の3パターン
実験設定
• ラテ作りデータセット
– Looxcie HDを装着
– 20名のラテ作り動画
• 約10万フレーム、15fps
• 訓練サンプル:23本の完全な動画
• テストサンプル:18本の動作忘れあり動画
– 29の基本動作に基づいてラベル付け
• 画像特徴量:Gist [Oliva+Torralba, 2006]
– シーン認識でよく用いられる
– エゴモーションでは、自身より視線の先のシーンの情報が有用
[AV Watch, http://av.watch.impress.co.jp/docs/news/20130321_592598.html]
動作認識精度
セグメントがわかっている
各動作の「始まり」識別器を利用
各動作の初めの時点(オレンジ矢印)でアラートを出したいので
赤枠のビデオでの動作認識精度は重要
セグメントがわかっている
HMMで系列の最適化
セグメントが未知
HMMで系列の最適化
緑枠のビデオでの動作認識精度
HMMで系列の最適化
緑枠のビデオでの動作認識精度
HMMで系列の最適化
後の動作から過去の動作認識を変更可
動作認識精度
• 各動作の「始まり」「途中」「終わり」識別器
• 早期イベント認識の先行研究との比較
– MMED
[Hoai+De la Torre, CVPR 2012]
– 定性的な違い:
MMEDでは「始まり」「途中」「終わり」の区別と遷移ルールがない
最終的なシステムとしての評価
ベースライン:もしランダムにアラートを出すと…
• Precision 0.0007
• Recall 0.1
ベースラインは超えるが、まだまだ難しいタスク
指摘した動作は
真に指摘するべき動作だったか
適切なタイミングの前後25フレームで
適切な動作をリマインドできたか
まとめと所感
• 物忘れ防止システムへの挑戦的な取り組み
• 実環境に即した設定
– エゴモーション動画を対象
– セグメンテーションと動作認識の同時推定
– 動作の早期認識
一方で…
• ラベル付けの段階でルールベースな匂いが
• 同時に複数の動作をする場合を想定せず
エスプレッソ作る操作しながら牛乳スチームするとか
• 日常生活ではより複雑に動作が発生するのでは
ラテ作りながらおやつ作って、合間にスマホいじって…
まとめと所感
• 物忘れ防止システムへの挑戦的な取り組み
• 実環境に即した設定
– エゴモーション動画を対象
– セグメンテーションと動作認識の同時推定
– 動作の早期認識
一方で…
• ラベル付けの段階でルールベースな匂いが
• 同時に複数の動作をする場合を想定せず
コーヒーマシン操作しながら牛乳注ぐとか
• 日常生活ではより複雑に動作が発生するのでは
ラテ作りながらおやつ作って、合間にスマホいじって…
強いコントリビューションがひとつでも、
明確に伝わればオーラルに採択される
という例かも
付録:ラテ作りの基本動作

Weitere ähnliche Inhalte

Was ist angesagt?

NIP2015読み会「End-To-End Memory Networks」
NIP2015読み会「End-To-End Memory Networks」NIP2015読み会「End-To-End Memory Networks」
NIP2015読み会「End-To-End Memory Networks」Yuya Unno
 
ピーFIの研究開発現場
ピーFIの研究開発現場ピーFIの研究開発現場
ピーFIの研究開発現場Yuya Unno
 
Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)Yoshitaka Ushiku
 
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...Yoshitaka Ushiku
 
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生Toshihiko Yamasaki
 
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy L...
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy L...Yuya Unno
 
20210828 ポリモーフィズムってなに?【lt用】
20210828 ポリモーフィズムってなに?【lt用】20210828 ポリモーフィズムってなに?【lt用】
20210828 ポリモーフィズムってなに?【lt用】RyuzoYamate
 
文系私立大学生でも、プログラマーになりたい!
文系私立大学生でも、プログラマーになりたい!文系私立大学生でも、プログラマーになりたい!
文系私立大学生でも、プログラマーになりたい!Kyoka Fujiike
 
TensorFlowをざっくりLTしてみた
TensorFlowをざっくりLTしてみたTensorFlowをざっくりLTしてみた
TensorFlowをざっくりLTしてみたMitsuki Ogasahara
 
深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴Yuya Unno
 
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングJubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングYuya Unno
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)Yuya Unno
 
Invate presentation
Invate presentationInvate presentation
Invate presentationssuser141c26
 
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning AlgorithmICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning AlgorithmYuya Unno
 
ハイフレックス授業のススメ
ハイフレックス授業のススメハイフレックス授業のススメ
ハイフレックス授業のススメkthrlab
 
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)Yasunori Ozaki
 
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクールYuya Unno
 
あたし、まっちゃだいふく
あたし、まっちゃだいふくあたし、まっちゃだいふく
あたし、まっちゃだいふくrip jyr
 

Was ist angesagt? (18)

NIP2015読み会「End-To-End Memory Networks」
NIP2015読み会「End-To-End Memory Networks」NIP2015読み会「End-To-End Memory Networks」
NIP2015読み会「End-To-End Memory Networks」
 
ピーFIの研究開発現場
ピーFIの研究開発現場ピーFIの研究開発現場
ピーFIの研究開発現場
 
Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)
 
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
Learning Cooperative Visual Dialog with Deep Reinforcement Learning(関東CV勉強会 I...
 
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
 
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy L...
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy L...
 
20210828 ポリモーフィズムってなに?【lt用】
20210828 ポリモーフィズムってなに?【lt用】20210828 ポリモーフィズムってなに?【lt用】
20210828 ポリモーフィズムってなに?【lt用】
 
文系私立大学生でも、プログラマーになりたい!
文系私立大学生でも、プログラマーになりたい!文系私立大学生でも、プログラマーになりたい!
文系私立大学生でも、プログラマーになりたい!
 
TensorFlowをざっくりLTしてみた
TensorFlowをざっくりLTしてみたTensorFlowをざっくりLTしてみた
TensorFlowをざっくりLTしてみた
 
深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴
 
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングJubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
 
Invate presentation
Invate presentationInvate presentation
Invate presentation
 
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning AlgorithmICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
 
ハイフレックス授業のススメ
ハイフレックス授業のススメハイフレックス授業のススメ
ハイフレックス授業のススメ
 
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
第六回全日本コンピュータビジョン勉強会資料 UniT (旧題: Transformer is all you need)
 
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール
 
あたし、まっちゃだいふく
あたし、まっちゃだいふくあたし、まっちゃだいふく
あたし、まっちゃだいふく
 

Ähnlich wie Generating Notifications for Missing Actions: Don’t forget to turn the lights off! (関東CV勉強会 ICCV 2015 読み会)

Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)Naoki Matsumoto
 
プッシュ通知の仕組みと利点
プッシュ通知の仕組みと利点プッシュ通知の仕組みと利点
プッシュ通知の仕組みと利点Tsubasa Yoshino
 
iOSのCI as a Service事情
iOSのCI as a Service事情iOSのCI as a Service事情
iOSのCI as a Service事情Hiroshi Maekawa
 
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...No Bu
 
U40 名古屋会場 吉本
U40 名古屋会場 吉本U40 名古屋会場 吉本
U40 名古屋会場 吉本calil jp
 
5分で解るocp
5分で解るocp5分で解るocp
5分で解るocpKoichi Ise
 
第0回徳島スマホアプリ開発勉強会
第0回徳島スマホアプリ開発勉強会第0回徳島スマホアプリ開発勉強会
第0回徳島スマホアプリ開発勉強会健一 辰濱
 
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状Keiichiro Ono
 
Windows Phone勉強会@四日市へのお誘い
Windows Phone勉強会@四日市へのお誘いWindows Phone勉強会@四日市へのお誘い
Windows Phone勉強会@四日市へのお誘いNobuaki Aoki
 
インタラクションのためのコンピュータビジョンのお仕事
インタラクションのためのコンピュータビジョンのお仕事インタラクションのためのコンピュータビジョンのお仕事
インタラクションのためのコンピュータビジョンのお仕事Yasunori Ozaki
 
Techcrunch hackathon 2013
Techcrunch hackathon 2013Techcrunch hackathon 2013
Techcrunch hackathon 2013Nao Tokui
 
Django から各種チャットツールに通知するライブラリを作った話
Django から各種チャットツールに通知するライブラリを作った話Django から各種チャットツールに通知するライブラリを作った話
Django から各種チャットツールに通知するライブラリを作った話Yusuke Miyazaki
 
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Ayako Omori
 
福岡のIT系勉強会情報
福岡のIT系勉強会情報福岡のIT系勉強会情報
福岡のIT系勉強会情報健人 井関
 
2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open sourceYoshiyuki Nakamura
 
IoTの見える化について そしてHoloLens
IoTの見える化について そしてHoloLensIoTの見える化について そしてHoloLens
IoTの見える化について そしてHoloLens佳孝 中田
 

Ähnlich wie Generating Notifications for Missing Actions: Don’t forget to turn the lights off! (関東CV勉強会 ICCV 2015 読み会) (16)

Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
 
プッシュ通知の仕組みと利点
プッシュ通知の仕組みと利点プッシュ通知の仕組みと利点
プッシュ通知の仕組みと利点
 
iOSのCI as a Service事情
iOSのCI as a Service事情iOSのCI as a Service事情
iOSのCI as a Service事情
 
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
Literate Computing for Infrastructure - インフラ・コード化の実践におけるIPython (Jupyter) Not...
 
U40 名古屋会場 吉本
U40 名古屋会場 吉本U40 名古屋会場 吉本
U40 名古屋会場 吉本
 
5分で解るocp
5分で解るocp5分で解るocp
5分で解るocp
 
第0回徳島スマホアプリ開発勉強会
第0回徳島スマホアプリ開発勉強会第0回徳島スマホアプリ開発勉強会
第0回徳島スマホアプリ開発勉強会
 
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
San Diego Japan Bio Forum: ライフサイエンス向けデータ可視化技術の現状
 
Windows Phone勉強会@四日市へのお誘い
Windows Phone勉強会@四日市へのお誘いWindows Phone勉強会@四日市へのお誘い
Windows Phone勉強会@四日市へのお誘い
 
インタラクションのためのコンピュータビジョンのお仕事
インタラクションのためのコンピュータビジョンのお仕事インタラクションのためのコンピュータビジョンのお仕事
インタラクションのためのコンピュータビジョンのお仕事
 
Techcrunch hackathon 2013
Techcrunch hackathon 2013Techcrunch hackathon 2013
Techcrunch hackathon 2013
 
Django から各種チャットツールに通知するライブラリを作った話
Django から各種チャットツールに通知するライブラリを作った話Django から各種チャットツールに通知するライブラリを作った話
Django から各種チャットツールに通知するライブラリを作った話
 
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
 
福岡のIT系勉強会情報
福岡のIT系勉強会情報福岡のIT系勉強会情報
福岡のIT系勉強会情報
 
2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source
 
IoTの見える化について そしてHoloLens
IoTの見える化について そしてHoloLensIoTの見える化について そしてHoloLens
IoTの見える化について そしてHoloLens
 

Mehr von Yoshitaka Ushiku

機械学習を民主化する取り組み
機械学習を民主化する取り組み機械学習を民主化する取り組み
機械学習を民主化する取り組みYoshitaka Ushiku
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用Yoshitaka Ushiku
 
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...Yoshitaka Ushiku
 
これからの Vision & Language ~ Acadexit した4つの理由
これからの Vision & Language ~ Acadexit した4つの理由これからの Vision & Language ~ Acadexit した4つの理由
これからの Vision & Language ~ Acadexit した4つの理由Yoshitaka Ushiku
 
視覚と対話の融合研究
視覚と対話の融合研究視覚と対話の融合研究
視覚と対話の融合研究Yoshitaka Ushiku
 
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...Yoshitaka Ushiku
 
Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)
Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)
Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)Yoshitaka Ushiku
 
Frontiers of Vision and Language: Bridging Images and Texts by Deep Learning
Frontiers of Vision and Language: Bridging Images and Texts by Deep LearningFrontiers of Vision and Language: Bridging Images and Texts by Deep Learning
Frontiers of Vision and Language: Bridging Images and Texts by Deep LearningYoshitaka Ushiku
 
Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)
Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)
Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)Yoshitaka Ushiku
 
Asymmetric Tri-training for Unsupervised Domain Adaptation
Asymmetric Tri-training for Unsupervised Domain AdaptationAsymmetric Tri-training for Unsupervised Domain Adaptation
Asymmetric Tri-training for Unsupervised Domain AdaptationYoshitaka Ushiku
 
Recognize, Describe, and Generate: Introduction of Recent Work at MIL
Recognize, Describe, and Generate: Introduction of Recent Work at MILRecognize, Describe, and Generate: Introduction of Recent Work at MIL
Recognize, Describe, and Generate: Introduction of Recent Work at MILYoshitaka Ushiku
 
Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線Yoshitaka Ushiku
 
Leveraging Visual Question Answering for Image-Caption Ranking (関東CV勉強会 ECCV ...
Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...
Leveraging Visual Question Answering for Image-Caption Ranking (関東CV勉強会 ECCV ...Yoshitaka Ushiku
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成Yoshitaka Ushiku
 
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)Yoshitaka Ushiku
 

Mehr von Yoshitaka Ushiku (15)

機械学習を民主化する取り組み
機械学習を民主化する取り組み機械学習を民主化する取り組み
機械学習を民主化する取り組み
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用
 
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
 
これからの Vision & Language ~ Acadexit した4つの理由
これからの Vision & Language ~ Acadexit した4つの理由これからの Vision & Language ~ Acadexit した4つの理由
これからの Vision & Language ~ Acadexit した4つの理由
 
視覚と対話の融合研究
視覚と対話の融合研究視覚と対話の融合研究
視覚と対話の融合研究
 
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
Vision-and-Language Navigation: Interpreting visually-grounded navigation ins...
 
Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)
Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)
Sequence Level Training with Recurrent Neural Networks (関東CV勉強会 強化学習論文読み会)
 
Frontiers of Vision and Language: Bridging Images and Texts by Deep Learning
Frontiers of Vision and Language: Bridging Images and Texts by Deep LearningFrontiers of Vision and Language: Bridging Images and Texts by Deep Learning
Frontiers of Vision and Language: Bridging Images and Texts by Deep Learning
 
Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)
Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)
Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会)
 
Asymmetric Tri-training for Unsupervised Domain Adaptation
Asymmetric Tri-training for Unsupervised Domain AdaptationAsymmetric Tri-training for Unsupervised Domain Adaptation
Asymmetric Tri-training for Unsupervised Domain Adaptation
 
Recognize, Describe, and Generate: Introduction of Recent Work at MIL
Recognize, Describe, and Generate: Introduction of Recent Work at MILRecognize, Describe, and Generate: Introduction of Recent Work at MIL
Recognize, Describe, and Generate: Introduction of Recent Work at MIL
 
Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線
 
Leveraging Visual Question Answering for Image-Caption Ranking (関東CV勉強会 ECCV ...
Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...Leveraging Visual Question Answeringfor Image-Caption Ranking (関東CV勉強会 ECCV ...
Leveraging Visual Question Answering for Image-Caption Ranking (関東CV勉強会 ECCV ...
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成
 
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
 

Kürzlich hochgeladen

新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Hiroshi Tomioka
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 

Kürzlich hochgeladen (11)

新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

Generating Notifications for Missing Actions: Don’t forget to turn the lights off! (関東CV勉強会 ICCV 2015 読み会)