SlideShare ist ein Scribd-Unternehmen logo
1 von 28
関西大学 総合情報学部
中道 翔大 松下光範
位置情報に基づく画像分類モデルの
選定による看板画像の分類精度向上
1
・人々の行動
◻ どの店に入るかなどの意思決定
◻ 店舗名をもとにしたWeb検索による
店舗の詳細情報の取得
看板の役割
店舗や会社の名称の掲示
2
韓国語の看板
3
読みづらい文字の看板
4
・ユーザの母国語ではない文字
・崩し文字などの認識が難しい文字
・言語障壁により、店舗の種類の判別や
検索による詳細情報の取得が困難
看板における問題
5
・慣れていない地域にいる時
・周囲の文字が読めない状況
本研究の最終目的
6
看板から店舗の詳細情報を
取得できるシステムの実現
現状のシステムのデモ
7
①携帯端末のカメラに写っている画像をWebAPIサーバーに送信
②送信された画像から看板領域を検出(YOLOv2を使用)
システムの詳細
8
③検出された領域からどの店舗の看板であるかを画像分類モデル
によって識別(VGG16により構築)
④判別した店舗の「食べログ」のページのURLを携帯端末に返却
システムの詳細
ラーメン人生JETの
食べログのURL
ラーメン人生JET 9
システムの課題
10
システムを適用できる店舗が少ない
(15店舗のみ)
システムの対象店舗を増やす
→看板画像を識別する際に候補となる店舗数も同時に増える
→看板画像の分類モデルの精度低下により、看板の識別精度が低
下する懸念がある
対象店舗数 識別精度
本研究の目的
11
システムの対象店舗を増やした際に発生する
画像分類精度の低下を低減する
ユーザの位置情報に基づいた
使用モデルの選定による
看板画像の分類精度向上
①対象店舗が属する地域を、各店舗の地理的近接性に基づいて分割
提案手法
A
G
E
D
C
F
B
H
N
I
J
M
L
K
O
P
12
①対象店舗が属する地域を、各店舗の地理的近接性に基づいて分割
提案手法
エリア① エリア②
エリア③ エリア④
A
G
E
D
C
F
B
H
N
I
J
M
L
K
O
P
12
エリア① エリア②
エリア③ エリア④
A
G
E
D
C
F
B
H
N
I
J
M
L
K
O
P
②分割したエリアごとに看板画像を学習させる
提案手法
画像 店名
A
C
L
P
画像 店名
F
J
K
O
画像 店名
D
E
H
N
画像 店名
B
G
I
M
データセット① データセット③
データセット② データセット④
モデル① モデル② モデル③ モデル④13
エリア① エリア②
エリア③ エリア④
A
G
E
D
C
F
B
H
N
I
J
M
L
K
O
P
③ユーザの位置情報に基づいて画像分類モデルを選定し、識別を行う
提案手法
看板 店名
A
C
L
P
看板 店名
F
J
K
O
看板 店名
D
E
H
N
看板 店名
B
G
I
M
データセット① データセット③
データセット② データセット④
モデル① モデル② モデル③ モデル④
User
14
User
エリア① エリア②
エリア③ エリア④
A
G
E
D
C
F
B
H
N
I
J
M
L
K
O
P
③ユーザの位置情報に基づいて画像分類モデルを選定し、識別を行う
提案手法
画像 店名
A
C
L
P
画像 店名
F
J
K
O
画像 店名
D
E
H
N
画像 店名
B
G
I
M
データセット① データセット③
データセット② データセット④
モデル① モデル② モデル③ モデル④ 14
User
User
実装
15
看板画像データセットの作成
Step 1
Step 2
Step 3
Step 4
対象店舗の位置情報の収集
位置情報に基づく地域の分割
エリア毎の画像分類モデルの構築
Step1 看板データセットの作成
スクレイピングによる看板画像の収集
①「食べログ」の各店舗のページに掲載されている外観画像を、
BeautifulSoup4を用いたスクレイピングによって自動で収集
16
Step1 看板データセットの作成
スクレイピングによる看板画像の収集
②各外観画像に対して物体検出によって看板画像を検出して切り出し
20枚以上収集できた930店舗をシステムの対象に設定
物体
検出
17
スクレイピングによる対象店舗の住所の収集
①「食べログ」の各店舗のページに掲載されている住所を
スクレイピングによって収集
Step2 対象店舗の位置情報の収集
18
Step2 対象店舗の位置情報の収集
ジオコーディング
②ジオコーディングを適用して、各店舗の住所を緯度経度に変換
19
上:緯度 下:経度
Step3 位置情報に基づく地域の分割
k平均法によるクラスタリング
・地理的近接性に基づいて分割
・クラスタ数:18
・店舗数
◻最も多いエリア:197店舗
◻ 最も少ないエリア:5店舗
20
Step4 エリア毎の画像分類モデルの構築
VGG16による転移学習
21
◻ トレーニングセット:60%
◻ バリデーションセット:20%
◻ テストセット:20%
・拡大縮小,水平反転,拡大縮小,せん断変換による
データの水増し
・224×224にリサイズして学習
対象店舗全ての看板を学習
モデルの精度比較
22
エリア内の店舗の看板を学習
大阪府内 エリア2
エリア1 エリア18
・・・
正解率:0.799
(エポック数:2000)
正解率の平均:0.879
最小の正解率:0.821
(エポック数:50-400)
提案手法による精度の向上が確認できた
考察
23
最も高い正解率:1.0
最も低い正解率:0.821
店舗数が多いエリアの
モデルの正解率が低下
各エリアごとの店舗数を可能な限り均一にする
エリアの分割手法
考察
24
対象地域の細分化
→各エリアの店舗数が削減に
よる分類精度向上
→構築するモデル数の増加
→コストの増大
エリア数と構築するモデル数のトレードオフを考慮
エリアの分割手法
エリア数:4 (k=4) エリア数:10 (k=10)
今後の展望
25
・地域の分割手法の再検討
・実世界でのシステムの識別精度の確認
・ユーザの付近にある店舗を候補として識別を行う手法の検討
User 店舗E、F、L、N、P
を候補として識別
背景
まとめ
|看板の役割は店舗や会社の名称の掲示
|読めない看板からの情報の取得は困難
研究の最終目的
|看板から店舗情報を取得するシステムの実現
システムの詳細
|物体検出及び画像分類を用いた看板の識別
システムの課題
|システムを適用できる店舗が少ない
|対象店舗を増やす→分類候補数が増える
→分類モデルの精度が低下し、看板の識別精度が低下
提案手法
①対象の地域を複数のエリアに分割
②分割したエリアごとに看板画像を学習
③ユーザの位置情報に基づいた分類モデルの選定
|識別した店舗の食べログのURLを送信
|各エリアごとの店舗数を可能な限り均一にする
|エリア数と構築するモデル数のトレードオフを考慮
実装
研究の目的
|対象店舗の増加に伴う分類精度の低下を低減
①看板画像データセットの作成
②対象店舗の位置情報の収集
③位置情報に基づく地域の分割
④エリア毎の画像分類モデルの構築
考察

Weitere ähnliche Inhalte

Mehr von Matsushita Laboratory

松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
Matsushita Laboratory
 
ChinaTakahashi_Exploration cycle finding a better dining experience: a frame...
 ChinaTakahashi_Exploration cyclefinding a better dining experience:a frame... ChinaTakahashi_Exploration cyclefinding a better dining experience:a frame...
ChinaTakahashi_Exploration cycle finding a better dining experience: a frame...
Matsushita Laboratory
 
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
Matsushita Laboratory
 
RyotaHiguchi_MasterThesis2023
RyotaHiguchi_MasterThesis2023RyotaHiguchi_MasterThesis2023
RyotaHiguchi_MasterThesis2023
Matsushita Laboratory
 
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
Matsushita Laboratory
 

Mehr von Matsushita Laboratory (20)

TaketoFujikawa_10thComicComputing2023
TaketoFujikawa_10thComicComputing2023TaketoFujikawa_10thComicComputing2023
TaketoFujikawa_10thComicComputing2023
 
SayakaHayashi_FIT2023
SayakaHayashi_FIT2023SayakaHayashi_FIT2023
SayakaHayashi_FIT2023
 
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
 
ReonHata_JSAI2023
ReonHata_JSAI2023ReonHata_JSAI2023
ReonHata_JSAI2023
 
HarukiShinkawa_FIT2023
HarukiShinkawa_FIT2023HarukiShinkawa_FIT2023
HarukiShinkawa_FIT2023
 
ChinaTakahashi_Exploration cycle finding a better dining experience: a frame...
 ChinaTakahashi_Exploration cyclefinding a better dining experience:a frame... ChinaTakahashi_Exploration cyclefinding a better dining experience:a frame...
ChinaTakahashi_Exploration cycle finding a better dining experience: a frame...
 
TaketoFujikawa_KES2023
TaketoFujikawa_KES2023TaketoFujikawa_KES2023
TaketoFujikawa_KES2023
 
Unification of Terminology for Accurate Communication among Experts --- Basic...
Unification of Terminology for Accurate Communication among Experts --- Basic...Unification of Terminology for Accurate Communication among Experts --- Basic...
Unification of Terminology for Accurate Communication among Experts --- Basic...
 
JSAI2023_企画セッション(仕掛学)資料
JSAI2023_企画セッション(仕掛学)資料JSAI2023_企画セッション(仕掛学)資料
JSAI2023_企画セッション(仕掛学)資料
 
触感に関わる共感覚的表現と基本6感情の対応関係の検証
触感に関わる共感覚的表現と基本6感情の対応関係の検証触感に関わる共感覚的表現と基本6感情の対応関係の検証
触感に関わる共感覚的表現と基本6感情の対応関係の検証
 
レシピの手順に着目した 複数の器特徴の推定
レシピの手順に着目した 複数の器特徴の推定レシピの手順に着目した 複数の器特徴の推定
レシピの手順に着目した 複数の器特徴の推定
 
TaketoFujikawa_comic2023
TaketoFujikawa_comic2023TaketoFujikawa_comic2023
TaketoFujikawa_comic2023
 
複数の質感を複合的に提示可能な触覚提示デバイス
複数の質感を複合的に提示可能な触覚提示デバイス複数の質感を複合的に提示可能な触覚提示デバイス
複数の質感を複合的に提示可能な触覚提示デバイス
 
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
効果音と抽象図形の動作の組み合わせによる印象変化に関する研究
 
RyotaHiguchi_MasterThesis2023
RyotaHiguchi_MasterThesis2023RyotaHiguchi_MasterThesis2023
RyotaHiguchi_MasterThesis2023
 
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
携帯端末を用いたポインティングによる室内空間でのアドホックな情報アクセス手法に関する研究
 
Kokogatari:実環境を介したリレー小説執筆ツール
Kokogatari:実環境を介したリレー小説執筆ツールKokogatari:実環境を介したリレー小説執筆ツール
Kokogatari:実環境を介したリレー小説執筆ツール
 
Visualization of the Relationship Between Lectures and Laboratories Using SSNMF
Visualization of the Relationship Between Lectures and Laboratories Using SSNMFVisualization of the Relationship Between Lectures and Laboratories Using SSNMF
Visualization of the Relationship Between Lectures and Laboratories Using SSNMF
 
iiWAS2022_Miyagawa
iiWAS2022_MiyagawaiiWAS2022_Miyagawa
iiWAS2022_Miyagawa
 
reIDR2022_takahashi.pdf
reIDR2022_takahashi.pdfreIDR2022_takahashi.pdf
reIDR2022_takahashi.pdf
 

Kürzlich hochgeladen

Kürzlich hochgeladen (11)

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

位置情報に基づく画像分類モデルの 選定による看板画像の分類精度向上