YOLO V3で独自データセットを学習させて物体検出 / Yolo V3 with your own dataset

YOLO V3で
独自データセットを学習させて物体検出
八王子ＡＩ 2019/7/27
moto2g

内容
 YOLO V3で独自データを学習させたときの流れを紹介します
 「独自データでのモデル作りができそう」な状態になってもらえたら嬉しい
※理論の説明はありません。できません

実行したときの環境
 Windows 10 Home
 Webカメラ (Logicool C270m)
 Python 3.7.0
 Tensorflow 1.14.0
 keras
 Open CV 3.4.5.20 ※Ver.3系を指定
 matplotlib
 pillow
 VOTT 2.1.0

Python 環境構築
 Pythonの仮想環境に必要なライブラリをインストール
ex) c:¥projects¥yolo_v3をプロジェクトフォルダとします。
python -m venv 仮想環境名
仮想環境名¥scripts¥activate
pip install tensorflow
pip install keras
pip install opencv-python==3.4.5.20
pip install matplotlib
pip install pillow

YOLO 環境構築
 Yolo V3の一式をダウンロード(111KB)し、任意のフォルダに配置
https://github.com/qqwweee/keras-yolo3
ex) c:¥projects¥yolo_v3¥ にソース、フォルダ類を配置
 学習済みモデルをダウンロード(237MB)し、任意のフォルダに配置
https://pjreddie.com/media/files/yolov3.weights
ex) c:¥projects¥yolo_v3¥yolov3.weights として配置
 モデルをkeras用にコンバート
python convert.py yolov3.cfg yolov3.weights model_data/yolo.h5

YOLO 動作確認
静止画
 python yolo_video.py --image
 "Input image filename:"と聞かれたらファイル名を入力する
動画
 python yolo_video.py --input hoge.mp4

YOLOの動作確認
https://github.com/AlexeyAB/darknet

YOLOの動作確認
https://www.thedodo.com/close-to-home/shih-poo-dog-yogi-looks-human

データ収集＆アノテーション付与
 学習用の素材を収集してアノテーションを付ける。
 アノテーションの付与にVoTTを使用。
下記からダウンロード(96MB)してインストールする。
https://github.com/Microsoft/VoTT/releases
 iPhoneで撮影した動画（mov形式）を使用したが、VoTTではそのままでは読め
なかった。
 FullHDサイズの画像だと学習中にメモリ不足でエラーが発生した。
 ffmpegでmp4形式に変換しつつ、解像度を下げた
ffmpeg -i hoge.mov -s 416x234 hoge.mp4

アノテーションの変換
 VoTTからエクスポートした構成
 出力先フォルダ
 VOTTプロジェクト名-PascalVOC-export
 Annotations
 ImageSets
 Main
 JPEGImages
 xxx.jpg
ex) c:¥projects¥yolo_v3
 VOCDevkit
 VOC2007
 Annotations
 ImageSets
 Main
 train.txt
 test.txt
 val.txt
 JPEGImages
 xxx.jpg
②train.txt、test.txt、val.txtを作成し、
JPEGImages内のjpgファイルを列挙する。
※拡張子"jpg"は記載しない
①VOCDevkitフォルダを作成し、
VoTTから出力したファイルを配置する

 YOLO V3のソースに付属している"voc_annotation.py"で、PascalVOC形式を
YOLO V3形式に変換するが、事前にソース修正が必要。
 修正したら変換実行
python voc_annotation.py
・classesのリストを自分で学習させる内容に合わせる。
・VoTTでアノテーション位置がfloatで書かれているものを読み込めるようにする。
アノテーションの変換
voc_annotation.py：6行目あたり
classes = ["gu"]
voc_annotation.py：21行目あたり
b = (int(float(xmlbox.find('xmin').text)),
int(float(xmlbox.find('ymin').text)),
int(float(xmlbox.find('xmax').text)),
int(float(xmlbox.find('ymax').text)))

独自データ学習の準備
 ex) c:¥projects¥yolo_v3¥model_data¥my_classes.txt に独自クラスを列挙する。
改行コードはLFにしておく。
 学習用プログラムが独自クラスを使うように修正する。
 必要に応じてバッチサイズを変更（train.py：57行目、76行目あたり）
 学習用にweightsをコンバート
python convert.py -w yolov3.cfg yolov3.weights model_data/yolo_weights.h5
train.py：17行目、19行目あたり
"annotation_path"に"2007_train.txt"を指定する
"classes_path"に"model_data/my_classes.txt"を指定する

学習
 学習する
python train.py
 学習済みモデルは logs¥000¥trained_weights_final.h5 として生成されている

独自で学習したモデルでYOLOを実行
が、クラスとモデルの指定がうまくいかないので固定で読み込むよう修正。
tyolo.py：23行目、25行目あたり
"model_path": 'logs/000/trained_weights_final.h5',
"classes_path": 'model_data/my_classes.txt',

独自で学習したモデルでYOLOを実行
静止画
 python yolo_video.py --model logs/000/trained_weights_final.h5 --classes
model_data/my_classes.txt --image
動画
 python yolo_video.py --model logs/000/trained_weights_final.h5 --classes
model_data/my_classes.txt --input hoge.mp4

Webカメラの画像で試してみる
https://github.com/moto2g/image_recognition/tree/master/yolo3
python yolo_video_with_cam.py --image

YOLO V3で独自データセットを学習させて物体検出 / Yolo V3 with your own dataset

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Ähnlich wie YOLO V3で独自データセットを学習させて物体検出 / Yolo V3 with your own dataset

Ähnlich wie YOLO V3で独自データセットを学習させて物体検出 / Yolo V3 with your own dataset (20)

YOLO V3で独自データセットを学習させて物体検出 / Yolo V3 with your own dataset