わかめの備忘録

GTSRBデータセットを利用した画像分類(1)

今後参加するであろう画像分類コンペへの対策や
今までDeepLearningについて学んできた内容のおさらいとして
今回からGTSRBのデータセットを使い モデル構築の方法や
データセットの取扱い方法などを実践してみたいと思います。

第一回目はこちらのチュートリアルをやってみます。 chsasank.github.io

またこの記事から続く連載記事の最終目標を転移学習(Transfer Learning)やデータ加工(Data Augumentation)等の技術を駆使して「過去のコンペ1位の精度である99.71%に近づける」に設定したいと思います。

まずは利用するGTSRBデータセットについて。

GTSRBとは

International Joint Conference on Neural Networks (IJCNN) 2011で開催されたドイツの道路交通標識画像分類コンペのこと。

データセット概要

The German Traffic Sign Recognition Benchmark(GTSRB)

  • 単一画像、マルチクラス分類
  • 訓練、テスト画像含め50,000枚以上の画像群
  • 43種類のクラス
  • 光の状態、明るさや暗さを加味したデータセット

下記画像はコンペで使われる43種類の画像群になります。 f:id:wakame1367:20180628220514p:plain

また、上記データセットは下記リンクからダウンロードできます。
ダウンロードURLを赤色の枠で囲っておきました。
German Traffic Sign Benchmarks f:id:wakame1367:20180629220503p:plain

f:id:wakame1367:20180629220512p:plain

43種類それぞれのドイツ道路交通標識の詳細について参考リンクをおいておきます。 www.berlinnet789.de

ソースコード

実際に使ったソースコードを用意しました。 github.com リポジトリ名間違えた・・・