「google-images-download」でGoogleから画像を一括ダウンロード – 機械学習のための画像集めに -【Python】

IT

機械学習とディープラーニングの違いもわからない自分がAIカメラによる画像認識の実装に携わる機械がありました.

学習モデルの画像集めのために使った便利なPythonツール「google-images-download」を紹介します.

f:id:take_m5:20191212134321j:plain

↑こんなかんじでキーワードを指定すると画像が集まるツールです.

ちなみに機械学習などの「情報解析」のためならば著作物は著作権者の許諾なく利用できます.以下の記事より.

「日本は機械学習パラダイス」 その理由は著作権法にあり
「日本は機械学習パラダイス」とも言われている。その理由は日本の著作権法にある。

参考文献

Google Images Download — Google Images Download documentation

「google-images-download」の使い方

Pythonをダウンロードしてから使います.(私はanacondaを使っています)

インストール

pipでインストールします

$ pip install google_images_download

画像のダウンロード

コマンドラインで以下のように入力します.

$ googleimagesdownload --keywords "検索したいもの"

もしくは

$ googleimagesdownload -k "検索したいもの"

たとえばバナナだと

$ googleimagesdownload -k "バナナ"

デフォルトだと100個画像をダウンロードします.

カレントディレクトリにdownloadsフォルダが作られ,その中のキーワードで指定した名前のフォルダの中に画像がダウンロードされます.

ダウンロードする画像数や拡張子なんかはオプションで指定できます.

オプション

よく使いそうなものを紹介しておきます.

オプション ショートカット 説明
keywords k 検索したいもののキーワード
“”で囲む
キーワード間にORを入れることでor検索も可能
limit l ダウンロードする画像数を指定
デフォルトは100
format f ダウンロードする画像の形式を指定
(jpg, gif, png, bmp, svg, webp, ico, raw)
size s ダウンロードする画像のサイズを指定
(large, medium, icon,
>400*300, >640*480, >800*600,
>1024*768, >2MP, >4MP, >6MP, >8MP,
>10MP, >12MP, >15MP, >20MP, >40MP, >70MP)
color co ダウンロードする画像の色を指定
(red, orange, yellow, green, teal, blue, purple, pink, white, gray, black, brown)
chromedriver cd 画像を入手するドライバをchromedriverに変更
chromedriver.exeのあるパスを指定する

その他のオプションは

Input Arguments — Google Images Download documentation

に書いてあります.

ちなみに,デフォルトでは100件以上の画像のダウンロードはできないみたいです.

私はやっていないのですが,100件以上ダウンロードしたい場合はchromedriverをダウンロードし,オプションのchromedriverで実行ファイルのあるパスを指定するとできるみたいです.

ダウンロードは下記URLより

Downloads - ChromeDriver - WebDriver for Chrome
WebDriver for Chrome

以上です.

コメント

タイトルとURLをコピーしました