Ccmmutty logo
Commutty IT
2 min read

【Python】Numpy形式でデータを保存する

https://cdn.magicode.io/media/notebox/1228c28c-6b57-4993-a71f-eaf450a351b1.jpeg

概要

機械学習の際に学習データ用の数百枚以上の画像をNumpy配列に格納することがあります。実はこのNumpy配列をストレージに保存し、一回の読み込みで数百枚の画像を読み込むことができます。今回はそんなテクニックを紹介します。

やり方

手順もそんなにないので早速紹介していきます。Google Colaboratory上での動作を想定しています。使い方がわからない方はこちらの記事で解説してますのでご活用ください。
python
!pip install scikit-image numpy

import numpy as np
from skimage import io

# Google Driveのマウント
from google.colab import drive
drive.mount('/content/drive')

# Googleドライブ上の画像ファイルパスを記載してください
filename = 'パスを記載'

# 画像読み込み
img = io.imread(filename)

# numpy形式で保存
np.save('/content/drive/MyDrive/numpy.img.npy', img)

# numpy形式の画像を読み込み
img_numpy = np.load('/content/drive/MyDrive/numpy.img.npy')

# 画像表示
io.imshow(img)

まとめ

numpy形式で画像保存はとても簡単にできます。大量のファイルを読み込む時はどうしてもオーバーヘッドが生じ、読み込みに時間がかかってしまいます。特に機械学習の分野では学習データのサイズが非常に大きいため、読み込みにかかる時間も短縮したいところです。そういった場面で本記事の内容は使えますので是非ご活用ください。

Discussion

コメントにはログインが必要です。