[CNN basic] MNIST 데이터셋 학습, 예측

[CNN basic] MNIST 데이터셋 학습, 예측

2022. 4. 19. 15:49ㆍ🧪 Data Science/ML, DL

이번 포스팅에선 간단하게 Keras를 이용하여 CNN모델을 만들고 학습, 예측한다.

CNN의 학습과정을 전체적으로 따라가 보자.

CNN의 개념이 익숙지 않다면 이전 포스팅을 보고 오자.

[CNN basic] 합성곱 층, 풀링 층

CNN basic 합성곱 층, 풀링 층 CNN(Convolutional neural network)이란? 합성곱 신경망은 시각 피질 안의 뉴런 작동방식을 본 따 만들어진 네트워크이다. 위 그림은 실제 시각피질의 뉴런이 작동하는 방식이

mengu.tistory.com

MNIST 데이터셋

MNIST 데이터셋은 손글씨 데이터 셋이다.

해당 포스팅에선, 이미지를 바탕으로 손글씨를 0~10까지 분류하는 모델을 만들 것이다.

차근차근 가보자.

1. 데이터셋 로드

(x_train_all, y_train_all), (x_test, y_test) = tf.keras.datasets.fashion_mnist.load_data()

keras를 이용해 데이터셋을 불러온다. 데이터의 생김새를 확인해보자.

 x_train_all[0]

28x28 크기이며, 0~255까지의 값이 분포해있다.

y_train_all[0]

타깃 데이터는 0~9까지 존재하며, 1차원 정수다.

2. 훈련 데이터 세트를 훈련 세트와 검증 세트로 나누기

from sklearn.model_selection import train_test_split
x_train, x_val, y_train, y_val = train_test_split(x_train_all, y_train_all,
                                                  stratify=y_train_all, test_size=0.2, random_state=42)

학습 데이터와 검증 데이터를 80%/20% 비율로 나눠준다.

3. 타깃을 원-핫 인코딩으로 변환

y_train_encoded = tf.keras.utils.to_categorical(y_train)
y_val_encoded = tf.keras.utils.to_categorical(y_val)

출력 값은 softmax와 같은 출력 함수를 이용한 10차원 배열이 될 것이다. 이에 맞게 타깃도 10차원의 배열로 인코딩해준다.

y_train_encoded[0]

4. 입력 데이터 준비

x_train = x_train.reshape(-1, 28, 28, 1)
x_val = x_val.reshape(-1, 28, 28, 1)

x_train.shape

train의 shape 해석: 48000개의 샘플이 존재하고, 28x28 크기의, 채널이 gray 하나뿐인 이미지 데이터

5. 입력 데이터 표준화 전처리

x_train = x_train / 255
x_val = x_val / 255

이미지 데이터는 0~255 사이의 정수로 픽셀 강도를 표한한다. 입력 데이터를 255로 나누어 0~1 사이의 값으로 조정한다.

x_train[0]

6. 모델링 / 모델 구조 확인

from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

conv1 = tf.keras.Sequential()
conv1.add(Conv2D(10, (3,3), activation='relu', padding='same', input_shape=(28,28,1)))
conv1.add(MaxPooling2D((2,2)))
conv1.add(Flatten())
conv1.add(Dense(100, activation='relu'))
conv1.add(Dense(10, activation='softmax'))

conv1.summary()

7. 모델 훈련

conv1.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
history = conv1.fit(x_train, y_train_encoded, epochs=20, validation_data=(x_val, y_val_encoded))

8. 손실 그래프와 정확도 그래프 확인하기

plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train_loss', 'val_loss'])
plt.show()

plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train_accuracy', 'val_accuracy'])
plt.show()

점점 loss가 줄어들고 accuracy가 증가하는 것을 확인할 수 있다.

CNN 모델링이 잘 되었으며, 학습/예측 또한 잘 되었음 알 수 있다.

이번 포스팅은 여기까지.

'🧪 Data Science > ML, DL' 카테고리의 다른 글

[강화학습] REINFORCE 알고리즘 : 코드 구현 (1)	2024.06.02
[강화학습] REINFORCE 알고리즘 : 개념 및 수식 (0)	2024.05.27
[ML] 차원 축소 (1) - 정의, PCA, 예제코드 (1)	2024.02.26
[추천 알고리즘] ALS 개념, Basic 하게 feat. 코드 X (0)	2022.05.23
[CNN basic] 합성곱 층, 풀링 층 (0)	2022.04.19

HIGHQUAL

HIGHQUAL

태그

최근글

댓글

공지사항

아카이브

'🧪 Data Science > ML, DL' 카테고리의 다른 글

관련글

티스토리툴바