Advanced Neural Net (2)
๊ณผ์ ๋ด์ฉ ์ค๋ช
์บ๊ธ Kannada MNIST๋ฅผ ์ด์ฉํ ๋ฏธ๋๋ํ
์ฐ์๊ณผ์ ์ ์ ์ด์
์กฐ์์ฐ๋์ ์๋ฒฝํ ๋ ธํธ๋ถ์ด์์ต๋๋ค. keras sklearn wrapper๋ฅผ ์ด์ฉํด์ ๊ทธ๋ฆฌ๋ ์์น ํ์ดํผ ํ๋ผ๋ฏธํฐ ํ๋์ ์งํํ์ ์ , hiplot์ด๋ผ๋ ๋ชจ๋๋ก ๊ฐ ๋ ์ด์ด๋ณ ์๊ฐํ ์งํํ์๊ณ ์ด๋ฅผ ํตํด ์ฑ๋ฅ์ด ๋์ ๋ฐฐ์น์ ๊ทํ, ๋๋กญ์์ ๋ฑ์ ๋ถ์ํ์ ์ , ๋ํ SOPCNN์ด๋ผ๋ MNIST SOTA ๋ชจ๋ธ์ ์ฐพ์ ๋ณด์ ์ , Autokeras ์คํ๊น์ง ๋ฐฐ์ธ๊ฒ ๋ง์ ์ต๊ณ ์ ๋ ธํธ๋ถ์ด์์ต๋๋ค.
7์ฃผ์ฐจ: Deep Learning Framework
13๊ธฐ ์กฐ์์ฐ
๊ณผ์ : Kannada MNIST (https://www.kaggle.com/c/tobigs13nn)
๋ฐ์ดํฐ: Train: 42,000 rows, Test: 18,000 rows
๋ชฉ์ฐจ
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ
์ฌ๋ฌ ๋ฅ๋ฌ๋ ์ฌํ ๊ธฐ๋ฒ ๋น๊ต (with Hiplot)
Activation
Relu / Leaky Relu / PRelu
Softmax
Batch Norm
Weight Init
Optimizer
Rmsprop, Adam, Radam
Regularzation
Dropout, Spatial Dropout
Early Stopping
Data Augmentation
๋ชจ๋ธ ๋ฆฌ์์น ๋ฐ ์ ์
ํ์ต ๋ฐ ํ์ดํผ ํ๋ผ๋ฏธํฐ ์กฐ์
0. Pre-requisite & Module Import
In [ ]:
In [ ]:
In [ ]:
In [8]:
In [ ]:
In [ ]:
In [ ]:
In [3]:
Out[3]:
In [ ]:
Out[ ]:
1. Data Load & Preprocessing
In [ ]:
In [ ]:
In [ ]:
Out[ ]:
2. ๋ฅ๋ฌ๋ ์ฌํ ๊ธฐ๋ฒ Grid Search (with Hiplot)
๋ค์ํ ๊ธฐ๋ฒ๊ณผ ํ์ดํผ ํ๋ผ๋ฏธํฐ ํ๋์ ํตํด ๊ฐ ๊ธฐ๋ฒ ๋ค์ ํจ๊ณผ๋ฅผ ์ ๋ฆฌ
์ด๋ฒ์ ๋ฐฐ์ด ์ฌ๋ฌ๊ฐ์ง ๊ธฐ๋ฒ๋ค์ ์ /๋ฌด,ํฌ๊ธฐ ์กฐ์ ๋ฑ์ ํตํด ๊ทธ ํจ๊ณผ๋ฅผ ๋ถ์ํ๊ณ ๊ฐ์ฅ ์ต์ ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ตฌํด๋ณธ๋ค. ํ๋ผ๋ฏธํฐ๋ณ๋ก ์ต์ 3๊ฐ์์ 5๊ฐ๊น์ง ์ต์ ์ ์ฃผ๊ณ ์ถ์์ง๋ง Colab ๋ฉ๋ชจ๋ฆฌ๊ฐ ๊ฐ๋นํ์ง ๋ชปํ๊ณ ๊ณ์ ํฐ์ ธ์ ๊ฐ๋ฅํ ์์ค์ผ๋ก ๋ฎ์ถ์๋ค.
2.1 Grid Search ์ค๋น ๋ฐ ๋ชจ๋ธ ์์ฑ
In [ ]:
In [ ]:
In [ ]:
In [ ]:
Out[ ]:
In [ ]:
Out[ ]:
In [ ]:
Out[ ]:
In [ ]:
In [ ]:
In [ ]:
In [11]:
In [28]:
2.2 ๊ฒฐ๊ณผ ์๊ฐํ
์๊ฐํ๋ก Facebook Research์ Hiplot( https://github.com/facebookresearch/hiplot )์ ์ฌ์ฉํ์๋ค.
ํนํ ๊ณ ์ฐจ์์ ๋ฐ์ดํฐ ๊ฐ์ ํจํด์ ๋ณด๊ธฐ์ ์ฉ์ดํ๋ค๊ณ ํ๋ค.
In [12]:
Out[12]:

์ ์ฒด ๊ทธ๋ํ

mean_score, Std_score ์์ ๋ชจ๋ธ ๊ทธ๋ํ
์ธ์ฌ์ดํธ
ํ์คํ ์ต์์๊ถ์ ๋ชจ๋ธ์ BatchNorm์ด ๊ฑฐ์ ๋ชจ๋ ์ ์ฉ๋์ด ์๋ค.
Dropout์ 0.2์์ ์ข์ ์ฑ๋ฅ์ ๋ณด์๋ค.
Lr์ 0.01์ด ์ข๊ฒ ๋์์ง๋ง, ์ด๋ Epoch์ด 20 ๋ฐ์ ์๋์ด ์์ง ํ์ต์ด ์งํ ์ค์ผ ๊ฐ๋ฅ์ฑ์ด ํฌ๋ค.
Batch Size๋ ๋ฎ์ ์๋ก ์ข์ ์ฑ๋ฅ์ด ๋์๋ค. ์์ ๋น๋ก๋ผ ๋ณด๊ธด ํ๋ค๊ฒ ์ง๋ง ๋ ผ๋ฌธ์์๋ 256์ ์ ์ฉํ ๊ฒ์ ๋ณด๋ฉด ๋๋ฌด ํฌ๋ฉด ๊ฐ Batch์ ํน์ฑ์ด ๋ญ๊ฐ์ง๋๊ฒ ์๋๊น ์ถ์ธก๋๋ค.
Optimizer๋ Adam๊ณผ RMSprop ๋ชจ๋ ๊ด์ฐฎ์ ์ฑ๋ฅ์ด ๋์๋ค.
3. Model Research & Selection
MNIST ๋ฐ์ดํฐ์ ์ ๋ํ์ ์ธ ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ฐ์ดํฐ์ ์ผ๋ก ๋ง์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด SOTA๊ธ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค.
๊ทธ์ค์์ ํนํ CNN ๋ชจ๋ธ์ด ๋น ๋ฅธ ํ์ต ์๋์ ์๋ฑํ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์์ผ๋ฉฐ ์ด๋ฒ ๊ณผ์ ์ ์ ์ ์ธ Kannada MNIST์์๋ ๋ง์ ์ฌ๋๋ค์ด ํด๋น ๋ชจ๋ธ์ ํตํด ์ข์ ์ฑ์ ์ ๊ฑฐ๋์๋ค. ์ด๋ฅผ ์ฐธ๊ณ ํ์ฌ ๋ชจ๋ธ์ ์ค๊ณํ๊ณ , Papers with code ์์ SOTA๊ธ ๋ ผ๋ฌธ ๋ค์ ์ฐธ๊ณ ํ์ฌ ์ฌ๋ฌ ๊ธฐ๋ฒ ๋ค์ ์ฅ๋จ์ ์ ์ฐธ๊ณ ํ์ฌ ์ ์ฉํด๋ณธ๋ค. ๊ทธ๋ฆฌ๊ณ ์ค์ ๋ก ๊ฝค ์ข์ ์ธ์ฌ์ดํธ๋ฅผ ์ป์ ์ ์์๋ค.
3.1 SOPCNN
Stochastic Optimization of Plain Convolutional Neural Networks with Simple methods
2020 MNIST SOTA
MNIST 2020๋ SOTA์ธ SOPCNN ๋ ผ๋ฌธ์ ๋ณด๋ฉด, ์ต์ ํ ๊ธฐ๋ฒ์ ์๋นํ ๊ณต์ ๋ค์์์ ์ ์ ์๊ณ ํนํ ์ด๋ฒ ๋ด์ฉ๊ณผ ๊ฒน์น๋ ๋ถ๋ถ์ด ๊ฐ์ ธ์ ์ ์ฉํด๋ณด๋ฉด ์ข์ ์ ์ด ๋ง์๋ค. ์ด ๋ ผ๋ฌธ์ด ์งํฅํ๋ ๋ฐ๋ CNN๋ชจ๋ธ์ด ์ข์ ์ฑ๋ฅ์ ๋ณด์ด์ง๋ง epoch์ด ์ฆ๊ฐํจ์ ๋ฐ๋ฅธ overfitting ๋ฌธ์ ๊ฐ ์ฌํ์ฌ ์ด๋ฅผ ์ด๋ป๊ฒ ์ ์ต์ ํํ ์ง๋ก Data Augmentation๊ณผ ํนํ Dropout์ ์ฃผ๋ก ๋ค๋ฃจ๊ณ ์๋ค.
Architecture and Design
๊ธฐ๋ณธ์ ๋ชจ๋ธ ๊ตฌ์ฑ์ SimpleNet์ ๊ตฌ์ฑ์ ๋ฐ๋ฅด๊ณ ์๋ค๊ณ ํ๋ค. MNIST ๋ชจ๋ธ์ ์๋ฅผ ๋ค๋ฉด, ์ด 4๊ฐ์ Conv2D layer ๊ฐ ์๊ณ 2๊ฐ ๋ง๋ค Max Pooling Layer๊ฐ ๋ถ๋๋ค. ๋ค์ด์ด 2๊ฐ์ Fully Connected Layer, ๋ง์ง๋ง์ Softmax Activation Layer๋ฅผ ๋ถ์ฌ ๋ชจ๋ธ์ ์์ฑ์์ผฐ๋ค. ์ฌ๊ธฐ์ ํ์ต๋ฅ ์ 0.01๋ก ์ฃผ์๊ณ Dropout ์์น ๋ฐ FC Layer์ ํฌ๊ธฐ๋ ํ๋ผ๋ฏธํฐ ์กฐ์ ์ ํตํด ๊ฒฐ์ ํ์๋ค.
๊ฐ์ฅ ์ธ์๊น์๋ ์
Dropout์ Softmax ์ง์ ์ ํ๋๋ง ์๋ ๊ฒ์ด ๊ฐ์ฅ ์ข๋ค :Maxpool ๋ค์ ๋ฐฐ์นํ๊ธฐ๋ ํ๊ณ , Spatial Dropout๋ ์ ์ฉํด๋ณด์์ง๋ง ๊ทธ๋ฅ Regular Dropout์ FC ๋ค์์ ๋ฐฐ์นํ ๊ฒ์ด ๊ฐ์ฅ ์ฑ๋ฅ์ด ์ข์๋ค๊ณ ํ๋ค.
FC Layer 2048, Drop rate 0.8์ด ๊ฐ์ฅ ์ข๋ค: ์ ์ด ๋ ผ๋ฌธ ์ ๋ชฉ์์ Stochastic์ด๋ ๋ง์ ์ผ๋์ง ์ ์ ์๋ ๋๋ชฉ์ด๋ค. ๋ฏฟ๊ธฐ์ง ์๋ ๋๋กญ์จ์ด๋ผ 5๋ฒ์ ๋ฐ๋ณต ์คํ์ ํตํด ํ๊ท 0.18%์ ์๋ฌ์จ์ด ๋์จ๋ค๋ ๊ฒ์ ์ ์ฆํ์๋ค.
๊ทธ ์ธ์๋ Data Augmentation ์ ํ ๋ฑ์ ์๊ฐํ๊ณ ์์ด ํ์ต์ ์ฐธ๊ณ ํ ์ ์์๋ค.
3.1.1 ๊ตฌํ
In [9]:
In [10]:
ํ ์ํ๋ก์ฐ๊ฐ ์น์ ํ๊ฒ Drop rate๊ฐ 0.5๊ฐ ๋์ผ๋ ํน์ ๊ณผ๊ฑฐ์์ ์ค์ ๋ถ์ธ์ง ์ฌ์ญ๊ณ ์์ง๋ง ๋ฌด์ํ๊ณ ํ์ต์ ์งํํด๋ณธ๋ค.
In [ ]:
3.1.2 ํ์ต ๋ฐ ๊ฒฐ๊ณผ
์ค์ Colab์์ ๋๋ ค๋ณธ ๊ฒฐ๊ณผ ํ์ต์ด ๋๋ฌด ์๋์๋ค. Val_Acc๊ฐ 0.98์ ์ ๊ทผ์กฐ์ฐจ ๋ชปํ๊ณ ๋ชจ๋ธ์ด ์ ํ Simpleํ์ง ์์ ํ์ต์๋ ์ค๋์๊ฐ์ด ๊ฑธ๋ ธ๋ค.
๊ทธ ์ดํ๋ก FC์ ํ์ดํผ ํ๋ผ๋ฏธํฐ 2048๋ฅผ 1024๋ก, Drop Rate๋ฅผ 0.6, 0.4๋ก ๊ฐ๊ธฐ ์คํํด๋ณด์์ ๋ Val Acc 99.6๋ก ๋น์ทํ๊ฒ ๋์ ์ฑ๋ฅ์ด ๋์๋ค.
์ฌ๊ธฐ์ ๋ฐ์ดํฐ ํฌ๊ธฐ๋ ๋ถ๋ฅํ ๊ฐฏ์๋ก FC ํ๋ผ๋ฏธํฐ๋ฅผ ์ข ๋ ์๊ฒ ์กฐ์ ํ ํ์๊ฐ ์๋ค๋ ๊ฒ์ ์ ์ ์์์ผ๋ฉฐ, ๋ ผ๋ฌธ์์ Epoch์ 2000๊น์ง ์งํํ๋๋ฐ ์ง๊ธ Colab์์ ๊ทธ๊ฑด ํ๋ค๊ธฐ ๋๋ฌธ์ Drop rate์์ ์ด๋์ ๋ ํํ์ ๋ณด์ ๋น ๋ฅธ ํ์ต์ ์งํํด์ผ ๊ฒ ๋ค๋ ๋ฐฉํฅ์ฑ์ ์ธ์ธ ์ ์์๋ค.
3.2 CNN (VGG + Data Augmentation)
https://www.kaggle.com/benanakca/kannada-mnist-cnn-tutorial-with-app-top-2
https://www.kaggle.com/c/Kannada-MNIST ์์ ์์ 2%์ ์ฑ๋ฅ์ด ๋์จ ๋ชจ๋ธ์ ์ฐพ์ ์ ์์๊ณ ์น์ ํ๊ฒ ์ฌ๋ฌ ๊ธฐ๋ฒ๋ค์ ์๊ฐํ๊ณ ์์๋ค.
๊ทธ ์ค์์ ํนํ ImageDataGenerator์ ReduceLROnPlateau์ด ์ธ์์ ์ด์๋๋ฐ ์ ์๋ ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ฅผ ๋๋ค์ผ๋ก ๋ณํ์์ผ ๊ธฐ์กด ๋ฐ์ดํฐ์ Overfitting๋๋ ๊ฒ์ ๋ฐฉ์งํ๊ธฐ ์ํ Data Augmentationํด๋ก tf.keras์์ ๋ถ๋ฌ์ฌ ์ ์๋ค. ํ์๋ ๊ทธ ๋ป๋๋ก ์์ ๋๋ฉด ํ์ต๋ฅ ์ ๋ฎ์ถฐ์ฃผ๋ ์ฝ๋ฐฑํจ์๋ก ํ์ต ์ค์ ์งํ๋ฅผ ๊ณ์ ๋ชจ๋ํฐ๋ง ํ์ฌ ์ผ์ ์์ค ์ด์ ์์ ์ด ๋๋ฉด factor * lr๋ก ํ์ฌ์ ํ์ต๋ฅ ์ ์์ฐจ์ ์ผ๋ก ๋ฎ์ถ์ด min_lr์ ๊ทผ์ ํ๋๋ก ํ๋ค.
์ฃผ์ํ ์ ์ ImageDataGenerator์ ํ๋ผ๋ฏธํฐ๋ฅผ ์์งํ์ฌ ํน์ ๋ชจ๋ฅผ ์ค์๋ฅผ ๋ฐฉ์งํด์ผํ๋ ๋ฐ, ํนํ Mnist์ ๊ฒฝ์ฐ flip์ด ์ผ์ด๋์ ์๋๋ฉฐ cutout๋ ์ง์ํ๋ค.
์๋ ํ๋ SOPCNN์์ ์งํํ Data Augmentation ์ด๋ค.
technique Use
rotation
Only used with mnist
shearing
Yes
Shifting up and down
Yes
Zooming
Yes
rescale
Yes
cutout
No
flipping
No
In [ ]:
3.2.1 ๋ชจ๋ธ๋ง
VGG์ ์ ์ฌํ ๋ชจํ์ ํ๊ณ ์์ผ๋ฉฐ Conv2D(512) Layer๋ ์ ๊ฑฐํ ํ flattenํ FC(256)๋ง ์ฃผ์๋ค๋ ๊ฒ ํน์ง์ด๋ค.
์๋์ธต์ ๋ชจ๋ LeakyReLU๋ฅผ ์ฌ์ฉํ์๋ค.
In [ ]:
In [ ]:
Colab์์ Epoch 40๋งํผ ํ์ต์ํจ ๊ฒฐ๊ณผ Acc 99.74๋ ๊ฒฐ๊ณผ๊ฐ ๋์๋ค. ๋งค์ฐ ์ข์ ๊ฒฐ๊ณผ๋ผ ์ด ๋ชจ๋ธ๊ณผ ์ฌ๋ฌ ๊ธฐ๋ฒ์ ์ ์ฉํ์ฌ ํ์ดํผ ํ๋ผ๋ฏธํฐ ํ๋์ ์งํํ์๋ค.
4. ํ์ต ๋ฐ ํ์ดํผ ํ๋ผ๋ฏธํฐ ์กฐ์
VGG ๋ชจ๋ธ์ ๋ฐํ์ ๋๊ณ ์ฌ๋ฌ ์ต์ ํ ๊ธฐ๋ฒ์ ์ ์ฉํ์๋ค. Conv๋ ์ด์ด ์ถ๊ฐ, Relu๋ก ๋ฐ๊พธ๊ธฐ, FC Layer ์กฐ์ , Dropout ์กฐ์ ๋ฑ์ ํด๋ณด์๋ค.
Pytorch์์ Transformer ๋ชจ๋ธ๋ ์คํํด๋ณด์์ง๋ง ์ฑ๋ฅ์ด ๋ณ๋ก ์ข์ง ์์๋ค. (0.96)
๊ฒฐ๊ณผ์ ์ผ๋ก SOPCNN์ VGG๋ฅผ ์ ์ ํ ํผํฉํ ๋ชจ๋ธ์ด ๊ฐ์ฅ ์ฑ๋ฅ์ด ์ข์๋ค.
๋ง์ง๋ง์๋ง Dropout: ์ด๋ Drop-rate 0.2 ~ 0.6 ๊น์ง ๋ค์ํ๊ฒ ์ฃผ์์ ๋ 0.25๊ฐ ๊ฐ์ฅ ๊ด์ฐฎ์ ์ฑ๋ฅ์ ๋ณด์๋ค.
Conv2D(512) ํ๋ ์ถ๊ฐ: ๊ธฐ์กด VGG์์ 4๊ฐ๊ฐ ์์ด์ง๋ง ๋ฐ์ดํฐ ํฌ๊ธฐ์ ์ด๋ฏธ์ง ํฌ๊ธฐ๋ฅผ ๊ณ ๋ คํ์ ๋ ํ๋๋ง ์ถ๊ฐํ๋ ๊ฒ์ด ๊ฐ์ฅ ๋์ ์ฑ๋ฅ์ ๋ณด์๋ค.
FC Layer 1024: 256 ~ 2048(sopcnn) ~ 4096(vgg) ๋ชจ๋ ํด๋ณด์์ ๋ 1024๊ฐ ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์๋ค.
Epoch์ ์ถฉ๋ถํ ์ฃผ๊ณ Early Stopping์ผ๋ก ์ต์ ์ ๋ชจ๋ธ์ ์ฐพ๋ ๊ฒ์ด ์ข๋ค.
In [27]:
In [25]:
๊ฒฐ๊ณผ ๋ฐ ๋๋์
์์ง ๋ชจ๋ธ์ด ๊น์ง ์์ ๊ทธ๋ฐ ๊ฒ ๊ฐ์ง๋ง ์ข์ ๋ชจ๋ธ์ ์ฒ์๋ถํฐ loss ๋จ์ด์ง๋ ๊ฒ ๋ค๋ฅด๋ค. ์ข์ ๋ชจ๋ธ์ผ ์๋ก epoch 10 ์์ชฝ์์ ๋น ๋ฅด๊ฒ Val_Acc๊ฐ ์ข๊ฒ ๋์ ์ดํ๋ฅผ ๊ฐ๋ ํด๋ณผ ์ ์์๋ค. ๋ฌผ๋ก epoch์ 2000์ ๋๋ก ๋๊ณ ๊น๊ฒ ํ์ต์ํจ๋ค๋ฉด ์ข๊ฒ ์ง๋ง ํ์ ๋ ์์์์ ๊ทธ๋๋ง ๋์ ๋ชจ๋ธ์ ๊ณจ๋ผ๋ด๊ธฐ ์ํ ์ต์ ์ด ์๋๊น ์ถ๋ค. ์ด ๋ชจ๋ธ์ ๊ฒฝ์ฐ epoch 8์์ 0.99์ val_acc๋ฅผ ๋ณด์ด๊ณ ์ค๊ฐ ์ค๊ฐ 0.998๋ฅผ ์ํํ๊ธฐ๋ ํ์๋ค.
๊ทธ๋ฆฌ๊ณ ์๊ฒ๋ ๊ฒ์ด keras layer์ ๊ธฐ๋ณธ kernel weight initializer๊ฐ xavier๋ผ๋ ๊ฒ์ ์๊ฒ๋์๋ค. ์ข ๋ GPU ์์์ด ํ๋ฝํ๋ค๋ฉด weight initializer๋ ๋ฐ๊ฟ๋ณด๊ณ batch_size๋ ๋ ๋ค์ํ์ํฌ ์ ์์ง ์์๊น๋ ์์ฌ์์ด ๋จ๋๋ค.
๋ฒ์ธ) Auto Keras
Automl๋ก ์๋์ผ๋ก ๋ชจ๋ธ์ ์ง์ฃผ๋ ์๋์์ ๊ณผ์ฐ ๊ทธ ์ฑ๋ฅ์ ์ด๋จ๊น
In [ ]:
In [ ]:
In [ ]:
Trial complete
Trial summary
|-Trial ID: 123c8d89e202f81d1fd46a1f9201f3fe|-Score: 0.03119376050014196|-Best step: 0
Hyperparameters:
|-classification_head_1/dropout_rate: 0.5|-classification_head_1/spatial_reduction_1/reduction_type: flatten|-dense_block_1/dropout_rate: 0|-dense_block_1/num_layers: 1|-dense_block_1/units_0: 128|-dense_block_1/use_batchnorm: False|-image_block_1/augment: False|-image_block_1/block_type: vanilla|-image_block_1/conv_block_1/dropout_rate: 0.25|-image_block_1/conv_block_1/filters_0_0: 32|-image_block_1/conv_block_1/filters_0_1: 64|-image_block_1/conv_block_1/kernel_size: 3|-image_block_1/conv_block_1/max_pooling: True|-image_block_1/conv_block_1/num_blocks: 1|-image_block_1/conv_block_1/num_layers: 2|-image_block_1/conv_block_1/separable: False|-image_block_1/normalize: True|-optimizer: adam
Trial complete
Trial summary
|-Trial ID: 03db11dd05b1734a2cf3413c1ac7e197|-Score: 0.04135792684210588|-Best step: 0
Hyperparameters:
|-classification_head_1/dropout_rate: 0|-dense_block_1/dropout_rate: 0|-dense_block_1/num_layers: 2|-dense_block_1/units_0: 32|-dense_block_1/units_1: 32|-dense_block_1/use_batchnorm: False|-image_block_1/augment: True|-image_block_1/block_type: resnet|-image_block_1/normalize: True|-image_block_1/res_net_block_1/conv3_depth: 4|-image_block_1/res_net_block_1/conv4_depth: 6|-image_block_1/res_net_block_1/pooling: avg|-image_block_1/res_net_block_1/version: v2|-optimizer: adam
Trial complete
Trial summary
|-Trial ID: 2ce4926fd3ec015466417c00c29b3ca4|-Score: 0.029994319529753708|-Best step: 0
Hyperparameters:
|-classification_head_1/dropout_rate: 0.5|-classification_head_1/spatial_reduction_1/reduction_type: flatten|-dense_block_1/dropout_rate: 0|-dense_block_1/num_layers: 1|-dense_block_1/units_0: 128|-dense_block_1/use_batchnorm: False|-image_block_1/augment: False|-image_block_1/block_type: vanilla|-image_block_1/conv_block_1/dropout_rate: 0.25|-image_block_1/conv_block_1/filters_0_0: 32|-image_block_1/conv_block_1/filters_0_1: 64|-image_block_1/conv_block_1/kernel_size: 3|-image_block_1/conv_block_1/max_pooling: True|-image_block_1/conv_block_1/num_blocks: 1|-image_block_1/conv_block_1/num_layers: 2|-image_block_1/conv_block_1/separable: False|-image_block_1/normalize: True|-optimizer: adam
์์ฑ๋ ๋ชจ๋ธ Summary ๋ฐ Sumbit
In [ ]:
์ ๊ธฐํ๊ฒ๋ ๊ฝค ๋น์ทํ ๋ชจ๋ธ์ ์งฐ๋ค. ์์ฌ ๋จ์ํ๊ณ params๊ฐ 11๋ง ๋ฐ์ ์๋์ง๋ง ์ฑ๋ฅ์ Public Dashboard ๊ธฐ์ค 0.9911์ด ๋์๋ค.In [ ]:
In [ ]:
Validation ํ์ต
In [ ]:
Validation Set๊น์ง ํ์ต์ํค๋ 0.993 ์ผ๋ก ์ฑ๋ฅ์ด ํฅ์๋์๋ค.
Last updated
Was this helpful?