Advanced deep-learning best practices
def q(x):
return x ** 2
def p(x, func):
print('O quadrado de', x, 'é', func(x))
p(2, q)
O quadrado de 2 é 4
import time
def fit(lr):
print('Inicio', lr)
print('Fim', lr)
lr = 3
lr = 5
Inicio 3 Fim 3 Inicio 5 Fim 5
def fit(func):
model = {
'lr': 100,
'epoch': 0
print('Estado Inicial', model)
for i in range(10):
lr = func(model)
model['epoch'] = model['epoch'] + 1
def dynamic_lr(m):
m['lr'] = m['lr'] / 2.
Estado Inicial {'lr': 100, 'epoch': 0} {'lr': 10.0, 'epoch': 1} {'lr': 1.0, 'epoch': 2} {'lr': 0.1, 'epoch': 3} {'lr': 0.01, 'epoch': 4} {'lr': 0.001, 'epoch': 5} {'lr': 0.0001, 'epoch': 6} {'lr': 1e-05, 'epoch': 7} {'lr': 1.0000000000000002e-06, 'epoch': 8} {'lr': 1.0000000000000002e-07, 'epoch': 9} {'lr': 1.0000000000000002e-08, 'epoch': 10}
Estrutura de dados que associa um conjunto de funções a um estado.
class Bolo:
def __init__(self):
self.ingrediente = []
self.cobertura = ''
self.assado = False
self.restante = 1
def assar(self):
self.assado = True
print('Bolo Assado')
def colocar_cobertura(self, cobertura):
self.cobertura = cobertura
def comer(self):
if (self.restante >= .5):
self.restante = self.restante - .5
print('O bolo Acabou!!')
bolo1 = Bolo()
bolo1.cobertura = 'chocolate'
bolo1.ingredientes = ['farinha', 'ovo']
bolo2 = Bolo()
Hmmmm.. 0.5 Hmmmm.. Hmmmm.. 0.0
Uma forma de incorporar métodos e atributos de uma classe para outras classes. Garante a padronização do código.
class Animal:
def __init__(self, pes, voa):
self.pes = pes
self.voa = voa
def comer(self):
def beber(self):
class Cachorro(Animal):
def __init__(self):
super(Cachorro, self).__init__(4, False)
def comer(self):
def latir(self):
print('Au Au')
c = Cachorro()
Ração Bebendo...
Quando se trabalha com um grande conjunto de dados e uma rede neural complexa treinando por um número alto de épocas, esperar o término da execução dos métodos compile e fit (principalmente) torna-se improdutivo, pelo alto investimento de tempo.
Os callbacks ajudam a ter maior controle sobre o fluxo do programa.
%tensorflow_version 1.x
import random
import tensorflow as tf
import numpy as np
from keras import backend as K
import os
from keras import layers
from keras import models
from keras.datasets import mnist
from keras.utils import to_categorical
from keras import callbacks
import matplotlib.pyplot as plt
!pip3 install git+
import fitsbook as fb
TensorFlow 1.x selected.
Using TensorFlow backend.
dense_model = models.Sequential()
dense_model.add(layers.Dense(512, activation='relu', input_shape=(28 * 28,)))
dense_model.add(layers.Dense(10, activation='softmax'))
Model: "sequential_1" _________________________________________________________________ Layer (type) Output Shape Param # ================================================================= dense_1 (Dense) (None, 512) 401920 _________________________________________________________________ dense_2 (Dense) (None, 10) 5130 ================================================================= Total params: 407,050 Trainable params: 407,050 Non-trainable params: 0 _________________________________________________________________
(dense_train_img, dense_train_lbl), (dense_test_img, dense_test_lbl) = mnist.load_data()
dense_train_img = dense_train_img.reshape((60000, 28 * 28))
dense_train_img = dense_train_img.astype('float32') / 255
dense_test_img = dense_test_img.reshape((10000, 28 * 28))
dense_test_img = dense_test_img.astype('float32') / 255
dense_train_lbl = to_categorical(dense_train_lbl)
dense_test_lbl = to_categorical(dense_test_lbl)
dense_history =,
validation_data=(dense_test_img, dense_test_lbl))
Train on 60000 samples, validate on 10000 samples
Epoch 1/10
60000/60000 [==============================] - 6s 94us/step - loss: 0.2598 - acc: 0.9253 - val_loss: 0.1285 - val_acc: 0.9610
Epoch 2/10
60000/60000 [==============================] - 5s 90us/step - loss: 0.1074 - acc: 0.9684 - val_loss: 0.1120 - val_acc: 0.9646
Epoch 3/10
60000/60000 [==============================] - 5s 88us/step - loss: 0.0717 - acc: 0.9786 - val_loss: 0.0883 - val_acc: 0.9726
Epoch 4/10
60000/60000 [==============================] - 5s 88us/step - loss: 0.0528 - acc: 0.9846 - val_loss: 0.0699 - val_acc: 0.9787
Epoch 5/10
60000/60000 [==============================] - 5s 87us/step - loss: 0.0394 - acc: 0.9879 - val_loss: 0.0661 - val_acc: 0.9800
Epoch 6/10
60000/60000 [==============================] - 5s 90us/step - loss: 0.0312 - acc: 0.9909 - val_loss: 0.0657 - val_acc: 0.9806
Epoch 7/10
60000/60000 [==============================] - 5s 91us/step - loss: 0.0231 - acc: 0.9934 - val_loss: 0.0615 - val_acc: 0.9815
Epoch 8/10
60000/60000 [==============================] - 5s 87us/step - loss: 0.0187 - acc: 0.9940 - val_loss: 0.0635 - val_acc: 0.9826
Epoch 9/10
60000/60000 [==============================] - 5s 85us/step - loss: 0.0146 - acc: 0.9956 - val_loss: 0.0775 - val_acc: 0.9792
Epoch 10/10
60000/60000 [==============================] - 5s 86us/step - loss: 0.0114 - acc: 0.9966 - val_loss: 0.0703 - val_acc: 0.9825
def plot_figure(history):
epochs = history.epoch
plt.figure(figsize=(10, 6))
plt.plot(epochs, history.history['acc'], linestyle='--', color='blue', label='Train Acc')
plt.plot(epochs, history.history['val_acc'], color='blue', label='Validation Acc')
plt.plot(epochs, history.history['loss'], linestyle='--', color='green', label='Train Loss')
plt.plot(epochs, history.history['val_loss'], color='green', label='Validation Loss')
plt.title('Dense Layers Metrics', fontsize=17)
plt.ylabel('Metrics', fontsize=13)
plt.xlabel('Epoch', fontsize=13)
Normalizar seus dados de entrada para um intervalo e centrar os dados em zero.
Se as localizações da imagem estão correlacionadas, mas os canais puderem ser interpretados idependentemente, faz sentido separar as camadas de convolução por canal e juntá-las depois.
Quando se desenvolve uma projeta uma rede neural, muitas decisões arbitrárias são tomadas. Quantas camadas empilhar? Quantas unidades ou filtros devem ir em cada camada? Devo usar relu
ou outra função de ativação? Quanto dropout devo usar?
Na prática, uma boa intuição de otimização de hiperparâmetros é construída através de várias experiências no decorrer do tempo. As decisões iniciais serão sempre subotimizadas até que se desenvolva uma boa intuição de como ajustar os hiperparâmetros.
As ferramentas abaixo otimizam os hiperparâmetros automaticamente
Compor a predição final usando predições parciais de vários modelos.
preds_a = model_a.predict(x_val)
preds_b = model_b.predict(x_val)
preds_c = model_c.predict(x_val)
preds_d = model_d.predict(x_val)
final_preds = 0.5 * preds_a + 0.25 * preds_b + 0.1 * preds_c + 0.15 * preds_d