notebook.community

Edit and run



In [1]:

    
import apex



In [2]:

    
import torch
from torch import nn 
from torch.utils import data
import os
import torchvision
from torchvision import datasets, transforms, models
import torchvision.transforms.functional as tf
from PIL import Image
import numpy as np
import random
import matplotlib.pyplot as plt 
from tensorboardX import SummaryWriter
from tqdm import tqdm 
device = torch.device(1)
%matplotlib

torch.manual_seed(0)
torch.backends.cudnn.deterministic = True









    



Using matplotlib backend: TkAgg



In [3]:

    
class Dataset(data.Dataset):
    def __init__(self, list_images, labels, folder_name ="./"):
        self.list_images = list_images
        self.labels = labels
        self.folder_name = folder_name
        
    def __len__(self):
        return len (self.list_images)
    
    def __load_images__(self, image_file_name ):
        img = Image.open(os.path.join(self.folder_name,image_file_name)).resize((224, 224), resample=0)
        img = torch.Tensor((np.asarray(img).transpose(2,0,1))/255.0)
        return img
    
    def __getitem__(self, index):
        file_batch = self.__load_images__(self.list_images[index])
        label = self.labels[index]
        return file_batch, torch.tensor(label)



In [4]:

    
image_list = os.listdir("data/train/")
labels = []
for i in image_list:
    if i[:3] == 'dog':
        labels.append([1,0])
    else:
        labels.append([0,1])



In [5]:

    
training_set = Dataset(image_list, labels, folder_name="data/train/")



In [6]:

    
training_generator = data.DataLoader(training_set, batch_size=64, shuffle=True, num_workers=6)



In [7]:

    
for fn, label in training_generator:
    print(fn.shape, label.shape)
    break









    



torch.Size([64, 3, 224, 224]) torch.Size([64, 2])



In [8]:

    
fn.shape









    Out[8]:





torch.Size([64, 3, 224, 224])



In [9]:

    
def conv3x3(in_channels, out_channels, stride=1):
    return nn.Conv2d(in_channels, out_channels, kernel_size=3,stride=stride, padding=1, bias=False)



In [10]:

    
class BasicBlock(nn.Module):
    def __init__(self, inplanes, planes, stride=1, downsample=None):
        super(BasicBlock, self).__init__()
        self.conv1 = conv3x3(inplanes, planes, stride)
        self.bn1 = nn.BatchNorm2d(planes)
        self.relu = nn.ReLU(inplace=True)
        self.conv2 = conv3x3(planes, planes)
        self.bn2 = nn.BatchNorm2d(planes)
        self.downsample = downsample
        self.stride = stride
    def forward(self, x):
        residual = x

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)
        
        out = self.conv2(out)
        out = self.bn2(out)
        
        if self.downsample is not None:
            residual = self.downsample(x)
            
        out += residual
        out = self.relu(out)
        
        return out



In [11]:

    
class ResNet(nn.Module):

    def __init__(self, BasicBlock, layers, num_classes=2):
        self.inplanes = 64
        super(ResNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3,
                               bias=False)
        self.bn1 = nn.BatchNorm2d(64)
        self.relu = nn.ReLU(inplace=True)
        self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
        
        self.layer1 = self._make_layer(BasicBlock, 64, layers[0])
        self.layer2 = self._make_layer(BasicBlock, 128, layers[1], stride=2)
        self.layer3 = self._make_layer(BasicBlock, 256, layers[2], stride=2)
        self.layer4 = self._make_layer(BasicBlock, 512, layers[3], stride=2)
        self.avgpool = nn.AvgPool2d(7, stride=1)
        self.fc = nn.Linear(512 , num_classes)
        self.tanh = nn.Tanh()
        
    def _make_layer(self, BasicBlock, planes, num_blocks, stride=1):
        downsample = None
        if stride != 1 or self.inplanes != planes:
            downsample = nn.Sequential(nn.Conv2d(self.inplanes, planes,kernel_size=1, stride=stride, bias=False),
                nn.BatchNorm2d(planes))
        layers = []
        layers.append(BasicBlock(self.inplanes, planes, stride, downsample))
        self.inplanes = planes
        for i in range(1, num_blocks):
            layers.append(BasicBlock(self.inplanes, planes))

        return nn.Sequential(*layers)
    def forward(self, x):
        x = self.conv1(x)    # 224x224
        x = self.bn1(x)     
        x = self.relu(x)
        x = self.maxpool(x)  # 112x112

        x = self.layer1(x)   # 56x56
        x = self.layer2(x)   # 28x28
        x = self.layer3(x)   # 14x14
        x = self.layer4(x)   # 7x7

        x = self.avgpool(x)  # 1x1
        x = x.view(x.size(0), -1)
        x = self.tanh (self.fc(x))

        return x



In [12]:

    
def resnet34(**kwargs):
    model = ResNet(BasicBlock, [3, 4, 6, 3], **kwargs)
    return model



In [13]:

    
model = resnet34().to(device)



In [14]:

    
def get_binary_accuracy(predicted , gold ):
    predicted_argmax = torch.argmax(input=predicted, dim=1)
    gold_argmax = torch.argmax(input=gold, dim=1)
    correct = (predicted_argmax == gold_argmax)
    accuracy = float(sum(correct))/ len(gold_argmax)
    return accuracy



In [15]:

    
criteria = torch.nn.BCEWithLogitsLoss().to(device)
optimizer = torch.optim.SGD(model.parameters(),lr=0.0001,momentum=0.99)
model, optimizer = apex.amp.initialize(models=model, optimizers=optimizer, opt_level='O2')









    



Selected optimization level O2:  FP16 training with FP32 batchnorm and FP32 master weights.

Defaults for this optimization level are:
enabled                : True
opt_level              : O2
cast_model_type        : torch.float16
patch_torch_functions  : False
keep_batchnorm_fp32    : True
master_weights         : True
loss_scale             : dynamic
Processing user overrides (additional kwargs that are not None)...
After processing overrides, optimization options are:
enabled                : True
opt_level              : O2
cast_model_type        : torch.float16
patch_torch_functions  : False
keep_batchnorm_fp32    : True
master_weights         : True
loss_scale             : dynamic



In [16]:

    
writer = SummaryWriter()
total_updates= 0 
for epoch_no in tqdm(range(50)):
    for fn, label in training_generator:
        optimizer.zero_grad()
        predict = model(fn.to(device))
        loss = criteria(predict.cpu(), label.type(torch.FloatTensor))
        with apex.amp.scale_loss(loss=loss, optimizers=optimizer) as scale_loss:
            scale_loss.backward()
        optimizer.step()
        accuracy = get_binary_accuracy(predict, label)
        writer.add_scalar('Train/loss_1_GPU_apex', loss,total_updates )
        writer.add_scalar('Train/accuracy_1_GPU_apex', accuracy,total_updates )
        total_updates = total_updates + 1









    



  0%|          | 0/50 [00:00<?, ?it/s]






    



---------------------------------------------------------------------------
RuntimeError                              Traceback (most recent call last)
<ipython-input-16-b20f69ad8f15> in <module>()
      7         loss = criteria(predict.cpu(), label.type(torch.FloatTensor))
      8         with apex.amp.scale_loss(loss=loss, optimizers=optimizer) as scale_loss:
----> 9             scale_loss.backward()
     10         optimizer.step()
     11         accuracy = get_binary_accuracy(predict, label)

/data/sunil.patel/anaconda3/lib/python3.6/contextlib.py in __exit__(self, type, value, traceback)
     86         if type is None:
     87             try:
---> 88                 next(self.gen)
     89             except StopIteration:
     90                 return False

/data/sunil.patel/anaconda3/lib/python3.6/site-packages/apex/amp/handle.py in scale_loss(loss, optimizers, loss_id, model, delay_unscale, delay_overflow_check)
    129             # For future fused optimizers that enable sync-free dynamic loss scaling,
    130             # should_skip will always be False.
--> 131             should_skip = False if delay_overflow_check else loss_scaler.update_scale()
    132             if should_skip:
    133                 for optimizer in optimizers:

/data/sunil.patel/anaconda3/lib/python3.6/site-packages/apex/amp/scaler.py in update_scale(self)
    191         # If the fused kernel is available, we only need one D2H memcopy and sync.
    192         if LossScaler.has_fused_kernel and self.dynamic and not self._has_overflow:
--> 193             self._has_overflow = self._overflow_buf.item()
    194 
    195         if self._has_overflow and self.dynamic:

RuntimeError: CUDA error: an illegal memory access was encountered



In [ ]:

    
for each_layer in resnet.state_dict():
    print(each_layer,"\t", resnet.state_dict()[each_layer].shape)



In [ ]:



In [ ]: