gen_single.py

import sys
import os

import torch
import torch.utils.data
import torchvision
from PIL import Image
import torchvision.transforms as transforms
from torch.utils.data import Dataset, DataLoader, Sampler
from torchvision import datasets


from model.sunet import UNet 
from model.ddpm import *   
from dataset.single import MyDataSet 
from dataset.single import SubsetSampler

import torch, gc

import matplotlib.pyplot as plt
import math

import argparse
import random


class Configs: 
    
    def __init__(
        self, 
        image_size = 128, 
        image_channel = 3,
        n_channels = 64, # The number of output channels of the first convolution
        ch_mults = (1, 2, 4), 
        is_atten = (False, False, False), 
        n_steps = 1000, 
        batch_size = 32,
        n_samples = 16,
        learning_rate = 2e-5 ,
        epochs = 10, 
        n_blocks = 1, 
        root = './data/single/', 
        img = 'geese.png', 
        load = True, 
        net_name = 'geese.pth'
        ): 
        
        self.image_size = image_size
        self.image_channel = image_channel
        self.n_channels = n_channels 
        self.ch_mults = ch_mults 
        self.is_atten = is_atten 
        self.n_steps = n_steps 
        self.batch_size = batch_size  
        self.n_samples = n_samples 
        self.lr = learning_rate 
        self.epochs = epochs 
        self.n_blocks = n_blocks
       
        
        self.device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
        
        transform = transforms.Compose([
            transforms.Resize((128, 128)),
            transforms.ToTensor()
        ])

        self.dataset = MyDataSet(root=root, filename=img, transform=transform)

        # Specifies the amount of data fetched in each epoch
        samples_per_epoch = 8192

        # Create a custom sampler
        indices = torch.randperm(len(self.dataset))[:samples_per_epoch]
        sampler = SubsetSampler(indices)
        self.dataloader = DataLoader(dataset=self.dataset, batch_size=self.batch_size, sampler=sampler)

        
        self.NetWork = UNet(
            image_size= 128,
            image_channels = self.image_channel,
            n_channels = self.n_channels,
            n_blocks = self.n_blocks,
            ch_mults = self.ch_mults,
            is_atten = self.is_atten
        )
        
        self.net_name = net_name
        
        if load is True: 
            print('[INFO] load the pre-trained network: ', net_name)
            self.NetWork.load_state_dict(torch.load(net_name))
        else: 
            print('[INFO] train a new network: ', net_name)
       
        
        self.ddpm = DDPM(
            network = self.NetWork,
            steps = self.n_steps,
            device = self.device, 
        )
        
        
        self.opt = torch.optim.Adam(self.NetWork.parameters(), lr=self.lr)
        

    def show_images(self,images, title="show images"): 
        if type(images) is torch.Tensor:
            images = images.detach().cpu().numpy()
        
        fig = plt.figure(figsize=(16, 16))
        img_num = len(images)
        rows = int(math.sqrt(img_num))
        cols = round(img_num / rows)
        
        rows = 4
        cols = 4

        index = 0
        
        for i in range(rows):
            for j in range(cols):
                fig.add_subplot(rows,cols,index+1)
                
                if index < img_num:
                    plt.imshow(images[index])
                    index += 1
                    
        fig.suptitle(title,fontsize=30)
        plt.savefig(f"{title}.png")
        
        plt.show()
        
    def show_x0(self): 
        for batch in self.dataloader: 
            
            batch = batch.permute(0, 2, 3, 1) 
            self.show_images(batch, "x0")
            
            print(batch[0].shape)
            break
    
    def show_generate(self, title="Gen"): 
        
        with torch.no_grad(): 
            x = torch.randn([self.n_samples, self.image_channel, self.image_size, self.image_size],device=self.device)
        
            for t_ in range(self.n_steps):
                t = self.n_steps - t_ - 1 
                x = self.ddpm.p_sample(x, x.new_full((self.n_samples,), t, dtype=torch.long))        
            x = x.permute(0, 2, 3, 1) 
            self.show_images(x, title)
    def show_step(self, title="Step"): 
       
        with torch.no_grad(): 
            x = torch.randn([1, self.image_channel, self.image_size, self.image_size],device=self.device)
            
            
            gen_steps = [] 
            
            for t_ in range(self.n_steps): 
                t = self.n_steps - t_ - 1 
                x = self.ddpm.p_sample(x, x.new_full((1,), t, dtype=torch.long))
                if t_%100 == 0 or (t_>700 and t_%40 ==0 ) or (t_>900 and t_%20 ==0 ) or t_==990: # steps 设置为1000 
                    gen_steps.append(x.permute(0, 2, 3, 1).clone().detach().cpu()) 
                
                    
            gen_steps.append(x.permute(0, 2, 3, 1).clone().detach().cpu().numpy())
        
        fig = plt.figure(figsize=(32, 8))
        img_num = len(gen_steps)
    
        rows = 2
        cols = img_num // 2

        index = 0
        
        for i in range(rows):
            for j in range(cols):
                fig.add_subplot(rows,cols,index+1)
                
                if index < img_num:
                    plt.imshow(gen_steps[index][0])
                    index += 1
                    
        plt.savefig(f"{title}.png")
        
        plt.show()


def parse_args():
    """
    Parse input arguments
    """
    parser = argparse.ArgumentParser() 
    parser.add_argument('--b', type=int, default=32, help='input batch size')
    parser.add_argument('--image_size', type=int, default=32, help='the size of generate images') 
    parser.add_argument('--channel', type=int, default=3, help='the channel of images')
    parser.add_argument('--ch_mults', nargs=3, help='args for unet: ch_mults, for single unet the number is 3' )
    parser.add_argument('--n', type=int, default=1, help='number of down/up block for unet')
    parser.add_argument('--step', type=int, default=1000, help='the steps of adding noise/denoise') 
    parser.add_argument('--lr', type=float, default=2e-5, help='learning rate')
    parser.add_argument('--epoch', type=int, default=32, help='epoches to train')
    parser.add_argument('--dataset', type=str, required=True, help='dataset path')
    parser.add_argument('--img_name', type=str, required=True, help='choose the single image to train')
    parser.add_argument('--load', action="store_true", help='load the pre-trained model or not')
    parser.add_argument('--model_name', type=str, help='the name for trained/pre-trained network')
    parser.add_argument('--gen_name', type=str, help='the generate image name')
    
    
    args = parser.parse_args() 
    args.seed = random.randint(1, 100)  # set random seed for add noise
    
    torch.manual_seed(args.seed)

    if torch.cuda.is_available():
        torch.cuda.manual_seed(args.seed)

    return args
   
def main(): 
    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    print('[INFO] device selected: ', device)
    # get arguments
    args = parse_args() 
    print(args.dataset)
    
    print('[INFO] set configs for training')
    configs = Configs(image_size = args.image_size,
                      image_channel = args.channel, 
                      ch_mults = (1, 2, 4), 
                      epochs = args.epoch,
                      batch_size = args.b, 
                      is_atten = (False, False, False), 
                      root = args.dataset, 
                      img = args.img_name, 
                      load=args.load, 
                      net_name=args.model_name
                     )
    print('[INFO] generate img trained by single image')
    configs.show_generate('single1')
    
    print('[INFO] show steps to generate an image')
    configs.show_step('single2')
    
    print('[INFO] show steps to generate another image')
    configs.show_step('single2')
    
    
if __name__ == '__main__':
    device = 'cuda'
    gc.collect()
    torch.cuda.empty_cache()
    main()