finetune.py


from SemiSupCon.models.finetuning import FinetuneSemiSupCon
from SemiSupCon.dataloading.datamodules import MixedDataModule
from pytorch_lightning.cli import LightningCLI
from pytorch_lightning.cli import SaveConfigCallback
from pytorch_lightning import LightningModule, Trainer
from pytorch_lightning.loggers import WandbLogger
from pytorch_lightning.callbacks import ModelCheckpoint, EarlyStopping
import yaml
import os


class LoggerSaveConfigCallback(SaveConfigCallback):
    def save_config(self, trainer: Trainer, pl_module: LightningModule, stage: str) -> None:
        if trainer.logger is not None:
            experiment_name = trainer.logger.experiment.name
            # Required for proper reproducibility
            config = self.parser.dump(self.config, skip_none=False)
            with open(self.config_filename, "r") as config_file:
                config = yaml.load(config_file, Loader=yaml.FullLoader)
                trainer.logger.experiment.config.update(config, allow_val_change=True)
                
            if config['model']['checkpoint'] is None:
                previous_experiment_name = 'from_scratch'
            else:
                previous_experiment_name = config['model']['checkpoint'].split('/')[-2]
            if not config['test']:
                new_experiment_name = experiment_name+f'_finetune_{previous_experiment_name}_{config["model"]["task"]}'
            else:
                new_experiment_name = experiment_name + f'_test_{previous_experiment_name}_{config["model"]["task"]}'
                
            if not os.path.exists(os.path.join(self.config['ckpt_path'], new_experiment_name)) and  (not config['test'] or config['resume_id'] is None):
                os.makedirs(os.path.join(self.config['ckpt_path'], new_experiment_name))
                
            with open(os.path.join(os.path.join(self.config['ckpt_path'], new_experiment_name), "config.yaml"), 'w') as outfile:
                yaml.dump(config, outfile, default_flow_style=False)

            
            trainer.logger.experiment.name = new_experiment_name
            
            #add a checkpoint callback that saves the model every epoch
            ## and that saves the best model based on validation loss
            
            
class MyLightningCLI(LightningCLI):
    def add_arguments_to_parser(self, parser):
        parser.link_arguments("model.task", "data.task")
        parser.add_argument("--log", default=False)
        parser.add_argument("--log_model", default=False)
        parser.add_argument("--ckpt_path", default="SemiSupCon-finetuning")
        parser.add_argument("--head_checkpoint", default=None)
        parser.add_argument("--resume_from_checkpoint", default=None)
        parser.add_argument("--resume_id", default=None)
        parser.add_argument('--test', default=False)
        parser.add_argument('--early_stopping_patience', default=5)
        parser.add_argument('--project', default='SemiSupCon-finetuning')

if __name__ == "__main__":
    

    cli = MyLightningCLI(model_class=FinetuneSemiSupCon, datamodule_class=MixedDataModule, seed_everything_default=123,
                         run=False, save_config_callback=LoggerSaveConfigCallback, save_config_kwargs={"overwrite": True})

    cli.instantiate_classes()
    
    # get the name of the model loaded from checkpoint
    if cli.config.model.checkpoint is not None or cli.config.model.checkpoint_head is not None:
        if cli.config.model.checkpoint is not None:
            previous_experiment_name = cli.config.model.checkpoint.split('/')[-2]
        if cli.config.model.checkpoint_head is not None:
            previous_experiment_name = cli.config.model.checkpoint_head.split('/')[-2]
    else:
        if cli.config.test == False:
            previous_experiment_name = 'from_scratch'
        

    if cli.config.log:
        logger = WandbLogger(project=cli.config.project,id = cli.config.resume_id)
        experiment_name = logger.experiment.name+f"_finetune_{previous_experiment_name}_{cli.config['model']['task']}"
        ckpt_path = cli.config.ckpt_path
        if cli.config.test:
            experiment_name = experiment_name.replace('finetune', 'test')
    else:
        logger = None

    cli.trainer.logger = logger

    try:
        if not os.path.exists(os.path.join(ckpt_path, experiment_name)) and not cli.config.test:
            os.makedirs(os.path.join(ckpt_path, experiment_name))
    except:
        pass
    
    if logger is not None:
        recent_callback = ModelCheckpoint(
                    dirpath=os.path.join(cli.config.ckpt_path, experiment_name),
                    filename='checkpoint-{step}',  # This means all checkpoints are saved, not just the top k
                    every_n_epochs=200  # Replace with your desired value
                )
                
        best_callback = ModelCheckpoint(
            monitor='train_loss_epoch',
            dirpath=os.path.join(cli.config.ckpt_path, experiment_name),
            filename='best-{step}',
            save_top_k=1,
            mode='min',
            every_n_epochs=1
        )
        
        best_val_callback = ModelCheckpoint(
            monitor='val_loss',
            dirpath=os.path.join(cli.config.ckpt_path, experiment_name),
            filename='best-val-{step}',
            save_top_k=1,
            mode='min',
            every_n_epochs=1
        )
        
        early_stopping_callback = EarlyStopping(
            monitor='val_loss',
            patience=cli.config.early_stopping_patience,
            mode='min'
        )
        
        cli.trainer.callbacks = cli.trainer.callbacks[:-1]+[recent_callback, best_callback, best_val_callback, early_stopping_callback]
    
    # passing class names and idx2class to the model for metrics logging
    idx2class = cli.datamodule.idx2class
    class_names = cli.datamodule.class_names
    
    cli.model.set_idx2class(idx2class)
    cli.model.set_class_names(class_names)
    
    if not cli.config.test:    
        cli.trainer.fit(model=cli.model, datamodule=cli.datamodule)
        if logger is not None:
            cli.model.load_head_weights_from_checkpoint(best_val_callback.best_model_path)
            
        
    cli.trainer.test(model=cli.model, datamodule=cli.datamodule)