mergeBatchTests.py

import os
import glob
import pickle
import random
import numpy as np
import pandas as pd
from tqdm import tqdm
from pprint import pprint
from shutil import copyfile

ACCEPTABLE_POINT_RECOURSE = {'m0_true', 'm1_alin', 'm1_akrr'}
ACCEPTABLE_DISTR_RECOURSE = {'m1_gaus', 'm1_cvae', 'm2_true', 'm2_gaus', 'm2_cvae'} #, 'm2_cvae_ps'}

from debug import ipsh

SCM_CLASS_VALUES = ['sanity-3-lin', 'sanity-3-anm', 'sanity-3-gen']
LAMBDA_LCB_VALUES = [2.]
OPTIMIZATION_APPROACHES = ['brute_force', 'grad_descent']
CLASSIFIER_VALUES = ['lr']

from random import seed
RANDOM_SEED = 54321
seed(RANDOM_SEED) # set the random seed so that the random permutations can be reproduced again
np.random.seed(RANDOM_SEED)


# experiments_folder_path = '/Users/a6karimi/dev/recourse/_experiments/'
experiments_folder_path = '/Volumes/amir/dev/recourse/_experiments/'
# experiments_folder_path = '/Volumes/amir/dev/recourse/_experiments_bu_2020.06.09.23.00_post_9999533_final/'
all_counter = len(SCM_CLASS_VALUES) * len(LAMBDA_LCB_VALUES) * len(OPTIMIZATION_APPROACHES) * len(CLASSIFIER_VALUES)
counter = 0

def filterResults(per_instance_results):
  # IMPORTANT: keep a factual instance, IF AND ONLY IF, a non-empty
  # action set was found for this instance given all 8 recourse types
  old_keys = per_instance_results.keys()
  print()
  print(f'[INFO] starting with {len(per_instance_results.keys())} factual instances; filtering to those with action set for all recourse types...')
  per_instance_results = {
    k:v for k,v in per_instance_results.items()
    if np.all([
      v[recourse_type]['optimal_action_set'] != dict() # emtpy dict == no action set found
      for recourse_type in recourse_types
    ])
  }
  # random_keys = random.sample(per_instance_results.keys(), 50)
  # # random sub dict to align 50 instances
  # per_instance_results = dict(zip(
  #   random_keys,
  #   [per_instance_results[key] for key in random_keys],
  # ))
  print(f'[INFO] done. We now have {len(per_instance_results.keys())} factual instances to compute the table for.')
  new_keys = per_instance_results.keys()
  print(f'[INFO] dropped {np.setdiff1d(list(old_keys), list(new_keys))}')
  return per_instance_results

def createAndSaveMetricsTable(per_instance_results, recourse_types, experiment_folder_name):
  # Table
  metrics_summary = {}
  metrics = ['scf_validity', 'ic_m2_true', 'ic_rec_type', 'cost_all', 'cost_valid', 'runtime', 'default_to_MO']

  for metric in metrics:
    metrics_summary[metric] = []
  # metrics_summary = dict.fromkeys(metrics, []) # BROKEN: all lists will be shared; causing massive headache!!!

  per_instance_results = filterResults(per_instance_results)

  for recourse_type in recourse_types:
    for metric in metrics:
      metrics_summary[metric].append(
        f'{np.around(np.nanmean([v[recourse_type][metric] for k,v in per_instance_results.items()]), 4):.4f}' + \
        '+/-' + \
        f'{np.around(np.nanstd([v[recourse_type][metric] for k,v in per_instance_results.items()]), 4):.4f}'
      )

  additional_metrics = ['', 'x1', 'x2', 'x3', 'x1_x2', 'x1_x3', 'x2_x3', 'x1_x2_x3', 'matching_true_oracle', 'matching_cate_oracle']
  for metric in additional_metrics:
    metrics_summary[metric] = []
  # metrics_summary = dict.fromkeys(additional_metrics, []) # BROKEN: all lists will be shared; causing massive headache!!!

  for recourse_type in recourse_types:

    for metric in additional_metrics:
      metrics_summary[metric].append(0)

    for k,v in per_instance_results.items():

      true_orcale_intervened_variables = '_'.join(sorted(
        v['m0_true']['optimal_action_set'].keys()
      ))

      cate_orcale_intervened_variables = '_'.join(sorted(
        v['m2_true']['optimal_action_set'].keys()
      ))

      recourse_type_intervened_variables = '_'.join(sorted(
        v[recourse_type]['optimal_action_set'].keys()
      ))

      metrics_summary[recourse_type_intervened_variables][-1] += 1

      if true_orcale_intervened_variables == recourse_type_intervened_variables:
        metrics_summary['matching_true_oracle'][-1] += 1

      if cate_orcale_intervened_variables == recourse_type_intervened_variables:
        metrics_summary['matching_cate_oracle'][-1] += 1

  tmp_df = pd.DataFrame(metrics_summary, recourse_types)
  print(tmp_df)
  print(f'\nN = {len(per_instance_results.keys())}')
  tmp_df.to_csv(f'{experiment_folder_name}/_comparison.txt', sep='\t')
  with open(f'{experiment_folder_name}/_comparison.txt', 'a') as out_file:
    out_file.write(f'\nN = {len(per_instance_results.keys())}')
  tmp_df.to_pickle(f'{experiment_folder_name}/_comparison')


for scm_class in SCM_CLASS_VALUES:

  for classifier_class in CLASSIFIER_VALUES:

    for lambda_lcb in LAMBDA_LCB_VALUES:

      for optimization_approach in OPTIMIZATION_APPROACHES:

        counter = counter + 1

        specific_experiment_path = f'{scm_class}__*__{classifier_class}__*__lambda_lcb_{lambda_lcb}__opt_{optimization_approach}'

        print(f'\n[{counter} / {all_counter}] Merging together folders for {specific_experiment_path}')

        all_batch_folders = glob.glob(f'{experiments_folder_path}*{specific_experiment_path}*')
        all_batch_folders = [elem for elem in all_batch_folders if 'batch' in elem and 'count' in elem]
        sorted_all_batch_folders = sorted(all_batch_folders, key = lambda x : x.split('__')[-3]) # sort based on batch_#
        total_per_instance_results = {}
        folders_not_found = []
        for batch_folder in tqdm(sorted_all_batch_folders):
          batch_number_string = batch_folder.split('__')[-3]
          batch_per_instance_results_path = os.path.join(batch_folder, '_per_instance_results')
          try:
            assert os.path.isfile(batch_per_instance_results_path)
            batch_per_instance_results = pickle.load(open(batch_per_instance_results_path, 'rb'))
            total_per_instance_results = {**total_per_instance_results, **batch_per_instance_results}
          except:
            folders_not_found.append(batch_number_string)

        if len(folders_not_found):
          print(f'[INFO] Cannot find {len(folders_not_found)} / {len(sorted_all_batch_folders)} _per_instance_results file; for {folders_not_found}')

        # create new folder
        random_batch_folder = sorted_all_batch_folders[0]
        new_folder_name = '__'.join(random_batch_folder.split('/')[-1].split('__')[:-3])
        # new_folder_path = os.path.join(experiments_folder_path, '__merged_MACE_eps_1e-5', new_folder_name)
        new_folder_path = os.path.join(experiments_folder_path, '__merged', new_folder_name)

        print(f'[INFO] Creating new merged folder {new_folder_path}')
        os.makedirs(new_folder_path, exist_ok = False)
        files_to_copy = {'_args.txt', '_causal_graph.pdf', 'log_training.txt'}
        for file_name in files_to_copy:
          copyfile(
            os.path.join(random_batch_folder, file_name),
            os.path.join(new_folder_path, file_name)
          )

        pickle.dump(total_per_instance_results, open(f'{new_folder_path}/_total_per_instance_results', 'wb'))
        pprint(total_per_instance_results, open(f'{new_folder_path}/total_per_instance_results.txt', 'w'))

        random_key = list(total_per_instance_results.keys())[0]
        recourse_types = [
          elem for elem in total_per_instance_results[random_key].keys()
          if elem in ACCEPTABLE_POINT_RECOURSE or elem in ACCEPTABLE_DISTR_RECOURSE
        ]
        createAndSaveMetricsTable(total_per_instance_results, recourse_types, new_folder_path)