diff --git a/gamechangerml/scripts/make_training_data.py b/gamechangerml/scripts/make_training_data.py
index 71ea05ae..c1a9b5ee 100644
--- a/gamechangerml/scripts/make_training_data.py
+++ b/gamechangerml/scripts/make_training_data.py
@@ -7,7 +7,11 @@
 import spacy
 
 
-from gamechangerml.configs.config import TrainingConfig, ValidationConfig, SimilarityConfig
+from gamechangerml.configs.config import (
+    TrainingConfig,
+    ValidationConfig,
+    SimilarityConfig,
+)
 from gamechangerml.src.search.sent_transformer.model import SentenceSearcher
 from gamechangerml.src.utilities.text_utils import normalize_query
 from gamechangerml.src.utilities.test_utils import *
@@ -16,38 +20,48 @@
 from gamechangerml.scripts.update_eval_data import make_tiered_eval_data
 from gamechangerml.src.text_handling.corpus import LocalCorpus
 from gensim.utils import simple_preprocess
-from gamechangerml import DATA_PATH
+from gamechangerml import DATA_PATH, CORPUS_PATH
 
 model_path_dict = get_model_paths()
 random.seed(42)
 
 LOCAL_TRANSFORMERS_DIR = model_path_dict["transformers"]
 SIM_MODEL = SimilarityConfig.BASE_MODEL
-training_dir= os.path.join(DATA_PATH, "training", "sent_transformer")
-tts_ratio=TrainingConfig.DATA_ARGS["train_test_split_ratio"]
+training_dir = os.path.join(DATA_PATH, "training", "sent_transformer")
+tts_ratio = TrainingConfig.DATA_ARGS["train_test_split_ratio"]
 gold_standard_path = os.path.join(
-    "gamechangerml/data/user_data", ValidationConfig.DATA_ARGS["retriever_gc"]["gold_standard"]
-    )
+    "gamechangerml/data/user_data",
+    ValidationConfig.DATA_ARGS["retriever_gc"]["gold_standard"],
+)
+
+CORPUS_DIR = CORPUS_PATH
+corpus_docs = [
+    i.split(".json")[0]
+    for i in os.listdir(CORPUS_DIR)
+    if os.path.isfile(os.path.join(CORPUS_DIR, i))
+]
 
-CORPUS_DIR = "gamechangerml/corpus"
-corpus_docs = [i.split('.json')[0] for i in os.listdir(CORPUS_DIR) if os.path.isfile(os.path.join(CORPUS_DIR, i))]
 
 def get_sample_paragraphs(pars, par_limit=100, min_length=150):
-    '''Collect sample paragraphs longer than min_length (char), up to par_limit paragraphs'''
-    
+    """Collect sample paragraphs longer than min_length (char), up to par_limit paragraphs"""
+
     count = 0
     collected_pars = []
     for i in pars:
         if count < par_limit:
-            if len(i['par_raw_text_t']) >= min_length:
+            if len(i["par_raw_text_t"]) >= min_length:
                 count += 1
-                collected_pars.append({"text": i['par_raw_text_t'], "id": i['id']})
+                collected_pars.append(
+                    {"text": i["par_raw_text_t"], "id": i["id"]})
         else:
             break
-    
+
     return collected_pars
 
-def get_best_paragraphs(query: str, doc_id: str, nlp, n_returns, min_score: float=0.60) -> List[Dict[str,str]]:
+
+def get_best_paragraphs(
+    query: str, doc_id: str, nlp, n_returns, min_score: float = 0.60
+) -> List[Dict[str, str]]:
     """Retrieves the best paragraphs for expected doc using similarity model
     Args:
         data [pd.DataFrame]: data df with processed text at paragraph_id level for sent_index
@@ -57,17 +71,19 @@ def get_best_paragraphs(query: str, doc_id: str, nlp, n_returns, min_score: floa
     Returns:
         [List[Dict[str,str]]]: List of dictionaries of paragraph matches
     """
-    logger.info(f"Retrieving matches for query: {query}, expected doc: {doc_id}")
+    logger.info(
+        f"Retrieving matches for query: {query}, expected doc: {doc_id}")
     pars = []
     doc1 = nlp(query)
     if doc_id not in corpus_docs:
         logger.warning(f"---Did not find {doc_id} in the corpus")
 
-    json = open_json(doc_id + '.json', CORPUS_DIR)
-    paragraphs = json['paragraphs']
-    sents = get_sample_paragraphs(paragraphs)[:n_returns] # get top n_returns
+    json = open_json(doc_id + ".json", CORPUS_DIR)
+    paragraphs = json["paragraphs"]
+    sents = get_sample_paragraphs(paragraphs)[:n_returns]  # get top n_returns
     for sent in sents:
-        processed = ' '.join(simple_preprocess(sent['text'], min_len=2, max_len=100))
+        processed = " ".join(simple_preprocess(
+            sent["text"], min_len=2, max_len=100))
         pars.append({"id": sent["id"], "text": processed})
 
     ranked = []
@@ -75,39 +91,57 @@ def get_best_paragraphs(query: str, doc_id: str, nlp, n_returns, min_score: floa
         if len(pars) == 0:
             logger.info("---No paragraphs retrieved for this expected doc")
         elif len(pars) == 1:
-            ranked = [{"score": 'na', "id": pars[0]['id'], "text": pars[0]['text']}]
+            ranked = [{"score": "na", "id": pars[0]
+                       ["id"], "text": pars[0]["text"]}]
         else:
             comparisons = []
             for par in pars:
-                doc2 = nlp(par['text'])
+                doc2 = nlp(par["text"])
                 sim = doc1.similarity(doc2)
                 if sim >= min_score:
-                    record = {"score": sim, "id": par['id'], "text": par['text']}
+                    record = {"score": sim,
+                              "id": par["id"], "text": par["text"]}
                     comparisons.append(record)
                 else:
                     pass
-            ranked = sorted(comparisons, key = lambda z: z['score'], reverse=True)
-        logger.info(f"*** Collected {str(len(ranked))} / {str(len(pars))} paragraphs (passing sim threshold) retrieved for {doc_id}")
+            ranked = sorted(
+                comparisons, key=lambda z: z["score"], reverse=True)
+        logger.info(
+            f"*** Collected {str(len(ranked))} / {str(len(pars))} paragraphs (passing sim threshold) retrieved for {doc_id}"
+        )
     except Exception as e:
         logger.info(f"---Could not re-rank the paragraphs for {query}")
-        logger.warning(e) 
+        logger.warning(e)
 
     # if no paragraphs are returned, get the title
-    if len(ranked)==0:
-        clean_title = ' '.join(simple_preprocess(json['title'], min_len=2, max_len=100)) 
-        ranked.append({"score": 1, "id": doc_id + ".pdf_0", "text": clean_title})
-    
+    if len(ranked) == 0:
+        clean_title = " ".join(simple_preprocess(
+            json["title"], min_len=2, max_len=100))
+        ranked.append({"score": 1, "id": doc_id +
+                      ".pdf_0", "text": clean_title})
+
     return ranked
 
+
 def check_no_match(id_1: str, id_2: str) -> bool:
     """Checks if paragraph ID matches the expected doc ID"""
-    if id_1.split('.pdf')[0].upper().strip().lstrip() == id_2.split('.pdf')[0].upper().strip().lstrip():
+    if (
+        id_1.split(".pdf")[0].upper().strip().lstrip()
+        == id_2.split(".pdf")[0].upper().strip().lstrip()
+    ):
         return False
     else:
         return True
 
+
 def get_negative_paragraphs(
-    data: pd.DataFrame, query: str, doc_id: str, retriever, n_returns: int, any_matches: Dict[str,str]) -> List[Dict[str,str]]:
+    data: pd.DataFrame,
+    query: str,
+    doc_id: str,
+    retriever,
+    n_returns: int,
+    any_matches: Dict[str, str],
+) -> List[Dict[str, str]]:
     """Looks up negative (not matching) paragraphs for each query
     Args:
         data [pd.DataFrame]: data df with processed text at paragraph_id level for sent_index
@@ -122,28 +156,49 @@ def get_negative_paragraphs(
 
     checked_results = []
     try:
-        single_matching_docs = [i for i in any_matches[query] if check_no_match(i, doc_id)]
+        single_matching_docs = [
+            i for i in any_matches[query] if check_no_match(i, doc_id)
+        ]
     except:
         single_matching_docs = []
     try:
         results = retriever.retrieve_topn(query, n_returns)
-        logger.info(f"Retrieved {str(len(results))} negative samples for query: {query} / doc: {doc_id}")
+        logger.info(
+            f"Retrieved {str(len(results))} negative samples for query: {query} / doc: {doc_id}"
+        )
         for result in results:
-            par = data[data["paragraph_id"]==result['id']].iloc[0]["text"]
-            par = ' '.join(par.split(' ')[:400])
-            if check_no_match(doc_id, result['id']):            
+            par = data[data["paragraph_id"] == result["id"]].iloc[0]["text"]
+            par = " ".join(par.split(" ")[:400])
+            if check_no_match(doc_id, result["id"]):
                 for s in single_matching_docs:
-                    if s and check_no_match(s, result['id']):
-                        checked_results.append({"query": query, "doc": result['id'], "paragraph": par, "label": 0})
+                    if s and check_no_match(s, result["id"]):
+                        checked_results.append(
+                            {
+                                "query": query,
+                                "doc": result["id"],
+                                "paragraph": par,
+                                "label": 0,
+                            }
+                        )
                     else:
-                        checked_results.append({"query": query, "doc": result['id'], "paragraph": par, "label": 0.5}) 
+                        checked_results.append(
+                            {
+                                "query": query,
+                                "doc": result["id"],
+                                "paragraph": par,
+                                "label": 0.5,
+                            }
+                        )
     except Exception as e:
         logger.warning("Could not get negative paragraphs")
         logger.warning(e, exc_info=True)
-    
+
     return checked_results
 
-def add_gold_standard(intel: Dict[str,str], gold_standard_path: Union[str, os.PathLike]) -> Dict[str,str]:
+
+def add_gold_standard(
+    intel: Dict[str, str], gold_standard_path: Union[str, os.PathLike]
+) -> Dict[str, str]:
     """Adds original gold standard data to the intel training data.
     Args:
         intel [Dict[str,str]: intelligent search evaluation data
@@ -151,83 +206,88 @@ def add_gold_standard(intel: Dict[str,str], gold_standard_path: Union[str, os.Pa
     Returns:
         intel [Dict[str,str]: intelligent search evaluation data with manual entries added
     """
-    gold = pd.read_csv(gold_standard_path, names=['query', 'document'])
-    gold['query_clean'] = gold['query'].apply(lambda x: normalize_query(x))
-    gold['docs_split'] = gold['document'].apply(lambda x: x.split(';'))
-    all_docs = list(set([a for b in gold['docs_split'].tolist() for a in b]))
+    gold = pd.read_csv(gold_standard_path, names=["query", "document"])
+    gold["query_clean"] = gold["query"].apply(lambda x: normalize_query(x))
+    gold["docs_split"] = gold["document"].apply(lambda x: x.split(";"))
+    all_docs = list(set([a for b in gold["docs_split"].tolist() for a in b]))
 
-    def add_key(mydict: Dict[str,str]) -> str:
+    def add_key(mydict: Dict[str, str]) -> str:
         """Adds new key to queries/collections dictionaries"""
         last_key = sorted([*mydict.keys()])[-1]
         key_len = len(last_key) - 1
         last_prefix = last_key[0]
         last_num = int(last_key[1:])
         new_num = str(last_num + 1)
-        
-        return last_prefix + str(str(0)*(key_len - len(new_num)) + new_num)
+
+        return last_prefix + str(str(0) * (key_len - len(new_num)) + new_num)
 
     # check if queries already in dict, if not add
-    for i in gold['query_clean']:
-        if i in intel['queries'].values():
+    for i in gold["query_clean"]:
+        if i in intel["queries"].values():
             logger.info(f"'{i}' already in intel queries")
             continue
         else:
             logger.info(f"adding '{i}' to intel queries")
-            new_key = add_key(intel['queries'])
-            intel['queries'][new_key] = i
-    
+            new_key = add_key(intel["queries"])
+            intel["queries"][new_key] = i
+
     # check if docs already in dict, if not add
     for i in all_docs:
-        if i in intel['collection'].values():
+        if i in intel["collection"].values():
             logger.info(f"'{i}' already in intel collection")
             continue
         else:
             logger.info(f"adding '{i}' to intel collection")
-            new_key = add_key(intel['collection'])
-            intel['collection'][new_key] = i
+            new_key = add_key(intel["collection"])
+            intel["collection"][new_key] = i
 
     # check if rels already in intel, if not add
-    reverse_q = {v:k for k,v in intel['queries'].items()}
-    reverse_d = {v:k for k,v in intel['collection'].items()}
+    reverse_q = {v: k for k, v in intel["queries"].items()}
+    reverse_d = {v: k for k, v in intel["collection"].items()}
     for i in gold.index:
-        q = gold.loc[i, 'query_clean']
-        docs = gold.loc[i, 'docs_split']
+        q = gold.loc[i, "query_clean"]
+        docs = gold.loc[i, "docs_split"]
         for j in docs:
             q_id = reverse_q[q]
             d_id = reverse_d[j]
-            if q_id in intel['correct']: # if query in rels, add new docs
-                if d_id in intel['correct'][q_id]:
+            if q_id in intel["correct"]:  # if query in rels, add new docs
+                if d_id in intel["correct"][q_id]:
                     continue
                 else:
-                    intel['correct'][q_id] += [d_id]
+                    intel["correct"][q_id] += [d_id]
             else:
-                intel['correct'][q_id] = [d_id]
-    
+                intel["correct"][q_id] = [d_id]
+
     return intel
 
-def train_test_split(data: Dict[str,str], tts_ratio: float) -> Tuple[Dict[str, str]]:
+
+def train_test_split(data: Dict[str, str], tts_ratio: float) -> Tuple[Dict[str, str]]:
     """Splits a dictionary into train/test set based on split ratio"""
 
-    queries = list(set([data[i]['query'] for i in data]))
+    queries = list(set([data[i]["query"] for i in data]))
 
     # split the data into positive and negative examples grouped by query
     neg_passing = {}
     pos_passing = {}
     for q in queries:
-        subset = {i:data[i] for i in data.keys() if data[i]['query']==q}
-        pos_sample = [i for i in subset.keys() if subset[i]['label']==1]
-        neg_sample = [i for i in subset.keys() if subset[i]['label']==-1]
-        if len(neg_sample)>0: #since we have so few negative samples, add to neg list if it has a negative ex
+        subset = {i: data[i] for i in data.keys() if data[i]["query"] == q}
+        pos_sample = [i for i in subset.keys() if subset[i]["label"] == 1]
+        neg_sample = [i for i in subset.keys() if subset[i]["label"] == -1]
+        if (
+            len(neg_sample) > 0
+        ):  # since we have so few negative samples, add to neg list if it has a negative ex
             neg_passing[q] = subset
-        elif len(pos_sample)>0: # only add the other samples if they have a positive matching sample
+        elif (
+            len(pos_sample) > 0
+        ):  # only add the other samples if they have a positive matching sample
             pos_passing[q] = subset
 
     pos_train_size = round(len(pos_passing.keys()) * tts_ratio)
     neg_train_size = round(len(neg_passing.keys()) * tts_ratio)
 
     pos_train_keys = random.sample(pos_passing.keys(), pos_train_size)
-    neg_train_keys = random.sample(neg_passing.keys(), neg_train_size) 
-    
+    neg_train_keys = random.sample(neg_passing.keys(), neg_train_size)
+
     pos_test_keys = [i for i in pos_passing.keys() if i not in pos_train_keys]
     neg_test_keys = [i for i in neg_passing.keys() if i not in neg_train_keys]
 
@@ -241,9 +301,9 @@ def train_test_split(data: Dict[str,str], tts_ratio: float) -> Tuple[Dict[str, s
         train_keys.extend(neg_passing[x])
     for x in neg_test_keys:
         test_keys.extend(neg_passing[x])
-    
-    train = {i:data[i] for i in train_keys}
-    test = {i:data[i] for i in test_keys}
+
+    train = {i: data[i] for i in train_keys}
+    test = {i: data[i] for i in test_keys}
 
     metadata = {
         "date_created": str(date.today()),
@@ -253,20 +313,21 @@ def train_test_split(data: Dict[str,str], tts_ratio: float) -> Tuple[Dict[str, s
         "total_test_samples_size": len(test),
         "train_queries": pos_train_keys + neg_train_keys,
         "test_queries": pos_test_keys + neg_test_keys,
-        "split_ratio": tts_ratio
+        "split_ratio": tts_ratio,
     }
 
     return train, test, metadata
 
+
 def collect_matches(
-    data: pd.DataFrame, 
+    data: pd.DataFrame,
     nlp,
     n_returns,
     relations: Dict[str, str],
     queries: Dict[str, str],
     collection: Dict[str, str],
     label: int,
-    ) -> Tuple[Dict[str, str]]:
+) -> Tuple[Dict[str, str]]:
     """Gets matching paragraphs for each query/docid pair
     Args:
         data [pd.DataFrame]: data df with processed text at paragraph_id level for sent_index
@@ -287,28 +348,37 @@ def collect_matches(
         query = queries[i]
         for k in relations[i]:
             doc = collection[k]
-            uid = str(i) + '_' + str(k) # backup UID, overwritten if there are results
+            # backup UID, overwritten if there are results
+            uid = str(i) + "_" + str(k)
             try:
                 matching = get_best_paragraphs(query, doc, nlp, n_returns)
                 for match in matching:
-                    uid =  str(i) + '_' + str(match['id'])
-                    text = ' '.join(match['text'].split(' ')[:400]) # truncate to 400 tokens
-                    found[uid] = {"query": query, "doc": doc, "paragraph": text, "label": label}
+                    uid = str(i) + "_" + str(match["id"])
+                    text = " ".join(
+                        match["text"].split(" ")[:400]
+                    )  # truncate to 400 tokens
+                    found[uid] = {
+                        "query": query,
+                        "doc": doc,
+                        "paragraph": text,
+                        "label": label,
+                    }
             except Exception as e:
                 logger.warning("Could not get positive matches")
                 logger.warning(e)
                 not_found[uid] = {"query": query, "doc": doc, "label": label}
     return found, not_found
 
+
 def collect_negative_samples(
-    data: pd.DataFrame, 
-    retriever, 
+    data: pd.DataFrame,
+    retriever,
     n_returns: int,
     relations: Dict[str, str],
     queries: Dict[str, str],
     collection: Dict[str, str],
     any_matches: Dict[str, str],
-    ) -> Tuple[Dict[str, str]]:
+) -> Tuple[Dict[str, str]]:
     """Gets negative samples each query/docid pair
     Args:
         data [pd.DataFrame]: data df with processed text at paragraph_id level for sent_index
@@ -327,30 +397,49 @@ def collect_negative_samples(
         query = queries[i]
         for k in relations[i]:
             doc = collection[k]
-            uid = str(i) + '_' + str(k) + '_neg' # backup UID, overwritten if there are results
+            uid = (
+                str(i) + "_" + str(k) + "_neg"
+            )  # backup UID, overwritten if there are results
             try:
-                not_matching = get_negative_paragraphs(data=data, query=query, doc_id=k, retriever=retriever, n_returns=n_returns, any_matches=any_matches)
+                not_matching = get_negative_paragraphs(
+                    data=data,
+                    query=query,
+                    doc_id=k,
+                    retriever=retriever,
+                    n_returns=n_returns,
+                    any_matches=any_matches,
+                )
                 for match in not_matching:
-                    uid =  str(i) + '_' + str(match['doc'])
-                    text = ' '.join(match['paragraph'].split(' ')[:400]) # truncate to 400 tokens
-                    found[uid] = {"query": query, "doc": doc, "paragraph": text, "label": 0}
+                    uid = str(i) + "_" + str(match["doc"])
+                    text = " ".join(
+                        match["paragraph"].split(" ")[:400]
+                    )  # truncate to 400 tokens
+                    found[uid] = {
+                        "query": query,
+                        "doc": doc,
+                        "paragraph": text,
+                        "label": 0,
+                    }
             except Exception as e:
                 logger.warning(e)
                 not_found[uid] = {"query": query, "doc": doc, "label": 0}
-                
+
     return found, not_found
 
+
 def get_all_single_matches():
-    validation_dir = get_most_recent_dir(os.path.join(DATA_PATH, "validation", "domain", "sent_transformer"))
+    validation_dir = get_most_recent_dir(
+        os.path.join(DATA_PATH, "validation", "domain", "sent_transformer")
+    )
     directory = os.path.join(validation_dir, "any")
     any_matches = {}
     try:
-        f = open_json('intelligent_search_data.json', directory)
+        f = open_json("intelligent_search_data.json", directory)
         intel = json.loads(f)
-        for x in intel['correct'].keys():
-            query = intel['queries'][x]
-            doc_keys = intel['correct'][x]
-            docs = [intel['collection'][k] for k in doc_keys]
+        for x in intel["correct"].keys():
+            query = intel["queries"][x]
+            doc_keys = intel["correct"][x]
+            docs = [intel["collection"][k] for k in doc_keys]
             any_matches[query] = docs
     except Exception as e:
         logger.warning("Could not load all validation data")
@@ -358,17 +447,19 @@ def get_all_single_matches():
 
     return any_matches
 
+
 def make_training_data(
     index_path: Union[str, os.PathLike],
     n_returns: int,
-    level: str, 
-    update_eval_data: bool, 
+    level: str,
+    update_eval_data: bool,
     retriever=None,
-    sim_model_name: str=SIM_MODEL,
-    transformers_dir: Union[str,os.PathLike]=LOCAL_TRANSFORMERS_DIR,
-    gold_standard_path: Union[str,os.PathLike]=gold_standard_path,
-    tts_ratio: float=tts_ratio,
-    training_dir: Union[str,os.PathLike]=training_dir) -> Tuple[Dict[str,str]]:
+    sim_model_name: str = SIM_MODEL,
+    transformers_dir: Union[str, os.PathLike] = LOCAL_TRANSFORMERS_DIR,
+    gold_standard_path: Union[str, os.PathLike] = gold_standard_path,
+    tts_ratio: float = tts_ratio,
+    training_dir: Union[str, os.PathLike] = training_dir,
+) -> Tuple[Dict[str, str]]:
     """Makes training data based on new user search history data
     Args:
         index_path [str|os.PathLike]: path to the sent index for retrieving the training data (should be most recent index)
@@ -382,28 +473,36 @@ def make_training_data(
         training_dir [Union[str,os.PathLike]]: directory for saving training data
     Returns:
         [Tuple[Dict[str,str]]]: training data and training metadata dictionaries
-    """    
-    ## open json files
-    if not os.path.exists(os.path.join(DATA_PATH, "validation", "domain", "sent_transformer")) or update_eval_data:
+    """
+    # open json files
+    if (
+        not os.path.exists(
+            os.path.join(DATA_PATH, "validation", "domain", "sent_transformer")
+        )
+        or update_eval_data
+    ):
         logger.info("****    Updating the evaluation data")
         make_tiered_eval_data(index_path)
 
-    validation_dir = get_most_recent_dir(os.path.join(DATA_PATH, "validation", "domain", "sent_transformer"))
+    validation_dir = get_most_recent_dir(
+        os.path.join(DATA_PATH, "validation", "domain", "sent_transformer")
+    )
     directory = os.path.join(validation_dir, level)
-    logger.info(f"****    Loading in intelligent search data from {str(directory)}")
+    logger.info(
+        f"****    Loading in intelligent search data from {str(directory)}")
     try:
-        f = open_json('intelligent_search_data.json', directory)
+        f = open_json("intelligent_search_data.json", directory)
         intel = json.loads(f)
     except Exception as e:
         logger.warning("Could not load intelligent search data")
         logger.warning(e)
         intel = {}
 
-    ## add gold standard samples
+    # add gold standard samples
     logger.info("****   Adding gold standard examples")
     intel = add_gold_standard(intel, gold_standard_path)
 
-    ## set up save dir
+    # set up save dir
     save_dir = make_timestamp_directory(training_dir)
 
     try:
@@ -414,69 +513,96 @@ def make_training_data(
     if not retriever:
         logger.info("Did not init SentenceSearcher, loading now")
         retriever = SentenceSearcher(
-            sim_model_name=sim_model_name, 
-            index_path=index_path, 
-            transformer_path=transformers_dir
-            )
-    ## read in sent_index data
+            sim_model_name=sim_model_name,
+            index_path=index_path,
+            transformer_path=transformers_dir,
+        )
+    # read in sent_index data
     logger.info("****   Loading in sent index data from retriever")
     try:
         data = retriever.data
-        data['doc_id'] = data['paragraph_id'].apply(lambda x: x.split('.pdf')[0])
+        data["doc_id"] = data["paragraph_id"].apply(
+            lambda x: x.split(".pdf")[0])
     except Exception as e:
         logger.info("Could not load in data from retriever")
         logger.warning(e)
 
     any_matches = get_all_single_matches()
-    ## get matching paragraphs
+    # get matching paragraphs
     try:
         correct_found, correct_notfound = collect_matches(
-        data=data, queries=intel['queries'], collection=intel['collection'],
-        relations=intel['correct'], label=1, nlp = nlp, n_returns=n_returns)
-        logger.info(f"---Number of correct query/result pairs that were not found: {str(len(correct_notfound))}")
+            data=data,
+            queries=intel["queries"],
+            collection=intel["collection"],
+            relations=intel["correct"],
+            label=1,
+            nlp=nlp,
+            n_returns=n_returns,
+        )
+        logger.info(
+            f"---Number of correct query/result pairs that were not found: {str(len(correct_notfound))}"
+        )
     except Exception as e:
         logger.warning(e)
         logger.warning("\nCould not retrieve positive matches\n")
     try:
         incorrect_found, incorrect_notfound = collect_matches(
-        data=data, queries=intel['queries'], collection=intel['collection'],
-        relations=intel['incorrect'], label=-1, nlp = nlp, n_returns=n_returns)
-        logger.info(f"---Number of incorrect query/result pairs that were not found: {str(len(incorrect_notfound))}")
+            data=data,
+            queries=intel["queries"],
+            collection=intel["collection"],
+            relations=intel["incorrect"],
+            label=-1,
+            nlp=nlp,
+            n_returns=n_returns,
+        )
+        logger.info(
+            f"---Number of incorrect query/result pairs that were not found: {str(len(incorrect_notfound))}"
+        )
     except Exception as e:
         logger.warning(e)
         logger.warning("\nCould not retrieve negative matches\n")
 
-    ## get negative samples
+    # get negative samples
     try:
-        all_relations = {**intel['correct'], **intel['incorrect']}
+        all_relations = {**intel["correct"], **intel["incorrect"]}
         neutral_found, neutral_notfound = collect_negative_samples(
-        data=data, retriever=retriever, n_returns=n_returns, queries=intel['queries'], collection=intel['collection'],
-        relations=all_relations, any_matches=any_matches)
-        logger.info(f"---Number of negative sample pairs that were not found: {str(len(neutral_notfound))}")
+            data=data,
+            retriever=retriever,
+            n_returns=n_returns,
+            queries=intel["queries"],
+            collection=intel["collection"],
+            relations=all_relations,
+            any_matches=any_matches,
+        )
+        logger.info(
+            f"---Number of negative sample pairs that were not found: {str(len(neutral_notfound))}"
+        )
     except Exception as e:
         logger.warning(e)
         logger.warning("\nCould not retrieve negative samples\n")
 
-    ## save a json of the query-doc pairs that did not retrieve an ES paragraph for training data
+    # save a json of the query-doc pairs that did not retrieve an ES paragraph for training data
     notfound = {**correct_notfound, **incorrect_notfound, **neutral_notfound}
-    logger.info(f"---Number of total query/result pairs that were not found: {str(len(notfound))}")
-    notfound_path = os.path.join(save_dir, 'not_found_search_pairs.json')
+    logger.info(
+        f"---Number of total query/result pairs that were not found: {str(len(notfound))}"
+    )
+    notfound_path = os.path.join(save_dir, "not_found_search_pairs.json")
     with open(notfound_path, "w") as outfile:
         json.dump(notfound, outfile)
 
     all_examples = {**neutral_found, **incorrect_found, **correct_found}
     logger.info(f"Total size of query-doc pairs: {str(len(all_examples))}")
 
-    ## train/test split  
+    # train/test split
     train, test, metadata = train_test_split(all_examples, tts_ratio)
 
     data = {"train": train, "test": test}
 
     logger.info(f"**** Generated training data: \n {metadata}")
 
-    ## save data and metadata files
-    data_path = os.path.join(save_dir, 'training_data.json')
-    metadata_path = os.path.join(save_dir, 'training_metadata.json')
+    # save data and metadata files
+    data_path = os.path.join(save_dir, "training_data.json")
+    metadata_path = os.path.join(save_dir, "training_metadata.json")
 
     with open(data_path, "w") as outfile:
         json.dump(data, outfile)
@@ -484,8 +610,12 @@ def make_training_data(
     with open(metadata_path, "w") as outfile:
         json.dump(metadata, outfile)
 
-if __name__ == '__main__':
+
+if __name__ == "__main__":
 
     make_training_data(
-        index_path="gamechangerml/models/sent_index_20220103", n_returns=50, level="silver", 
-        update_eval_data=True)
\ No newline at end of file
+        index_path="gamechangerml/models/sent_index_20220103",
+        n_returns=50,
+        level="silver",
+        update_eval_data=True,
+    )