[fix] Apply black and isort formatting

tamohannes · tamohannes · commit a80dcdc1457e · 2024-07-02T15:26:53.000+02:00
diff --git a/roleplay/VERSION b/roleplay/VERSION
@@ -1 +1 @@
-2.0.0
+2.0.1
diff --git a/roleplay/actions/generate_dialogues.py b/roleplay/actions/generate_dialogues.py
@@ -7,7 +7,6 @@
 from aim import Run, Text
 from omegaconf import DictConfig
 from tqdm import tqdm
-
 from urartu.common.action import Action
 from urartu.common.dataset import Dataset
 
@@ -58,7 +57,9 @@ def main(self):
         model_inquirer.aim_run = self.aim_run
         model_responder.aim_run = self.aim_run
 
-        for idx, sample in tqdm(enumerate(dataset.dataset), total=len(dataset.dataset), desc="samples"):
+        for idx, sample in tqdm(
+            enumerate(dataset.dataset), total=len(dataset.dataset), desc="samples"
+        ):
             for persona, persona_hash in tqdm(personas, desc="personas", leave=False):
                 self.aim_run["personas"][persona_hash] = persona
 
@@ -67,7 +68,10 @@ def main(self):
                 dialog = []
                 raw_dialog = []
 
-                instructions = [instruct.lstrip().rstrip() for instruct in sample[task_cfg.dataset.input_key].split("\n")]
+                instructions = [
+                    instruct.lstrip().rstrip()
+                    for instruct in sample[task_cfg.dataset.input_key].split("\n")
+                ]
 
                 if self.action_cfg.task.model_inquirer.regenerate_tries:
                     regeneratinon_idx = 0
@@ -97,7 +101,9 @@ def main(self):
                         inquirer_output, _ = model_inquirer.generate(
                             prompt=inquirer_prompt,
                             generate_cfg=(
-                                inquirer_generate_cfg if inquirer_generate_cfg else self.action_cfg.task.model_inquirer.generate
+                                inquirer_generate_cfg
+                                if inquirer_generate_cfg
+                                else self.action_cfg.task.model_inquirer.generate
                             ),
                         )
                         if not inquirer_output:
@@ -121,13 +127,20 @@ def main(self):
                         if model_inquirer.stop_dialog(inquirer_output):
                             break
 
-                        inquirer_output_extract, num_prompts = model_inquirer.extract_prompt(prompt=inquirer_output)
+                        inquirer_output_extract, num_prompts = (
+                            model_inquirer.extract_prompt(prompt=inquirer_output)
+                        )
 
                         if self.action_cfg.task.model_inquirer.regenerate_tries:
                             # --------------------- if model_inquirer failed to provide prompt ---------------------
                             if inquirer_output_extract is None:
-                                if regeneratinon_idx < self.action_cfg.task.model_inquirer.regenerate_tries:
-                                    inquirer_generate_cfg = model_inquirer.get_generation_cfg()
+                                if (
+                                    regeneratinon_idx
+                                    < self.action_cfg.task.model_inquirer.regenerate_tries
+                                ):
+                                    inquirer_generate_cfg = (
+                                        model_inquirer.get_generation_cfg()
+                                    )
                                     regeneratinon_idx += 1
                                     continue
                                 else:
@@ -156,11 +169,16 @@ def main(self):
 
                         # As the context for model_inquirer is getting bigger much faster -> Starts answering it's own questions
                         # To prevent this keep in the inquirer_history only the output prompt(the thing that model_responder will see).
-                        model_inquirer.update_history(prompt=inquirer_prompt, output_extract=inquirer_output_extract)
+                        model_inquirer.update_history(
+                            prompt=inquirer_prompt,
+                            output_extract=inquirer_output_extract,
+                        )
 
                         # ------------------------------------------ Model B ------------------------------------------
 
-                        responder_prompt = model_responder.get_prompt(turn=turn, response_msg=inquirer_output_extract)
+                        responder_prompt = model_responder.get_prompt(
+                            turn=turn, response_msg=inquirer_output_extract
+                        )
 
                         self.track(
                             prompt=responder_prompt,
@@ -171,9 +189,11 @@ def main(self):
                                 "persona_hash": persona_hash,
                             },
                         )
-                        responder_output, responder_model_output_template = model_responder.generate(
-                            prompt=responder_prompt,
-                            generate_cfg=self.action_cfg.task.model_responder.generate,
+                        responder_output, responder_model_output_template = (
+                            model_responder.generate(
+                                prompt=responder_prompt,
+                                generate_cfg=self.action_cfg.task.model_responder.generate,
+                            )
                         )
                         if not responder_output:
                             break
@@ -192,7 +212,10 @@ def main(self):
                             self.aim_run["num_non_coherent_model_responder"] += 1
                             break
 
-                        model_responder.update_history(prompt=responder_prompt, output_extract=responder_model_output_template)
+                        model_responder.update_history(
+                            prompt=responder_prompt,
+                            output_extract=responder_model_output_template,
+                        )
 
                         # --------------------------------------- Save the dialog ---------------------------------------
                         dialog.append(
@@ -209,7 +232,9 @@ def main(self):
                         turn += 1
                         pbar.update(1)
 
-                with jsonlines.open(records_dir.joinpath(f"{self.cfg.seed}.jsonl"), mode="a") as writer:
+                with jsonlines.open(
+                    records_dir.joinpath(f"{self.cfg.seed}.jsonl"), mode="a"
+                ) as writer:
                     writer.write(
                         {
                             "persona": persona,
diff --git a/roleplay/common/model.py b/roleplay/common/model.py
@@ -50,8 +50,15 @@ def extract_prompt(self, prompt: str) -> str:
 
     def stop_dialog(self, prompt):
         translator = str.maketrans("", "", string.punctuation)
-        prompt_first_token = re.split(r"\s+|\n", prompt.strip())[0].strip().translate(translator).strip()
-        prompt_last_token = re.split(r"\s+|\n", prompt.strip())[-1].strip().translate(translator).strip()
+        prompt_first_token = (
+            re.split(r"\s+|\n", prompt.strip())[0].strip().translate(translator).strip()
+        )
+        prompt_last_token = (
+            re.split(r"\s+|\n", prompt.strip())[-1]
+            .strip()
+            .translate(translator)
+            .strip()
+        )
         if (
             self.spec_tokens.conv_stop_token == prompt_first_token
             or self.spec_tokens.conv_stop_token == prompt_last_token
@@ -74,10 +81,16 @@ def is_non_coherent(self, text):
                 if n_grams and len(n_grams) >= max(self.cfg.non_coherent_r, n):
                     if n_grams[-1] == n_gram or n_grams[-n] == n_gram:
                         last_rs = n_grams[-self.cfg.non_coherent_r :]
-                        if len(last_rs) == self.cfg.non_coherent_r and len(set(last_rs)) == 1:
+                        if (
+                            len(last_rs) == self.cfg.non_coherent_r
+                            and len(set(last_rs)) == 1
+                        ):
                             return True
                         last_rs = n_grams[-n::-n][: self.cfg.non_coherent_r]
-                        if len(last_rs) == self.cfg.non_coherent_r and len(set(last_rs)) == 1:
+                        if (
+                            len(last_rs) == self.cfg.non_coherent_r
+                            and len(set(last_rs)) == 1
+                        ):
                             return True
                 n_grams.append(n_gram)
         return False
@@ -102,5 +115,7 @@ def collate_tokenize(data, tokenizer, input_key):
             else:
                 input_text = element[input_key]
             input_batch.append(input_text)
-        tokenized = tokenizer(input_batch, padding="longest", truncation=True, return_tensors="pt").to(Device.get_device())
+        tokenized = tokenizer(
+            input_batch, padding="longest", truncation=True, return_tensors="pt"
+        ).to(Device.get_device())
         return tokenized
diff --git a/roleplay/common/persona.py b/roleplay/common/persona.py
@@ -13,7 +13,9 @@ def get_personas(cfg) -> List[Tuple[str, Dict[str, str]]]:
                 features = person["person"]
 
                 for feature_name in features.keys():
-                    persona = persona.replace(f"<{feature_name.upper()}>", features[feature_name])
+                    persona = persona.replace(
+                        f"<{feature_name.upper()}>", features[feature_name]
+                    )
 
                 persona_hash = hashlib.md5(str(features).encode()).hexdigest()
                 personas.append((persona, persona_hash))
diff --git a/roleplay/datasets/hf_datasets.py b/roleplay/datasets/hf_datasets.py
@@ -1,7 +1,7 @@
 from typing import Any, Dict, List
 
-from urartu.common.dataset import Dataset
 from datasets import Dataset as HFDataset
+from urartu.common.dataset import Dataset
 
 
 class HFDatasets(Dataset):
diff --git a/roleplay/models/causal_lm_model.py b/roleplay/models/causal_lm_model.py
@@ -3,9 +3,9 @@
 
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
-
 from urartu.common.device import Device
 from urartu.utils.dtype import eval_dtype
+
 from roleplay.common.model import Model
 
 
@@ -40,7 +40,9 @@ def get_prompt(self, turn, response_msg=None, persona=None, instructions=None):
 
             if turn == 0:
                 return (
-                    self.conv_template.first_turn_input.replace(self.spec_tokens.persona_placeholder, persona)
+                    self.conv_template.first_turn_input.replace(
+                        self.spec_tokens.persona_placeholder, persona
+                    )
                     .replace(
                         self.spec_tokens.objective_placeholder,
                         f"{instructions[0]}",
@@ -55,17 +57,23 @@ def get_prompt(self, turn, response_msg=None, persona=None, instructions=None):
                 assert response_msg is not None, "response_msg cannot be None"
 
                 if len(instructions) > 1 and turn < len(instructions):
-                    response_forwarding = self.conv_template.mid_response_forwarding.replace(
-                        self.spec_tokens.next_prompt, instructions[turn]
+                    response_forwarding = (
+                        self.conv_template.mid_response_forwarding.replace(
+                            self.spec_tokens.next_prompt, instructions[turn]
+                        )
                     )
                 else:
-                    response_forwarding = self.conv_template.response_forwarding.replace(
-                        self.spec_tokens.next_prompt, ""
+                    response_forwarding = (
+                        self.conv_template.response_forwarding.replace(
+                            self.spec_tokens.next_prompt, ""
+                        )
                     )
 
                 return self.conv_template.n_th_turn_input.replace(
                     self.spec_tokens.user_msg,
-                    response_forwarding.replace(self.spec_tokens.response_placeholder, response_msg).replace(
+                    response_forwarding.replace(
+                        self.spec_tokens.response_placeholder, response_msg
+                    ).replace(
                         self.spec_tokens.conv_stop_placeholder,
                         self.spec_tokens.conv_stop_token,
                     ),
@@ -79,7 +87,9 @@ def get_prompt(self, turn, response_msg=None, persona=None, instructions=None):
                     response_msg,
                 )
             else:
-                return self.conv_template.n_th_turn_input.replace(self.spec_tokens.user_msg, response_msg)
+                return self.conv_template.n_th_turn_input.replace(
+                    self.spec_tokens.user_msg, response_msg
+                )
         else:
             raise NotImplementedError(f"unknown role: {self.role}")
 
@@ -88,17 +98,25 @@ def generate(self, prompt: str, generate_cfg):
         model_prompt = prompt
         if self.history:
             model_prompt = f'{"".join(self.history)}{prompt}'
-        prompt_tokenized = self.tokenizer.encode(model_prompt, return_tensors="pt").to(self.model.device)
+        prompt_tokenized = self.tokenizer.encode(model_prompt, return_tensors="pt").to(
+            self.model.device
+        )
 
         with torch.no_grad():
             output_tokenized = self.model.generate(prompt_tokenized, **generate_cfg)
 
         output = self.tokenizer.decode(output_tokenized[0], skip_special_tokens=True)
 
-        output_o = output.replace(str(self.tokenizer.bos_token), "").replace(str(self.tokenizer.eos_token), "").strip()
+        output_o = (
+            output.replace(str(self.tokenizer.bos_token), "")
+            .replace(str(self.tokenizer.eos_token), "")
+            .strip()
+        )
 
         model_prompt_o = (
-            model_prompt.replace(str(self.tokenizer.bos_token), "").replace(str(self.tokenizer.eos_token), "").strip()
+            model_prompt.replace(str(self.tokenizer.bos_token), "")
+            .replace(str(self.tokenizer.eos_token), "")
+            .strip()
         )
 
         turn_response = output_o.replace(model_prompt_o, "", 1)
@@ -110,7 +128,9 @@ def generate(self, prompt: str, generate_cfg):
                 self.aim_run["num_self_replies"] += 1
 
         turn_response = turn_response.lstrip()
-        model_output_template = self.conv_template.model_output.replace(self.spec_tokens.model_answer, turn_response)
+        model_output_template = self.conv_template.model_output.replace(
+            self.spec_tokens.model_answer, turn_response
+        )
 
         del output_tokenized
 
diff --git a/roleplay/models/openai_model.py b/roleplay/models/openai_model.py
@@ -42,17 +42,23 @@ def get_prompt(self, turn, response_msg, persona=None, instructions=None):
                 return prompt
             else:
                 if len(instructions) > 1 and turn < len(instructions):
-                    response_forwarding = self.conv_template.mid_response_forwarding.replace(
-                        self.spec_tokens.next_prompt, instructions[turn]
+                    response_forwarding = (
+                        self.conv_template.mid_response_forwarding.replace(
+                            self.spec_tokens.next_prompt, instructions[turn]
+                        )
                     )
                 else:
-                    response_forwarding = self.conv_template.response_forwarding.replace(
-                        self.spec_tokens.next_prompt, ""
+                    response_forwarding = (
+                        self.conv_template.response_forwarding.replace(
+                            self.spec_tokens.next_prompt, ""
+                        )
                     )
 
                 return self.conv_template.n_th_turn_input.replace(
                     self.spec_tokens.user_msg,
-                    response_forwarding.replace(self.spec_tokens.response_placeholder, response_msg),
+                    response_forwarding.replace(
+                        self.spec_tokens.response_placeholder, response_msg
+                    ),
                 )
         elif self.role == "model_responder":
             if turn == 0:
@@ -61,7 +67,9 @@ def get_prompt(self, turn, response_msg, persona=None, instructions=None):
                     response_msg,
                 )
             else:
-                return self.conv_template.n_th_turn_input.replace(self.spec_tokens.user_msg, response_msg)
+                return self.conv_template.n_th_turn_input.replace(
+                    self.spec_tokens.user_msg, response_msg
+                )
         else:
             raise NotImplementedError(f"unknown role: {self.role}")
 
@@ -74,13 +82,21 @@ def generate(self, prompt: Union[str, Tuple[str, str]], generate_cfg):
         else:
             self.history.append(HumanMessage(content=prompt))
 
-        num_history_words = sum([self._get_num_tokens(item.content) for item in self.history])
+        num_history_words = sum(
+            [self._get_num_tokens(item.content) for item in self.history]
+        )
         if generate_cfg.max_new_tokens + num_history_words > self.cfg.context_length:
-            delta = generate_cfg.max_new_tokens + num_history_words - self.cfg.context_length
+            delta = (
+                generate_cfg.max_new_tokens
+                + num_history_words
+                - self.cfg.context_length
+            )
             i = 1
             while delta > 0:
                 len_human_utterance = self._get_num_tokens(self.history[i].content)
-                len_aiassistant_utterance = self._get_num_tokens(self.history[i + 1].content)
+                len_aiassistant_utterance = self._get_num_tokens(
+                    self.history[i + 1].content
+                )
                 delta -= len_human_utterance + len_aiassistant_utterance
                 i += 2
             del self.history[1:i]
diff --git a/roleplay/models/pipeline_model.py b/roleplay/models/pipeline_model.py
diff --git a/setup.py b/setup.py