Add UKAEA-TGLFNN

theo-brown · theo-brown · commit cc39071636e1 · 2025-03-05T11:45:20.000Z
diff --git a/fusion_transport_surrogates/ukaea_tglfnn.py b/fusion_transport_surrogates/ukaea_tglfnn.py
@@ -0,0 +1,173 @@
+import dataclasses
+import json
+from typing import Final
+
+import jax
+import jax.numpy as jnp
+import optax
+import yaml
+
+from fusion_transport_surrogates.networks import GaussianMLPEnsemble
+from fusion_transport_surrogates.utils import normalize, unnormalize
+
+INPUT_LABELS: Final[list[str]] = [
+    "RLNS_1",
+    "RLTS_1",
+    "RLTS_2",
+    "TAUS_2",
+    "RMIN_LOC",
+    "DRMAJDX_LOC",
+    "Q_LOC",
+    "SHAT",
+    "XNUE",
+    "KAPPA_LOC",
+    "S_KAPPA_LOC",
+    "DELTA_LOC",
+    "S_DELTA_LOC",
+    "BETAE",
+    "ZEFF",
+]
+OUTPUT_LABELS: Final[list[str]] = ["efe_gb", "efi_gb", "pfi_gb"]
+
+
+@dataclasses.dataclass
+class TGLFNNModelConfig:
+    n_ensemble: int
+    hidden_size: int
+    num_hiddens: int
+    dropout: float
+    normalize: bool
+    unnormalize: bool
+    hidden_size: int = 512
+
+    @classmethod
+    def load(cls, config_path: str) -> "TGLFNNModelConfig":
+        with open(config_path, "r") as f:
+            config = yaml.safe_load(f)
+
+        return cls(
+            n_ensemble=config["num_estimators"],
+            num_hiddens=config["model_size"],
+            dropout=config["dropout"],
+            normalize=config["scale"],
+            unnormalize=config["denormalise"],
+        )
+
+
+@dataclasses.dataclass
+class TGLFNNModelStats:
+    input_mean: jax.Array
+    input_std: jax.Array
+    output_mean: jax.Array
+    output_std: jax.Array
+
+    @classmethod
+    def load(cls, stats_path: str) -> "TGLFNNModelStats":
+        with open(stats_path, "r") as f:
+            stats = json.load(f)
+
+        return cls(
+            input_mean=jnp.array([stats[label]["mean"] for label in INPUT_LABELS]),
+            input_std=jnp.array([stats[label]["std"] for label in INPUT_LABELS]),
+            output_mean=jnp.array([stats[label]["mean"] for label in OUTPUT_LABELS]),
+            output_std=jnp.array([stats[label]["std"] for label in OUTPUT_LABELS]),
+        )
+
+
+class TGLFNNModel:
+
+    def __init__(
+        self,
+        config: TGLFNNModelConfig,
+        stats: TGLFNNModelStats,
+        params: optax.Params | None,
+    ):
+        self.config = config
+        self.stats = stats
+        self.params = params
+        self.network = GaussianMLPEnsemble(
+            n_ensemble=config.n_ensemble,
+            hidden_size=config.hidden_size,
+            n_hidden_layers=config.n_hidden_layers,
+            dropout=config.dropout,
+        )
+
+    @classmethod
+    def load_from_pytorch(
+        cls,
+        config_path: str,
+        stats_path: str,
+        efe_gb_checkpoint_path: str,
+        efi_gb_checkpoint_path: str,
+        pfi_gb_checkpoint_path: str,
+        *args,
+        **kwargs,
+    ) -> "TGLFNNModel":
+        import torch
+
+        def _convert_pytorch_state_dict(
+            pytorch_state_dict: dict, config: TGLFNNModelConfig
+        ) -> optax.Params:
+            params = {}
+            for i in range(config.n_ensemble):
+                model_dict = {}
+                for j in range(config.n_hidden_layers):
+                    layer_dict = {
+                        "kernel": jnp.array(
+                            pytorch_state_dict[f"models.{i}.model.{j*3}.weight"]
+                        ).T,
+                        "bias": jnp.array(
+                            pytorch_state_dict[f"models.{i}.model.{j*3}.bias"]
+                        ).T,
+                    }
+                    model_dict[f"Dense_{j}"] = layer_dict
+                params[f"GaussianMLP_{i}"] = model_dict
+            return {"params": params}
+
+        config = TGLFNNModelConfig.load(config_path)
+        stats = TGLFNNModelStats.load(stats_path)
+
+        with open(efe_gb_checkpoint_path, "rb") as f:
+            efe_gb_params = _convert_pytorch_state_dict(
+                torch.load(f, *args, **kwargs), config
+            )
+        with open(efi_gb_checkpoint_path, "rb") as f:
+            efi_gb_params = _convert_pytorch_state_dict(
+                torch.load(f, *args, **kwargs), config
+            )
+        with open(pfi_gb_checkpoint_path, "rb") as f:
+            pfi_gb_params = _convert_pytorch_state_dict(
+                torch.load(f, *args, **kwargs), config
+            )
+
+        params = {
+            "efe_gb": efe_gb_params,
+            "efi_gb": efi_gb_params,
+            "pfi_gb": pfi_gb_params,
+        }
+
+        return cls(config, stats, params)
+
+    def predict(
+        self,
+        inputs: jax.Array,
+    ) -> dict[str, jax.Array]:
+        if self.config.normalize:
+            inputs = normalize(
+                inputs, mean=self.stats.input_mean, stddev=self.stats.input_std
+            )
+
+        output = jnp.stack(
+            [
+                self.network.apply(self.params[label], inputs, deterministic=True)
+                for label in OUTPUT_LABELS
+            ],
+            axis=-1,
+        )
+
+        if self.config.unnormalize:
+            output = unnormalize(
+                output, mean=self.stats.output_mean, stddev=self.stats.output_std
+            )
+
+        return output