add BP with quent

mahi97 · mahi97 · commit c051882eae8a · 2023-08-24T10:46:04.000+09:00
diff --git a/quantization.py b/quantization.py
@@ -0,0 +1,137 @@
+import jax
+import jax.numpy as jnp  # JAX NumPy
+import numpy as np  # Ordinary NumPy
+import wandb
+from backprop import sl
+from utils import helpers, models, evo
+import chex
+from args import get_args
+from evosax import NetworkMapper, ParameterReshaper, FitnessShaper
+from flax.core import FrozenDict
+
+import os
+
+os.environ['TF_FORCE_GPU_ALLOW_GROWTH'] = 'true'
+
+
+# cosine distance
+def cosine(x, y):
+    return jnp.sum(x * y) / (jnp.sqrt(jnp.sum(x ** 2)) * jnp.sqrt(jnp.sum(x ** 2)))
+
+
+def cosine2(x, y):
+    return jnp.sum(x * y) / (jnp.sqrt(jnp.sum(x ** 2)) * jnp.sqrt(jnp.sum(y ** 2)))
+
+# l2 distance
+def l2(x, y):
+    return -1 * jnp.sqrt(jnp.sum((x - y) ** 2))  # / jnp.sqrt(jnp.sum(x ** 2))
+
+
+def l1(x, y):
+    return -1 * jnp.sum(jnp.abs(x - y))
+
+
+#compress the array with quantization based on array distribution
+def quantize(array, n_bits):
+    max_val = array.max()
+    min_val = array.min()
+    step = (max_val - min_val) / (2 ** n_bits - 1)
+    array = ((array - min_val) / step).round()
+    return array
+
+#dequantization array
+def dequantize(array, min_val, max_val, n_bits):
+    step = (max_val - min_val) / (2 ** n_bits - 1)
+    array = array * step + min_val
+    return array
+
+
+#plot histogram of array
+from matplotlib import pyplot as plt
+def plot_hist(array):
+    plt.hist(array, bins=100)
+    plt.show()
+
+class TaskManager:
+    def __init__(self, rng: chex.PRNGKey, args):
+        wandb.run.name = '{}-{}-{} b{} s{} q{} -- {}' \
+            .format(args.dataset, args.algo,
+                    args.dist,
+                    args.batch_size,
+                    args.seed, args.quantize_bits, wandb.run.id)
+
+        wandb.run.save()
+        self.args = args
+
+    def run(self, rng: chex.PRNGKey):
+        train_ds, test_ds = sl.get_datasets(wandb.config.dataset.lower())
+        rng, init_rng = jax.random.split(rng)
+
+        learning_rate = wandb.config.lr
+        momentum = wandb.config.momentum
+        network = NetworkMapper[wandb.config.network_name](**wandb.config.network_config)
+
+        state = sl.create_train_state(init_rng, network, learning_rate, momentum)
+        param_reshaper = ParameterReshaper(state.params, n_devices=self.args.n_devices)
+        test_param_reshaper = ParameterReshaper(state.params, n_devices=1)
+        # strategy, es_params = evo.get_strategy_and_params(self.args.pop_size, param_reshaper.total_params, self.args)
+        fit_shaper = FitnessShaper(centered_rank=True, z_score=True, w_decay=self.args.w_decay, maximize=True)
+        # server = strategy.initialize(init_rng, es_params)
+        # server = server.replace(mean=test_param_reshaper.network_to_flat(state.params))
+        # del init_rng  # Must not be used anymore.
+
+        num_epochs = wandb.config.n_rounds
+        batch_size = wandb.config.batch_size
+        nbits = wandb.config.quantize_bits
+        X, y = jnp.array(train_ds['image']), jnp.array(train_ds['label'])
+
+        for epoch in range(1, num_epochs + 1):
+            # Use a separate PRNG key to permute image data during shuffling
+            rng, input_rng, rng_ask = jax.random.split(rng, 3)
+            # Run an optimization step over a training batch
+            target_state, loss, acc = sl.train_epoch(state, X, y, batch_size, input_rng)
+            # Evaluate on the test set after each training epoch
+            target_server = param_reshaper.network_to_flat(target_state.params)
+            max_val = target_server.max()
+            min_val = target_server.min()
+            target_server = quantize(target_server, nbits)
+            server = dequantize(target_server, min_val, max_val, nbits)
+
+            ad = jnp.sum(server - target_server)
+
+            state = sl.update_train_state(learning_rate, momentum, test_param_reshaper.reshape_single_net(server))
+            test_loss, test_accuracy = sl.eval_model(state.params, test_ds, input_rng)
+            wandb.log({
+                'Round': epoch,
+                'Test Loss': test_loss,
+                'Train Loss': loss,
+                'Test Accuracy': test_accuracy,
+                'Train Accuracy': acc,
+                'Global Accuracy': test_accuracy,
+                'Information Loss': ad,
+            })
+
+
+def run():
+    print(jax.devices())
+    args = get_args()
+    config = helpers.load_config(args.config)
+    wandb.init(project='evofed', config=args)
+    wandb.config.update(config)
+    args = wandb.config
+    rng = jax.random.PRNGKey(args.seed)
+    rng, rng_init, rng_run = jax.random.split(rng, 3)
+    manager = TaskManager(rng_init, args)
+    manager.run(rng_run)
+
+
+SWEEPS = {
+    'cifar-bp': 'bc4zva3u',
+    'cifar-bp2': '82la1zw0',
+    'fmnits-mah': '1yksrmvs',
+    'cifar-mah': 'mtheusi1',
+}
+
+if __name__ == '__main__':
+    run()
+    # wandb.agent(SWEEPS['cifar-mah'], function=run, project='evofed', count=10)