scaleoutsystems · Wrede · May 2, 2024 · Mar 25, 2024 · Mar 25, 2024 · Mar 26, 2024
diff --git a/docs/aggregators.rst b/docs/aggregators.rst
@@ -5,7 +5,7 @@ Aggregators
 
 Overview
 ---------
-Aggregators handle combinations of model updates received by the combiner into a combiner-level global model. 
+Aggregators are responsible for combining client model updates into a combiner-level global model. 
 During a training session, the combiners will instantiate an Aggregator and use it to process the incoming model updates from clients.
 
 .. image:: img/aggregators.png
@@ -21,20 +21,19 @@ As multiple clients submit updates, the aggregation queue accumulates. Once spec
 begins processing the queue, aggregating models according to the specifics of the scheme (e.g., FedAvg, FedAdam).
 
 
-Using different aggregators
-----------------------------
+Using built-in Aggregators
+--------------------------
 
 FEDn supports the following aggregation algorithms: 
 
 - FedAvg (default)
-- FedAdam 
-- FedYogi
-- FedAdaGrad
+- FedAdam (FedOpt)
+- FedYogi (FedOpt)
+- FedAdaGrad (FedOpt)
 
 The implementation of the methods from the FedOpt family follows the implemenation in this paper: https://arxiv.org/pdf/2003.00295.pdf 
 
-
-Training sessions can be configured to use a given aggregator method. For example, to use FedAdam:
+Training sessions can be configured to use a given aggregator. For example, to use FedAdam:
 
 .. code:: python
 
@@ -49,49 +48,71 @@ Training sessions can be configured to use a given aggregator method. For exampl
                         "beta2": 0.99,
                         "tau": 1e-4
                         },
-                    "model_id": seed_model['model'],
                     "rounds": 10
                  }
 
    result_fedadam = client.start_session(**session_config)
 
 .. note:: 
 
-   The FedOpt methods use server-side momentum. FEDn resets the aggregator for each new session. This means that momentum terms 
-   will also be reset, i.e. the history will be forgotten. When using FedAdam, FedYogi and FedAdaGrad, the user needs to strike a 
+   The FedOpt family of methods use server-side momentum. FEDn resets the aggregator for each new session. 
+   This means that the history will will also be reset, i.e. the momentum terms will be forgotten. 
+   When using FedAdam, FedYogi and FedAdaGrad, the user needs to strike a 
    balance between the number of rounds in the session from a convergence and utility perspective.  
 
+.. note:: 
+
+   The parameter ``aggregator_kwargs`` are hyperparameters for the FedOpt family aggregators. The
+   data types for these parameters (str, float) are validated by the aggregator and an error 
+   will be issued if passing parameter values of incompatible type. All hyperparameters are 
+   given above for completeness. It is primarily the ``learning_rate`` that will require tuning.
+
 Several additional parameters that guide general behavior of the aggregation flow can be configured: 
 
 - Round timeout: The maximal time the combiner waits before processing the update queue.  
 - Buffer size: The maximal allowed length of the queue before processing it.
 - Whether to retain or delete model update files after they have been processed (default is to delete them)
 
-See API documenation for 
 
-Extending FEDn with new aggregators
+Extending FEDn with new Aggregators
 -----------------------------------
 
 A developer can extend FEDn with his/her own Aggregator(s) by implementing the interface specified in 
-:py:mod:`fedn.network.combiner.aggregators.aggregatorbase.AggregatorBase`. The developer implements two following methods:  
+:py:mod:`fedn.network.combiner.aggregators.aggregatorbase.AggregatorBase`. This involes implementing the two methods:  
 
-- ``on_model_update`` (optional)
-- ``combine_models``
+- ``on_model_update`` (perform model update validation before update is placed on queue, optional)
+- ``combine_models``  (process the queue and aggregate updates)
 
 **on_model_update**
 
-The on_model_update has access to the complete model update including the metadata passed on  by the clients (as specified in the training entrypoint, 
-see compute package). The base class implements a default callback that checks that all metadata assumed by the aggregation algorithms FedAvg and FedOpt 
-is present in the metadata. However, the callback could also be used to implement custom preprocessing and additional checks including strategies 
+The ``on_model_update`` callback recieves the model update messages from clients (including all metadata) and can be used to perform validation and 
+potential transformation of the model update before it is places on the aggregation queue (see image above). 
+The base class implements a default callback that checks that all metadata assumed by the aggregation algorithms FedAvg and FedOpt 
+is available. The callback could also be used to implement custom pre-processing and additional checks including strategies 
 to filter out updates that are suspected to be corrupted or malicious. 
 
 **combine_models**
 
-This method is responsible for processing the model update queue and in doing so produce an aggregated model. This is the main extension point where the numerical detail of the aggregation scheme is implemented. The best way to understand how to implement this methods is to study the already implemented algorithms: 
+When a certain criteria is met, e.g. if all clients have sent updates, or the round has times out, the ``combine_model_update`` method 
+processes the model update queue, producing an aggregated model. This is the main extension point where the
+numerical details of the aggregation scheme is implemented. The best way to understand how to implement this method
+is to study the built-in aggregation algorithms: 
+
+- :py:mod:`fedn.network.combiner.aggregators.fedavg` (weighted average of parameters)
+- :py:mod:`fedn.network.combiner.aggregators.fedopt` (compute pseudo-gradients and apply a server-side optmizer)
+
+To add an aggregator plugin ``myaggregator``, the developer implements the interface and places a file called ‘myaggregator.py’ in the folder ‘fedn.network.combiner.aggregators’.
+This extension can then simply be called as such: 
 
-- :py:mod:`fedn.network.combiner.aggregators.fedavg`
-- :py:mod:`fedn.network.combiner.aggregators.fedopt`
+.. code:: python
+
+   session_config = {
+                    "helper": "numpyhelper",
+                    "id": "experiment_myaggregator",
+                    "aggregator": "myaggregator",
+                    "rounds": 10
+                 }
 
-To add an aggregator plugin ``myaggregator``, the developer implements the interface and places a file called ‘myaggregator.py’ in the folder ‘fedn.network.combiner.aggregators’. 
+   result_myaggregator = client.start_session(**session_config)
 
 
diff --git a/examples/notebooks/Aggregators.ipynb b/examples/notebooks/Aggregators.ipynb
diff --git a/fedn/fedn/common/exceptions.py b/fedn/fedn/common/exceptions.py
@@ -4,3 +4,7 @@ class ModelError(BaseException):
 
 class InvalidClientConfig(BaseException):
     pass
+
+
+class InvalidParameterError(BaseException):
+    pass
diff --git a/fedn/fedn/network/combiner/aggregators/aggregatorbase.py b/fedn/fedn/network/combiner/aggregators/aggregatorbase.py
@@ -34,7 +34,7 @@ def __init__(self, storage, server, modelservice, round_handler):
         self.model_updates = queue.Queue()
 
     @abstractmethod
-    def combine_models(self, nr_expected_models=None, nr_required_models=1, helper=None, timeout=180, delete_models=True, params=None):
+    def combine_models(self, nr_expected_models=None, nr_required_models=1, helper=None, timeout=180, delete_models=True, parameters=None):
         """Routine for combining model updates. Implemented in subclass.
 
         :param nr_expected_models: Number of expected models. If None, wait for all models.
@@ -47,8 +47,8 @@ def combine_models(self, nr_expected_models=None, nr_required_models=1, helper=N
         :type timeout: int
         :param delete_models: Delete client models after combining.
         :type delete_models: bool
-        :param params: Additional key-word arguments.
-        :type params: dict
+        :param parameters: Additional key-word arguments.
+        :type parameters: dict
         :return: The global model and metadata
         :rtype: tuple
         """

diff --git a/fedn/fedn/network/combiner/aggregators/fedavg.py b/fedn/fedn/network/combiner/aggregators/fedavg.py
@@ -26,7 +26,7 @@ def __init__(self, storage, server, modelservice, round_handler):
 
         self.name = "fedavg"
 
-    def combine_models(self, helper=None, delete_models=True, params=None):
+    def combine_models(self, helper=None, delete_models=True, parameters=None):
         """Aggregate all model updates in the queue by computing an incremental
         weighted average of model parameters.
 

diff --git a/fedn/fedn/network/combiner/aggregators/fedopt.py b/fedn/fedn/network/combiner/aggregators/fedopt.py
@@ -1,6 +1,6 @@
-import ast
 import math
 
+from fedn.common.exceptions import InvalidParameterError
 from fedn.common.log_config import logger
 from fedn.network.combiner.aggregators.aggregatorbase import AggregatorBase
 
@@ -10,8 +10,12 @@ class Aggregator(AggregatorBase):
 
     Implmentation following: https://arxiv.org/pdf/2003.00295.pdf
 
-    Aggregate pseudo gradients computed by subtracting the model
+    This aggregator computes pseudo gradients by subtracting the model
     update from the global model weights from the previous round.
+    A server-side scheme is then applied, currenty supported schemes
+    are "adam", "yogi", "adagrad".
+
+
 
     :param id: A reference to id of :class: `fedn.network.combiner.Combiner`
     :type id: str
@@ -34,16 +38,7 @@ def __init__(self, storage, server, modelservice, round_handler):
         self.v = None
         self.m = None
 
-        # Server side default hyperparameters. Note that these may need fine tuning.
-        self.default_params = {
-            'serveropt': 'adam',
-            'learning_rate': 1e-3,
-            'beta1': 0.9,
-            'beta2': 0.99,
-            'tau': 1e-4,
-        }
-
-    def combine_models(self, helper=None, delete_models=True, params=None):
+    def combine_models(self, helper=None, delete_models=True, parameters=None):
         """Compute pseudo gradients using model updates in the queue.
 
         :param helper: An instance of :class: `fedn.utils.helpers.helpers.HelperBase`, ML framework specific helper, defaults to None
@@ -54,24 +49,55 @@ def combine_models(self, helper=None, delete_models=True, params=None):
         :type max_nr_models: int, optional
         :param delete_models: Delete models from storage after aggregation, defaults to True
         :type delete_models: bool, optional
-        :param params: Additional key-word arguments.
-        :type params: dict
+        :param parameters: Aggregator hyperparameters.
+        :type parameters: `fedn.utils.parmeters.Parameters`, optional
         :return: The global model and metadata
         :rtype: tuple
         """
 
-        params = ast.literal_eval(params)
         data = {}
         data['time_model_load'] = 0.0
         data['time_model_aggregation'] = 0.0
 
-        # Override default hyperparameters:
-        if params:
-            for key, value in self.default_params.items():
-                if key not in params:
-                    params[key] = value
+        # Define parameter schema
+        parameter_schema = {
+            'serveropt': str,
+            'learning_rate': float,
+            'beta1': float,
+            'beta2': float,
+            'tau': float,
+        }
+
+        try:
+            parameters.validate(parameter_schema)
+        except InvalidParameterError as e:
+            logger.error("Aggregator {} recieved invalid parameters. Reason {}".format(self.name, e))
+            return None, data
+
+        # Default hyperparameters. Note that these may need fine tuning.
+        default_parameters = {
+            'serveropt': 'adam',
+            'learning_rate': 1e-3,
+            'beta1': 0.9,
+            'beta2': 0.99,
+            'tau': 1e-4,
+        }
+
+        # Validate parameters
+        if parameters:
+            try:
+                parameters.validate(parameter_schema)
+            except InvalidParameterError as e:
+                logger.error("Aggregator {} recieved invalid parameters. Reason {}".format(self.name, e))
+                return None, data
         else:
-            params = self.default_params
+            logger.info("Aggregator {} using default parameteres.", format(self.name))
+            parameters = self.default_parameters
+
+        # Override missing paramters with defaults
+        for key, value in default_parameters.items():
+            if key not in parameters:
+                parameters[key] = value
 
         model = None
         nr_aggregated_models = 0
@@ -114,12 +140,12 @@ def combine_models(self, helper=None, delete_models=True, params=None):
                     "AGGREGATOR({}): Error encoutered while processing model update {}, skipping this update.".format(self.name, e))
                 self.model_updates.task_done()
 
-        if params['serveropt'] == 'adam':
-            model = self.serveropt_adam(helper, pseudo_gradient, model_old, params)
-        elif params['serveropt'] == 'yogi':
-            model = self.serveropt_yogi(helper, pseudo_gradient, model_old, params)
-        elif params['serveropt'] == 'adagrad':
-            model = self.serveropt_adagrad(helper, pseudo_gradient, model_old, params)
+        if parameters['serveropt'] == 'adam':
+            model = self.serveropt_adam(helper, pseudo_gradient, model_old, parameters)
+        elif parameters['serveropt'] == 'yogi':
+            model = self.serveropt_yogi(helper, pseudo_gradient, model_old, parameters)
+        elif parameters['serveropt'] == 'adagrad':
+            model = self.serveropt_adagrad(helper, pseudo_gradient, model_old, parameters)
         else:
             logger.error("Unsupported server optimizer passed to FedOpt.")
             return
@@ -129,7 +155,7 @@ def combine_models(self, helper=None, delete_models=True, params=None):
         logger.info("AGGREGATOR({}): Aggregation completed, aggregated {} models.".format(self.name, nr_aggregated_models))
         return model, data
 
-    def serveropt_adam(self, helper, pseudo_gradient, model_old, params):
+    def serveropt_adam(self, helper, pseudo_gradient, model_old, parameters):
         """ Server side optimization, FedAdam.
 
         :param helper: instance of helper class.
@@ -138,15 +164,15 @@ def serveropt_adam(self, helper, pseudo_gradient, model_old, params):
         :type pseudo_gradient: As defined by helper.
         :param model_old: The current global model.
         :type model_old: As defined in helper.
-        :param params: Hyperparamters for the aggregator.
-        :type params: dict
+        :param parameters: Hyperparamters for the aggregator.
+        :type parameters: dict
         :return: new model weights.
         :rtype: as defined by helper.
         """
-        beta1 = params['beta1']
-        beta2 = params['beta2']
-        learning_rate = params['learning_rate']
-        tau = params['tau']
+        beta1 = parameters['beta1']
+        beta2 = parameters['beta2']
+        learning_rate = parameters['learning_rate']
+        tau = parameters['tau']
 
         if not self.v:
             self.v = helper.ones(pseudo_gradient, math.pow(tau, 2))
@@ -165,7 +191,7 @@ def serveropt_adam(self, helper, pseudo_gradient, model_old, params):
 
         return model
 
-    def serveropt_yogi(self, helper, pseudo_gradient, model_old, params):
+    def serveropt_yogi(self, helper, pseudo_gradient, model_old, parameters):
         """ Server side optimization, FedYogi.
 
         :param helper: instance of helper class.
@@ -174,16 +200,16 @@ def serveropt_yogi(self, helper, pseudo_gradient, model_old, params):
         :type pseudo_gradient: As defined by helper.
         :param model_old: The current global model.
         :type model_old: As defined in helper.
-        :param params: Hyperparamters for the aggregator.
-        :type params: dict
+        :param parameters: Hyperparamters for the aggregator.
+        :type parameters: dict
         :return: new model weights.
         :rtype: as defined by helper.
         """
 
-        beta1 = params['beta1']
-        beta2 = params['beta2']
-        learning_rate = params['learning_rate']
-        tau = params['tau']
+        beta1 = parameters['beta1']
+        beta2 = parameters['beta2']
+        learning_rate = parameters['learning_rate']
+        tau = parameters['tau']
 
         if not self.v:
             self.v = helper.ones(pseudo_gradient, math.pow(tau, 2))
@@ -204,7 +230,7 @@ def serveropt_yogi(self, helper, pseudo_gradient, model_old, params):
 
         return model
 
-    def serveropt_adagrad(self, helper, pseudo_gradient, model_old, params):
+    def serveropt_adagrad(self, helper, pseudo_gradient, model_old, parameters):
         """ Server side optimization, FedAdam.
 
         :param helper: instance of helper class.
@@ -213,15 +239,15 @@ def serveropt_adagrad(self, helper, pseudo_gradient, model_old, params):
         :type pseudo_gradient: As defined by helper.
         :param model_old: The current global model.
         :type model_old: As defined in helper.
-        :param params: Hyperparamters for the aggregator.
-        :type params: dict
+        :param parameters: Hyperparamters for the aggregator.
+        :type parameters: dict
         :return: new model weights.
         :rtype: as defined by helper.
         """
 
-        beta1 = params['beta1']
-        learning_rate = params['learning_rate']
-        tau = params['tau']
+        beta1 = parameters['beta1']
+        learning_rate = parameters['learning_rate']
+        tau = parameters['tau']
 
         if not self.v:
             self.v = helper.ones(pseudo_gradient, math.pow(tau, 2))
-Original file line number
+Diff line change
@@ Expand Up / @@ -4,3 +4,7 @@ class ModelError(BaseException): @@
     class InvalidClientConfig(BaseException):
         pass
+    class InvalidParameterError(BaseException):
+        pass