Added default thresholds to the metrics.

huanmingf · tf-model-analysis-team · commit 8e78aa8f7070 · 2020-01-31T10:52:27.000-08:00
PiperOrigin-RevId: 292575370
diff --git a/tensorflow_model_analysis/addons/fairness/metrics/fairness_indicators.py b/tensorflow_model_analysis/addons/fairness/metrics/fairness_indicators.py
@@ -37,12 +37,14 @@
     'negative_rate',
 )
 
+DEFAULT_THERSHOLDS = (0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9)
+
 
 class FairnessIndicators(metric_types.Metric):
   """Fairness indicators metrics."""
 
   def __init__(self,
-               thresholds: List[float],
+               thresholds: List[float] = DEFAULT_THERSHOLDS,
                name: Text = FAIRNESS_INDICATORS_METRICS_NAME):
     """Initializes fairness indicators metrics.
 
@@ -57,6 +59,11 @@ def __init__(self,
         name=name)
 
 
+def calculate_digits(thresholds):
+  digits = [len(str(t)) - 2 for t in thresholds]
+  return max(max(digits), 1)
+
+
 def _fairness_indicators_metrics_at_thresholds(
     thresholds: List[float],
     name: Text = FAIRNESS_INDICATORS_METRICS_NAME,
@@ -69,11 +76,13 @@ def _fairness_indicators_metrics_at_thresholds(
   """Returns computations for fairness metrics at thresholds."""
   metric_key_by_name_by_threshold = collections.defaultdict(dict)
   keys = []
+  digits_num = calculate_digits(thresholds)
   for t in thresholds:
     for m in FAIRNESS_INDICATORS_SUB_METRICS:
       key = metric_types.MetricKey(
-          name='%s/%s@%s' %
-          (name, m, t),  # e.g. "fairness_indicators_metrics/positive_rate@0.5"
+          name='%s/%s@%.*f' %
+          (name, m, digits_num,
+           t),  # e.g. "fairness_indicators_metrics/positive_rate@0.5"
           model_name=model_name,
           output_name=output_name,
           sub_key=sub_key)
diff --git a/tensorflow_model_analysis/addons/fairness/metrics/fairness_indicators_test.py b/tensorflow_model_analysis/addons/fairness/metrics/fairness_indicators_test.py
@@ -19,6 +19,7 @@
 from __future__ import print_function
 
 import math
+from absl.testing import parameterized
 import apache_beam as beam
 from apache_beam.testing import util
 import numpy as np
@@ -29,9 +30,10 @@
 from tensorflow_model_analysis.metrics import metric_util
 
 
-class FairnessIndicatorsTest(testutil.TensorflowModelAnalysisTest):
+class FairnessIndicatorsTest(testutil.TensorflowModelAnalysisTest,
+                             parameterized.TestCase):
 
-  def testFairessIndicatorsMetrics(self):
+  def testFairessIndicatorsMetricsGeneral(self):
     computations = fairness_indicators.FairnessIndicators(
         thresholds=[0.3, 0.7]).computations()
     histogram = computations[0]
@@ -79,76 +81,48 @@ def check_result(got):
           self.assertDictElementsAlmostEqual(
               got_metrics, {
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/false_positive_rate@0.3',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/false_positive_rate@0.3'
+                  ):
                       0.5,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/false_negative_rate@0.3',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/false_negative_rate@0.3'
+                  ):
                       0.0,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/true_positive_rate@0.3',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/true_positive_rate@0.3'
+                  ):
                       1.0,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/true_negative_rate@0.3',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/true_negative_rate@0.3'
+                  ):
                       0.5,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/positive_rate@0.3',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/positive_rate@0.3'):
                       0.75,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/negative_rate@0.3',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/negative_rate@0.3'):
                       0.25,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/false_positive_rate@0.7',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/false_positive_rate@0.7'
+                  ):
                       0.0,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/false_negative_rate@0.7',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/false_negative_rate@0.7'
+                  ):
                       0.5,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/true_positive_rate@0.7',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/true_positive_rate@0.7'
+                  ):
                       0.5,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/true_negative_rate@0.7',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/true_negative_rate@0.7'
+                  ):
                       1.0,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/positive_rate@0.7',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/positive_rate@0.7'):
                       0.25,
                   metric_types.MetricKey(
-                      name='fairness_indicators_metrics/negative_rate@0.7',
-                      model_name='',
-                      output_name='',
-                      sub_key=None):
+                      name='fairness_indicators_metrics/negative_rate@0.7'):
                       0.75
               })
         except AssertionError as err:
@@ -184,7 +158,6 @@ def testFairessIndicatorsMetricsWithNanValue(self):
               lambda x: (x[0], matrices.result(x[1])))  # pyformat: ignore
           | 'ComputeMetrics' >> beam.Map(lambda x: (x[0], metrics.result(x[1])))
       )  # pyformat: ignore
-
       # pylint: enable=no-value-for-parameter
 
       def check_result(got):
@@ -195,22 +168,166 @@ def check_result(got):
           self.assertLen(got_metrics, 6)  # 1 threshold * 6 metrics
           self.assertTrue(
               math.isnan(got_metrics[metric_types.MetricKey(
-                  name='fairness_indicators_metrics/false_negative_rate@0.5',
-                  model_name='',
-                  output_name='',
-                  sub_key=None)]))
+                  name='fairness_indicators_metrics/false_negative_rate@0.5')]))
           self.assertTrue(
               math.isnan(got_metrics[metric_types.MetricKey(
-                  name='fairness_indicators_metrics/true_positive_rate@0.5',
-                  model_name='',
-                  output_name='',
-                  sub_key=None)]))
+                  name='fairness_indicators_metrics/true_positive_rate@0.5')]))
+
+        except AssertionError as err:
+          raise util.BeamAssertException(err)
+
+      util.assert_that(result, check_result, label='result')
+
+  @parameterized.named_parameters(
+      ('_default_threshold', {}, 54, ()),
+      ('_thresholds_with_different_digits', {
+          'thresholds': [0.1, 0.22, 0.333]
+      }, 18,
+       (metric_types.MetricKey(
+           name='fairness_indicators_metrics/false_positive_rate@0.100'),
+        metric_types.MetricKey(
+            name='fairness_indicators_metrics/false_positive_rate@0.220'),
+        metric_types.MetricKey(
+            name='fairness_indicators_metrics/false_positive_rate@0.333'))))
+  def testFairessIndicatorsMetricsWithThresholds(self, kwargs,
+                                                 expected_metrics_nums,
+                                                 expected_metrics_keys):
+    computations = fairness_indicators.FairnessIndicators(
+        **kwargs).computations()
+    histogram = computations[0]
+    matrices = computations[1]
+    metrics = computations[2]
+    examples = [{
+        'labels': np.array([0.0]),
+        'predictions': np.array([0.1]),
+        'example_weights': np.array([1.0]),
+    }, {
+        'labels': np.array([0.0]),
+        'predictions': np.array([0.7]),
+        'example_weights': np.array([3.0]),
+    }]
+
+    with beam.Pipeline() as pipeline:
+      # pylint: disable=no-value-for-parameter
+      result = (
+          pipeline
+          | 'Create' >> beam.Create(examples)
+          | 'Process' >> beam.Map(metric_util.to_standard_metric_inputs)
+          | 'AddSlice' >> beam.Map(lambda x: ((), x))
+          | 'ComputeHistogram' >> beam.CombinePerKey(histogram.combiner)
+          | 'ComputeMatrices' >> beam.Map(
+              lambda x: (x[0], matrices.result(x[1])))  # pyformat: ignore
+          | 'ComputeMetrics' >> beam.Map(lambda x: (x[0], metrics.result(x[1])))
+      )  # pyformat: ignore
+
+      # pylint: enable=no-value-for-parameter
+
+      def check_result(got):
+        try:
+          self.assertLen(got, 1)
+          got_slice_key, got_metrics = got[0]
+          self.assertEqual(got_slice_key, ())
+          self.assertLen(got_metrics, expected_metrics_nums)
+          for metrics_key in expected_metrics_keys:
+            self.assertIn(metrics_key, got_metrics)
+        except AssertionError as err:
+          raise util.BeamAssertException(err)
+
+      util.assert_that(result, check_result, label='result')
 
+  @parameterized.named_parameters(('_has_weight', [{
+      'labels': np.array([0.0]),
+      'predictions': np.array([0.1]),
+      'example_weights': np.array([1.0]),
+  }, {
+      'labels': np.array([0.0]),
+      'predictions': np.array([0.7]),
+      'example_weights': np.array([3.0]),
+  }], {}, {
+      metric_types.MetricKey(
+          name='fairness_indicators_metrics/negative_rate@0.5'):
+          0.25,
+      metric_types.MetricKey(
+          name='fairness_indicators_metrics/positive_rate@0.5'):
+          0.75,
+      metric_types.MetricKey(
+          name='fairness_indicators_metrics/true_negative_rate@0.5'):
+          0.25,
+      metric_types.MetricKey(
+          name='fairness_indicators_metrics/false_positive_rate@0.5'):
+          0.75
+  }), ('_has_model_name', [{
+      'labels': np.array([0.0]),
+      'predictions': {
+          'model1': np.array([0.1]),
+      },
+      'example_weights': np.array([1.0]),
+  }, {
+      'labels': np.array([0.0]),
+      'predictions': {
+          'model1': np.array([0.7]),
+      },
+      'example_weights': np.array([3.0]),
+  }], {
+      'model_names': ['model1']
+  }, {
+      metric_types.MetricKey(
+          name='fairness_indicators_metrics/negative_rate@0.5',
+          model_name='model1'):
+          0.25,
+      metric_types.MetricKey(
+          name='fairness_indicators_metrics/positive_rate@0.5',
+          model_name='model1'):
+          0.75,
+      metric_types.MetricKey(
+          name='fairness_indicators_metrics/true_negative_rate@0.5',
+          model_name='model1'):
+          0.25,
+      metric_types.MetricKey(
+          name='fairness_indicators_metrics/false_positive_rate@0.5',
+          model_name='model1'):
+          0.75
+  }))
+  def testFairessIndicatorsMetricsWithInput(self, input_examples,
+                                            computations_kwargs,
+                                            expected_result):
+    computations = fairness_indicators.FairnessIndicators(
+        thresholds=[0.5]).computations(**computations_kwargs)
+    histogram = computations[0]
+    matrices = computations[1]
+    metrics = computations[2]
+
+    with beam.Pipeline() as pipeline:
+      # pylint: disable=no-value-for-parameter
+      result = (
+          pipeline
+          | 'Create' >> beam.Create(input_examples)
+          | 'Process' >> beam.Map(metric_util.to_standard_metric_inputs)
+          | 'AddSlice' >> beam.Map(lambda x: ((), x))
+          | 'ComputeHistogram' >> beam.CombinePerKey(histogram.combiner)
+          | 'ComputeMatrices' >> beam.Map(
+              lambda x: (x[0], matrices.result(x[1])))  # pyformat: ignore
+          | 'ComputeMetrics' >> beam.Map(lambda x: (x[0], metrics.result(x[1])))
+      )  # pyformat: ignore
+
+      # pylint: enable=no-value-for-parameter
+
+      def check_result(got):
+        try:
+          self.assertLen(got, 1)
+          got_slice_key, got_metrics = got[0]
+          self.assertEqual(got_slice_key, ())
+          self.assertLen(got_metrics, 6)  # 1 threshold * 6 metrics
+          for metrics_key in expected_result:
+            self.assertEqual(got_metrics[metrics_key],
+                             expected_result[metrics_key])
         except AssertionError as err:
           raise util.BeamAssertException(err)
 
       util.assert_that(result, check_result, label='result')
 
 
+# Todo(b/147497357): Add counter test once we have counter setup.
+
 if __name__ == '__main__':
   tf.test.main()