Merge branch 'main' into develop

gabrielmbmb · gabrielmbmb · commit 86d4e802ae42 · 2024-07-12T13:10:18.000+02:00
diff --git a/src/distilabel/steps/tasks/base.py b/src/distilabel/steps/tasks/base.py
@@ -91,21 +91,20 @@ def format_output(
     def _format_outputs(
         self,
         outputs: "GenerateOutput",
-        inputs: Union[List[Dict[str, Any]], None] = None,
+        input: Union[Dict[str, Any], None] = None,
     ) -> List[Dict[str, Any]]:
         """Formats the outputs of the task using the `format_output` method. If the output
         is `None` (i.e. the LLM failed to generate a response), then the outputs will be
         set to `None` as well.
 
         Args:
-            outputs: The outputs of the LLM.
-            inputs: The inputs used to generate the outputs.
+            outputs: The outputs (`n` generations) for the provided `input`.
+            input: The input used to generate the output.
 
         Returns:
             A list containing a dictionary with the outputs of the task for each input.
         """
-        if inputs is None:
-            inputs = [None]  # type: ignore
+        inputs = [None] if input is None else [input]
 
         formatted_outputs = []
         for output, input in zip(outputs, inputs * len(outputs)):  # type: ignore
@@ -195,6 +194,7 @@ def process(self, inputs: StepInput) -> "StepOutput":  # type: ignore
 
         formatted_inputs = self._format_inputs(inputs)
 
+        # `outputs` is a list containing a list of generations per input
         outputs = self.llm.generate(
             inputs=formatted_inputs,
             num_generations=self.num_generations,  # type: ignore
@@ -203,7 +203,7 @@ def process(self, inputs: StepInput) -> "StepOutput":  # type: ignore
 
         task_outputs = []
         for input, input_outputs in zip(inputs, outputs):
-            formatted_outputs = self._format_outputs(input_outputs, inputs)
+            formatted_outputs = self._format_outputs(input_outputs, input)
 
             if self.group_generations:
                 combined = group_dicts(*formatted_outputs)
diff --git a/tests/unit/steps/tasks/test_base.py b/tests/unit/steps/tasks/test_base.py
@@ -31,16 +31,22 @@
 class DummyTask(Task):
     @property
     def inputs(self) -> List[str]:
-        return ["instruction"]
+        return ["instruction", "additional_info"]
 
     def format_input(self, input: Dict[str, Any]) -> "ChatType":
         return [
             {"role": "system", "content": ""},
             {"role": "user", "content": input["instruction"]},
         ]
 
-    def format_output(self, output: Union[str, None], input: Dict[str, Any]) -> dict:
-        return {"output": output}
+    @property
+    def outputs(self) -> List[str]:
+        return ["output", "info_from_input"]
+
+    def format_output(
+        self, output: Union[str, None], input: Union[Dict[str, Any], None] = None
+    ) -> Dict[str, Any]:
+        return {"output": output, "info_from_input": input["additional_info"]}  # type: ignore
 
 
 class DummyRuntimeLLM(DummyLLM):
@@ -85,37 +91,139 @@ def test_with_errors(self, caplog: pytest.LogCaptureFixture) -> None:
             Task(name="task", llm=DummyLLM())  # type: ignore
 
     @pytest.mark.parametrize(
-        "group_generations, expected",
+        "input, group_generations, expected",
         [
             (
+                [
+                    {"instruction": "test_0", "additional_info": "additional_info_0"},
+                    {"instruction": "test_1", "additional_info": "additional_info_1"},
+                    {"instruction": "test_2", "additional_info": "additional_info_2"},
+                ],
                 False,
                 [
                     {
-                        "instruction": "test",
+                        "instruction": "test_0",
+                        "additional_info": "additional_info_0",
+                        "output": "output",
+                        "info_from_input": "additional_info_0",
+                        "model_name": "test",
+                        "distilabel_metadata": {"raw_output_task": "output"},
+                    },
+                    {
+                        "instruction": "test_0",
+                        "additional_info": "additional_info_0",
+                        "output": "output",
+                        "info_from_input": "additional_info_0",
+                        "model_name": "test",
+                        "distilabel_metadata": {"raw_output_task": "output"},
+                    },
+                    {
+                        "instruction": "test_0",
+                        "additional_info": "additional_info_0",
+                        "output": "output",
+                        "info_from_input": "additional_info_0",
+                        "model_name": "test",
+                        "distilabel_metadata": {"raw_output_task": "output"},
+                    },
+                    {
+                        "instruction": "test_1",
+                        "additional_info": "additional_info_1",
+                        "output": "output",
+                        "info_from_input": "additional_info_1",
+                        "model_name": "test",
+                        "distilabel_metadata": {"raw_output_task": "output"},
+                    },
+                    {
+                        "instruction": "test_1",
+                        "additional_info": "additional_info_1",
+                        "output": "output",
+                        "info_from_input": "additional_info_1",
+                        "model_name": "test",
+                        "distilabel_metadata": {"raw_output_task": "output"},
+                    },
+                    {
+                        "instruction": "test_1",
+                        "additional_info": "additional_info_1",
                         "output": "output",
+                        "info_from_input": "additional_info_1",
                         "model_name": "test",
                         "distilabel_metadata": {"raw_output_task": "output"},
                     },
                     {
-                        "instruction": "test",
+                        "instruction": "test_2",
+                        "additional_info": "additional_info_2",
                         "output": "output",
+                        "info_from_input": "additional_info_2",
                         "model_name": "test",
                         "distilabel_metadata": {"raw_output_task": "output"},
                     },
                     {
-                        "instruction": "test",
+                        "instruction": "test_2",
+                        "additional_info": "additional_info_2",
                         "output": "output",
+                        "info_from_input": "additional_info_2",
+                        "model_name": "test",
+                        "distilabel_metadata": {"raw_output_task": "output"},
+                    },
+                    {
+                        "instruction": "test_2",
+                        "additional_info": "additional_info_2",
+                        "output": "output",
+                        "info_from_input": "additional_info_2",
                         "model_name": "test",
                         "distilabel_metadata": {"raw_output_task": "output"},
                     },
                 ],
             ),
             (
+                [
+                    {"instruction": "test_0", "additional_info": "additional_info_0"},
+                    {"instruction": "test_1", "additional_info": "additional_info_1"},
+                    {"instruction": "test_2", "additional_info": "additional_info_2"},
+                ],
                 True,
                 [
                     {
-                        "instruction": "test",
+                        "instruction": "test_0",
+                        "additional_info": "additional_info_0",
+                        "output": ["output", "output", "output"],
+                        "info_from_input": [
+                            "additional_info_0",
+                            "additional_info_0",
+                            "additional_info_0",
+                        ],
+                        "model_name": "test",
+                        "distilabel_metadata": [
+                            {"raw_output_task": "output"},
+                            {"raw_output_task": "output"},
+                            {"raw_output_task": "output"},
+                        ],
+                    },
+                    {
+                        "instruction": "test_1",
+                        "additional_info": "additional_info_1",
+                        "output": ["output", "output", "output"],
+                        "info_from_input": [
+                            "additional_info_1",
+                            "additional_info_1",
+                            "additional_info_1",
+                        ],
+                        "model_name": "test",
+                        "distilabel_metadata": [
+                            {"raw_output_task": "output"},
+                            {"raw_output_task": "output"},
+                            {"raw_output_task": "output"},
+                        ],
+                    },
+                    {
+                        "instruction": "test_2",
+                        "additional_info": "additional_info_2",
                         "output": ["output", "output", "output"],
+                        "info_from_input": [
+                            "additional_info_2",
+                            "additional_info_2",
+                            "additional_info_2",
+                        ],
                         "model_name": "test",
                         "distilabel_metadata": [
                             {"raw_output_task": "output"},
@@ -128,7 +236,10 @@ def test_with_errors(self, caplog: pytest.LogCaptureFixture) -> None:
         ],
     )
     def test_process(
-        self, group_generations: bool, expected: List[Dict[str, Any]]
+        self,
+        input: List[Dict[str, str]],
+        group_generations: bool,
+        expected: List[Dict[str, Any]],
     ) -> None:
         pipeline = Pipeline(name="unit-test-pipeline")
         llm = DummyLLM()
@@ -139,7 +250,7 @@ def test_process(
             group_generations=group_generations,
             num_generations=3,
         )
-        result = next(task.process([{"instruction": "test"}]))
+        result = next(task.process(input))
         assert result == expected
 
     def test_process_with_runtime_parameters(self) -> None: