chore: init reasoning_parser on manager

aarnphm · aarnphm · commit 7a774543cc4d · 2025-04-14T09:11:54.000Z
Signed-off-by: Aaron Pham &lt;contact@aarnphm.xyz&gt;
diff --git a/vllm/reasoning/abs_reasoning_parsers.py b/vllm/reasoning/abs_reasoning_parsers.py
@@ -106,7 +106,7 @@ class ReasoningParserManager:
     reasoning_parsers: dict[str, type] = {}
 
     @classmethod
-    def get_reasoning_parser(cls, name) -> type:
+    def get_reasoning_parser(cls, name: str) -> type[ReasoningParser]:
         """
         Get reasoning parser by name which is registered by `register_module`.
 
diff --git a/vllm/v1/structured_output/__init__.py b/vllm/v1/structured_output/__init__.py
@@ -7,6 +7,7 @@
 
 from vllm.config import VllmConfig
 from vllm.logger import init_logger
+from vllm.reasoning import ReasoningParserManager
 from vllm.transformers_utils.tokenizer_group import init_tokenizer_from_configs
 from vllm.v1.structured_output.backend_guidance import GuidanceBackend
 from vllm.v1.structured_output.backend_types import (StructuredOutputBackend,
@@ -18,6 +19,7 @@
     import numpy.typing as npt
     import torch
 
+    from vllm.reasoning import ReasoningParser
     from vllm.v1.request import Request
 
 logger = init_logger(__name__)
@@ -28,6 +30,7 @@ class StructuredOutputManager:
 
     def __init__(self, vllm_config: VllmConfig):
         self.backend: Optional[StructuredOutputBackend] = None
+        self.reasoner: Optional[ReasoningParser] = None
         self.vllm_config = vllm_config
         self._grammar_bitmask: Optional[torch.Tensor] = None
 
@@ -72,6 +75,12 @@ def grammar_init(self, request: Request) -> None:
                 raise ValueError(
                     f"Unsupported structured output backend: {backend_name}")
 
+            if (reasoning_backend :=
+                    self.vllm_config.decoding_config.reasoning_backend
+                ) is not None and self.reasoner is None:
+                self.reasoner = ReasoningParserManager.get_reasoning_parser(
+                    reasoning_backend)(tokenizer=tokenizer)
+
         grammar = self.executor.submit(self._async_create_grammar, request)
         request.structured_output_request.grammar = grammar  # type: ignore[assignment]