[Misc] Fix minor typo in scheduler (vllm-project#8765)

wooyeonlee0 · sumitd2 · commit 980edb83f3e6 · 2024-11-14T10:35:11.000-05:00
Signed-off-by: Sumit Dubey &lt;sumit.dubey2@ibm.com&gt;
diff --git a/vllm/core/scheduler.py b/vllm/core/scheduler.py
@@ -1554,14 +1554,14 @@ def _get_num_new_tokens(self, seq_group: SequenceGroup,
                 # the number of new tokens that is dividable by the block size
                 # to avoid partial block matching.
                 block_size = self.cache_config.block_size
-                reminder = budget.token_budget % block_size
-                if reminder != 0:
+                remainder = budget.token_budget % block_size
+                if remainder != 0:
                     raise ValueError("When enabling chunked prefill and "
                                      "prefix caching, max_num_batched_tokens "
                                      "(chunk size) must be dividable by "
                                      "block size, but got chunk_size "
                                      f"({budget.token_budget}) % block_size "
-                                     f"({block_size}) = {reminder}")
+                                     f"({block_size}) = {remainder}")
                 if remaining_token_budget < num_new_tokens:
                     num_new_tokens = (remaining_token_budget //
                                       block_size) * block_size