fix(generate): rm max output tokens

terryyz · terryyz · commit e380adffdabc · 2024-12-21T02:08:03.000+08:00
diff --git a/bigcodebench/gen/util/google_request.py b/bigcodebench/gen/util/google_request.py
@@ -11,12 +11,16 @@ def make_request(
     n: int,
     max_new_tokens: int = 2048,
 ) -> genai.types.GenerateContentResponse:
+    kwargs = {"temperature": temperature, "max_output_tokens": max_new_tokens}
+
+    if "-thinking-" in client.model_name:
+        kwargs.pop("max_output_tokens")
+
     response = client.generate_content(
         [{"role": "user", "parts": [message]}],
         generation_config=genai.types.GenerationConfig(
             candidate_count=n,
-            max_output_tokens=max_new_tokens,
-            temperature=temperature,
+            **kwargs
         ),
         safety_settings=[
             {"category": "HARM_CATEGORY_DANGEROUS_CONTENT", "threshold": "BLOCK_NONE"},
@@ -44,5 +48,4 @@ def make_auto_request(*args, **kwargs) -> genai.types.GenerateContentResponse:
             print("Unknown error. Waiting...")
             print(e)
             time.sleep(1)
-    return ret
-
+    return ret