[TPU][Bugfix] fix OOM issue in CI test (vllm-project#21550)

yaochengji · jinzhen-lin · commit 10b5a35060c7 · 2025-08-09T13:03:46.000+08:00
Signed-off-by: Chengji Yao &lt;chengjiyao@google.com&gt;
Signed-off-by: Jinzhen Lin &lt;linjinzhen@hotmail.com&gt;
diff --git a/tests/v1/tpu/test_basic.py b/tests/v1/tpu/test_basic.py
@@ -59,7 +59,7 @@ def test_basic(
                 # actually test chunked prompt
                 max_num_batched_tokens=1024,
                 max_model_len=8192,
-                gpu_memory_utilization=0.7,
+                gpu_memory_utilization=0.95,
                 max_num_seqs=max_num_seqs,
                 tensor_parallel_size=tensor_parallel_size) as vllm_model:
             vllm_outputs = vllm_model.generate_greedy(example_prompts,