sgl-project · merrymercy · Jul 25, 2025 · Jul 25, 2025 · gemini-code-assist · Jul 25, 2025
diff --git a/test/srt/test_vllm_dependency.py b/test/srt/test_vllm_dependency.py
@@ -17,8 +17,8 @@
 )
 
 MODEL_SCORE_THRESHOLDS = {
-    "hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4": 0.83,
-    "hugging-quants/Meta-Llama-3.1-8B-Instruct-GPTQ-INT4": 0.83,
+    "hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4": 0.825,
+    "hugging-quants/Meta-Llama-3.1-8B-Instruct-GPTQ-INT4": 0.825,
-    "hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4": 0.825,
-    "hugging-quants/Meta-Llama-3.1-8B-Instruct-GPTQ-INT4": 0.825,
+    "hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4": 0.825,  # Lowered from 0.83 to address flakiness. See PR #...
+    "hugging-quants/Meta-Llama-3.1-8B-Instruct-GPTQ-INT4": 0.825,  # Lowered from 0.83 to address flakiness. See PR #...
-    "hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4": 0.825,
-    "hugging-quants/Meta-Llama-3.1-8B-Instruct-GPTQ-INT4": 0.825,
+    "hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4": 0.825,  # Lowered from 0.83 to address flakiness. See PR #...
+    "hugging-quants/Meta-Llama-3.1-8B-Instruct-GPTQ-INT4": 0.825,  # Lowered from 0.83 to address flakiness. See PR #...
     "hugging-quants/Mixtral-8x7B-Instruct-v0.1-AWQ-INT4": 0.62,
 }