opendatahub-io · dtrifiro · Sep 23, 2024 · Sep 17, 2024 · Sep 17, 2024 · Sep 23, 2024
diff --git a/.github/workflows/tests.yaml b/.github/workflows/tests.yaml
@@ -29,10 +29,10 @@ jobs:
       fail-fast: false
       matrix:
         os: [ubuntu-latest]
-        pyv: ["3.11"]
+        pyv: ["3.12"]
         vllm_version:
           # - "" # skip the pypi version as it will not work on CPU
-          - "git+https://github.com/vllm-project/[email protected]"
+          - "git+https://github.com/vllm-project/[email protected].post2"
           - "git+https://github.com/vllm-project/vllm@main"
           - "git+https://github.com/opendatahub-io/vllm@main"
 

diff --git a/src/vllm_tgis_adapter/http.py b/src/vllm_tgis_adapter/http.py
@@ -3,11 +3,15 @@
 from typing import TYPE_CHECKING
 
 from vllm.entrypoints.launcher import serve_http
-from vllm.entrypoints.openai.api_server import (
-    init_app,
-)
+from vllm.entrypoints.openai.api_server import build_app
 from vllm.logger import init_logger
 
+try:
+    from vllm.entrypoints.openai.api_server import init_app
+except ImportError:  # vllm > 0.6.1.post2
+    from vllm.entrypoints.openai.api_server import init_app_state
+
+
 if TYPE_CHECKING:
     import argparse
 
@@ -27,7 +31,12 @@ async def run_http_server(
     # modified copy of vllm.entrypoints.openai.api_server.run_server that
     # allows passing of the engine
 
-    app = await init_app(engine, args)  # type: ignore[arg-type]
+    try:
+        app = await init_app(engine, args)  # type: ignore[arg-type]
+    except NameError:  # vllm > 0.6.1.post2
+        app = build_app(args)
+        model_config = await engine.get_model_config()
+        init_app_state(engine, model_config, app.state, args)
 
     serve_kwargs = {
         "host": args.host,

diff --git a/tests/conftest.py b/tests/conftest.py
@@ -35,7 +35,7 @@
 @pytest.fixture
 def lora_available() -> bool:
     # lora does not work on cpu
-    return not vllm.config.is_cpu()
+    return not vllm.config.current_platform.is_cpu()
 
 
 @pytest.fixture