Add endpoint configuration component (hiyouga#31)

gcheron · web-flow · commit b586449d8c8b · 2025-06-02T15:50:28.000+02:00
![image](https://github.com/user-attachments/assets/d4cf9d1d-2d92-4ec5-bfd5-0eba27e4937b) Refs: NOTICKET
diff --git a/code/rag/run_rag.py b/code/rag/run_rag.py
@@ -10,6 +10,56 @@
 rag_pipeline = RagPipeline(chunk_size=500, chunk_overlap=50, use_tools=False)
 
 
+def get_endpoint_config():
+    config = rag_pipeline.get_endpoint_config()
+    return [
+        config.get("llm_model_name", ""),
+        config.get("llm_api_key", ""),
+        config.get("llm_url", ""),
+        config.get("embeddings_model_name", ""),
+        config.get("embeddings_api_key", ""),
+        config.get("embeddings_url", ""),
+    ]
+
+
+def set_endpoint_config(
+    llm_model_name,
+    llm_api_key,
+    llm_url,
+    embeddings_model_name,
+    embeddings_api_key,
+    embeddings_url,
+):
+    config = {
+        "llm_model_name": llm_model_name,
+        "llm_api_key": llm_api_key,
+        "llm_url": llm_url,
+        "embeddings_model_name": embeddings_model_name,
+        "embeddings_api_key": embeddings_api_key,
+        "embeddings_url": embeddings_url,
+    }
+    try:
+        rag_pipeline.set_endpoint_config(config)
+        error_msg = ""
+        error_visible = False
+    except Exception as e:
+        error_msg = f"<span style='color:red; font-weight:bold;'>Error: {e}</span>"
+        error_visible = True
+    config_values = get_endpoint_config()
+    doc_list, file_table = clear_document_list()
+    return (
+        *config_values,
+        doc_list,
+        file_table,
+        gr.update(value=error_msg, visible=error_visible),
+    )
+
+
+def toggle_api_key_visibility(visible, value):
+    type = "text" if visible else "password"
+    return gr.Textbox(label="API Key", type=type, value=value)
+
+
 def clear_history():
     new_id = uuid4()
     print(f"New thread_id: {new_id}")
@@ -95,6 +145,84 @@ def add_document(new_docs, doc_list):
         with gr.Column(scale=1):
             clear_doc_button = gr.ClearButton(value="Clear all documents")
 
+    with gr.Accordion("Endpoint Configuration", open=False):
+        llm_model_name = gr.Textbox(label="LLM Model Name")
+        llm_url = gr.Textbox(label="LLM URL")
+        with gr.Row():
+            llm_api_key = gr.Textbox(
+                placeholder="LLM API Key",
+                type="password",
+                scale=4,
+                show_label=False,
+            )
+            llm_api_key_visible = gr.Checkbox(
+                label="Show LLM API Key",
+                value=False,
+                scale=1,
+            )
+        embeddings_model_name = gr.Textbox(label="Embeddings Model Name")
+        embeddings_url = gr.Textbox(label="Embeddings URL")
+        with gr.Row():
+            embeddings_api_key = gr.Textbox(
+                label="Embeddings API Key",
+                type="password",
+                scale=4,
+                show_label=False,
+            )
+            embeddings_api_key_visible = gr.Checkbox(
+                label="Show Embeddings API Key",
+                value=False,
+                scale=1,
+            )
+        save_btn = gr.Button("Save")
+        config_error = gr.Markdown(value="", visible=False)
+
+    # Prefill on load
+    demo.load(
+        get_endpoint_config,
+        inputs=None,
+        outputs=[
+            llm_model_name,
+            llm_api_key,
+            llm_url,
+            embeddings_model_name,
+            embeddings_api_key,
+            embeddings_url,
+        ],
+    )
+
+    save_btn.click(
+        set_endpoint_config,
+        inputs=[
+            llm_model_name,
+            llm_api_key,
+            llm_url,
+            embeddings_model_name,
+            embeddings_api_key,
+            embeddings_url,
+        ],
+        outputs=[
+            llm_model_name,
+            llm_api_key,
+            llm_url,
+            embeddings_model_name,
+            embeddings_api_key,
+            embeddings_url,
+            doc_list,
+            file_table.dataset,
+            config_error,
+        ],
+    )
+    llm_api_key_visible.change(
+        toggle_api_key_visibility,
+        inputs=[llm_api_key_visible, llm_api_key],
+        outputs=llm_api_key,
+    )
+    embeddings_api_key_visible.change(
+        toggle_api_key_visibility,
+        inputs=[embeddings_api_key_visible, embeddings_api_key],
+        outputs=embeddings_api_key,
+    )
     chatbot.clear(clear_history, outputs=[uuid_state, chatbot])
 
     chat_msg = chat_input.submit(
diff --git a/code/rag/src/rag_pipeline.py b/code/rag/src/rag_pipeline.py
@@ -59,6 +59,14 @@ def __init__(
         self.vector_store: InMemoryVectorStore
         self.prompt: PromptTemplate
         self.graph: StateGraph
+        self.llm_model_name: str
+        self.llm_api_key: str
+        self.llm_url: str
+        self.embeddings_model_name: str
+        self.embeddings_api_key: str
+        self.embeddings_url: str
+
+        self._set_endpoint_config()
         self._set_models()
         self._set_vector_store()
         self._set_graph()
@@ -94,23 +102,57 @@ def _check_env(self) -> None:
                 "Please set the EMBEDDINGS_MODEL_NAME environment variable."
             )
 
-    def _set_models(self) -> None:
+    def get_endpoint_config(self) -> dict:
+        return {
+            "llm_model_name": self.llm_model_name,
+            "llm_api_key": self.llm_api_key,
+            "llm_url": self.llm_url,
+            "embeddings_model_name": self.embeddings_model_name,
+            "embeddings_api_key": self.embeddings_api_key,
+            "embeddings_url": self.embeddings_url,
+        }
+
+    def set_endpoint_config(self, config: dict) -> None:
+        for key, value in config.items():
+            if key not in [
+                "llm_model_name",
+                "llm_api_key",
+                "llm_url",
+                "embeddings_model_name",
+                "embeddings_api_key",
+                "embeddings_url",
+            ]:
+                raise ValueError(f"Invalid config key: {key}")
+            setattr(self, key, value)
+        self._set_models()
+        self._set_vector_store()
+
+    def _set_endpoint_config(
+        self,
+    ) -> None:
         self._check_env()
+        self.llm_model_name = os.getenv("LLM_MODEL_NAME")
+        self.llm_api_key = os.getenv("LLM_API_KEY")
+        self.llm_url = os.getenv("LLM_URL")
+        self.embeddings_model_name = os.getenv("EMBEDDINGS_MODEL_NAME")
+        self.embeddings_api_key = os.getenv("EMBEDDINGS_API_KEY")
+        self.embeddings_url = os.getenv("EMBEDDINGS_URL")
 
-        config = AutoConfig.from_pretrained(os.getenv("EMBEDDINGS_MODEL_NAME"))
+    def _set_models(self) -> None:
+        config = AutoConfig.from_pretrained(self.embeddings_model_name)
         assert self.chunk_size <= config.max_position_embeddings
 
         llm = ChatOpenAI(
-            model_name=os.getenv("LLM_MODEL_NAME"),
-            openai_api_key=os.getenv("LLM_API_KEY"),
-            openai_api_base=os.getenv("LLM_URL") + "/v1",
+            model_name=self.llm_model_name,
+            openai_api_key=self.llm_api_key,
+            openai_api_base=self.llm_url + "/v1",
         )
 
         embeddings = OpenAIEmbeddings(
-            model=os.getenv("EMBEDDINGS_MODEL_NAME"),
-            deployment=os.getenv("EMBEDDINGS_MODEL_NAME"),
-            openai_api_key=os.getenv("EMBEDDINGS_API_KEY"),
-            openai_api_base=os.getenv("EMBEDDINGS_URL") + "/v1",
+            model=self.embeddings_model_name,
+            deployment=self.embeddings_model_name,
+            openai_api_key=self.embeddings_api_key,
+            openai_api_base=self.embeddings_url + "/v1",
             tiktoken_enabled=False,
         )
         self.llm = llm