ogx-ai
diff --git a/‎.stats.yml‎
Lines changed: 2 additions & 2 deletions b/‎.stats.yml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎src/llama_stack_client/resources/chat/completions.py‎
Lines changed: 22 additions & 0 deletions b/‎src/llama_stack_client/resources/chat/completions.py‎
Lines changed: 22 additions & 0 deletions
diff --git a/‎src/llama_stack_client/resources/responses/responses.py‎
Lines changed: 22 additions & 0 deletions b/‎src/llama_stack_client/resources/responses/responses.py‎
Lines changed: 22 additions & 0 deletions
diff --git a/‎src/llama_stack_client/types/chat/completion_create_params.py‎
Lines changed: 3 additions & 0 deletions b/‎src/llama_stack_client/types/chat/completion_create_params.py‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎src/llama_stack_client/types/chat/completion_create_response.py‎
Lines changed: 16 additions & 13 deletions b/‎src/llama_stack_client/types/chat/completion_create_response.py‎
Lines changed: 16 additions & 13 deletions
@@ -1,4 +1,4 @@
 configured_endpoints: 108
-openapi_spec_url: https://storage.googleapis.com/stainless-sdk-openapi-specs/llamastack%2Fllama-stack-client-5c711749dbcc9575d8997ac3e0b2a2e45e20ef8de212cdb0fcceb7009b34cc48.yml
-openapi_spec_hash: 8107eabfac6b422964ac2a6688844181
+openapi_spec_url: https://storage.googleapis.com/stainless-sdk-openapi-specs/llamastack%2Fllama-stack-client-10d6272b97f89f39692d8a734fe1e42de97b2ccc1cd56bc16113d15dff59b8dc.yml
+openapi_spec_hash: 69cdb9b6b2edc70ac3c70761a352d992
 config_hash: 6aa61d4143c3e3df785972c0287d1370
@@ -75,6 +75,7 @@ def create(
         response_format: Optional[completion_create_params.ResponseFormat] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
         seed: Optional[int] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         stop: Union[str, SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Omit = omit,
         stream_options: Optional[Dict[str, object]] | Omit = omit,
@@ -130,6 +131,8 @@ def create(
 
           seed: The seed to use.
 
+          service_tier: The service tier for the request.
+
           stop: The stop tokens to use.
 
           stream: Whether to stream the response.
@@ -180,6 +183,7 @@ def create(
         response_format: Optional[completion_create_params.ResponseFormat] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
         seed: Optional[int] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         stop: Union[str, SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[Dict[str, object]] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -236,6 +240,8 @@ def create(
 
           seed: The seed to use.
 
+          service_tier: The service tier for the request.
+
           stop: The stop tokens to use.
 
           stream_options: The stream options to use.
@@ -284,6 +290,7 @@ def create(
         response_format: Optional[completion_create_params.ResponseFormat] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
         seed: Optional[int] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         stop: Union[str, SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[Dict[str, object]] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -340,6 +347,8 @@ def create(
 
           seed: The seed to use.
 
+          service_tier: The service tier for the request.
+
           stop: The stop tokens to use.
 
           stream_options: The stream options to use.
@@ -387,6 +396,7 @@ def create(
         response_format: Optional[completion_create_params.ResponseFormat] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
         seed: Optional[int] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         stop: Union[str, SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Literal[True] | Omit = omit,
         stream_options: Optional[Dict[str, object]] | Omit = omit,
@@ -424,6 +434,7 @@ def create(
                     "response_format": response_format,
                     "safety_identifier": safety_identifier,
                     "seed": seed,
+                    "service_tier": service_tier,
                     "stop": stop,
                     "stream": stream,
                     "stream_options": stream_options,
@@ -577,6 +588,7 @@ async def create(
         response_format: Optional[completion_create_params.ResponseFormat] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
         seed: Optional[int] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         stop: Union[str, SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Omit = omit,
         stream_options: Optional[Dict[str, object]] | Omit = omit,
@@ -632,6 +644,8 @@ async def create(
 
           seed: The seed to use.
 
+          service_tier: The service tier for the request.
+
           stop: The stop tokens to use.
 
           stream: Whether to stream the response.
@@ -682,6 +696,7 @@ async def create(
         response_format: Optional[completion_create_params.ResponseFormat] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
         seed: Optional[int] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         stop: Union[str, SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[Dict[str, object]] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -738,6 +753,8 @@ async def create(
 
           seed: The seed to use.
 
+          service_tier: The service tier for the request.
+
           stop: The stop tokens to use.
 
           stream_options: The stream options to use.
@@ -786,6 +803,7 @@ async def create(
         response_format: Optional[completion_create_params.ResponseFormat] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
         seed: Optional[int] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         stop: Union[str, SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[Dict[str, object]] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -842,6 +860,8 @@ async def create(
 
           seed: The seed to use.
 
+          service_tier: The service tier for the request.
+
           stop: The stop tokens to use.
 
           stream_options: The stream options to use.
@@ -889,6 +909,7 @@ async def create(
         response_format: Optional[completion_create_params.ResponseFormat] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
         seed: Optional[int] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         stop: Union[str, SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Literal[True] | Omit = omit,
         stream_options: Optional[Dict[str, object]] | Omit = omit,
@@ -926,6 +947,7 @@ async def create(
                     "response_format": response_format,
                     "safety_identifier": safety_identifier,
                     "seed": seed,
+                    "service_tier": service_tier,
                     "stop": stop,
                     "stream": stream,
                     "stream_options": stream_options,
 
@@ -105,6 +105,7 @@ def create(
         prompt_cache_key: Optional[str] | Omit = omit,
         reasoning: Optional[response_create_params.Reasoning] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         store: Optional[bool] | Omit = omit,
         stream: Optional[Literal[False]] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -157,6 +158,8 @@ def create(
 
           safety_identifier: A stable identifier used for safety monitoring and abuse detection.
 
+          service_tier: The service tier for the request.
+
           store: Whether to store the response in the database.
 
           stream: Whether to stream the response.
@@ -221,6 +224,7 @@ def create(
         prompt_cache_key: Optional[str] | Omit = omit,
         reasoning: Optional[response_create_params.Reasoning] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         store: Optional[bool] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
         text: Optional[response_create_params.Text] | Omit = omit,
@@ -274,6 +278,8 @@ def create(
 
           safety_identifier: A stable identifier used for safety monitoring and abuse detection.
 
+          service_tier: The service tier for the request.
+
           store: Whether to store the response in the database.
 
           temperature: Sampling temperature.
@@ -336,6 +342,7 @@ def create(
         prompt_cache_key: Optional[str] | Omit = omit,
         reasoning: Optional[response_create_params.Reasoning] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         store: Optional[bool] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
         text: Optional[response_create_params.Text] | Omit = omit,
@@ -389,6 +396,8 @@ def create(
 
           safety_identifier: A stable identifier used for safety monitoring and abuse detection.
 
+          service_tier: The service tier for the request.
+
           store: Whether to store the response in the database.
 
           temperature: Sampling temperature.
@@ -450,6 +459,7 @@ def create(
         prompt_cache_key: Optional[str] | Omit = omit,
         reasoning: Optional[response_create_params.Reasoning] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         store: Optional[bool] | Omit = omit,
         stream: Optional[Literal[False]] | Literal[True] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -484,6 +494,7 @@ def create(
                     "prompt_cache_key": prompt_cache_key,
                     "reasoning": reasoning,
                     "safety_identifier": safety_identifier,
+                    "service_tier": service_tier,
                     "store": store,
                     "stream": stream,
                     "temperature": temperature,
@@ -692,6 +703,7 @@ async def create(
         prompt_cache_key: Optional[str] | Omit = omit,
         reasoning: Optional[response_create_params.Reasoning] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         store: Optional[bool] | Omit = omit,
         stream: Optional[Literal[False]] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -744,6 +756,8 @@ async def create(
 
           safety_identifier: A stable identifier used for safety monitoring and abuse detection.
 
+          service_tier: The service tier for the request.
+
           store: Whether to store the response in the database.
 
           stream: Whether to stream the response.
@@ -808,6 +822,7 @@ async def create(
         prompt_cache_key: Optional[str] | Omit = omit,
         reasoning: Optional[response_create_params.Reasoning] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         store: Optional[bool] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
         text: Optional[response_create_params.Text] | Omit = omit,
@@ -861,6 +876,8 @@ async def create(
 
           safety_identifier: A stable identifier used for safety monitoring and abuse detection.
 
+          service_tier: The service tier for the request.
+
           store: Whether to store the response in the database.
 
           temperature: Sampling temperature.
@@ -923,6 +940,7 @@ async def create(
         prompt_cache_key: Optional[str] | Omit = omit,
         reasoning: Optional[response_create_params.Reasoning] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         store: Optional[bool] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
         text: Optional[response_create_params.Text] | Omit = omit,
@@ -976,6 +994,8 @@ async def create(
 
           safety_identifier: A stable identifier used for safety monitoring and abuse detection.
 
+          service_tier: The service tier for the request.
+
           store: Whether to store the response in the database.
 
           temperature: Sampling temperature.
@@ -1037,6 +1057,7 @@ async def create(
         prompt_cache_key: Optional[str] | Omit = omit,
         reasoning: Optional[response_create_params.Reasoning] | Omit = omit,
         safety_identifier: Optional[str] | Omit = omit,
+        service_tier: Optional[Literal["auto", "default", "flex", "priority"]] | Omit = omit,
         store: Optional[bool] | Omit = omit,
         stream: Optional[Literal[False]] | Literal[True] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -1071,6 +1092,7 @@ async def create(
                     "prompt_cache_key": prompt_cache_key,
                     "reasoning": reasoning,
                     "safety_identifier": safety_identifier,
+                    "service_tier": service_tier,
                     "store": store,
                     "stream": stream,
                     "temperature": temperature,
 
@@ -95,6 +95,9 @@ class CompletionCreateParamsBase(TypedDict, total=False):
     seed: Optional[int]
     """The seed to use."""
 
+    service_tier: Optional[Literal["auto", "default", "flex", "priority"]]
+    """The service tier for the request."""
+
     stop: Union[str, SequenceNotStr[str], None]
     """The stop tokens to use."""
 
 
@@ -188,36 +188,36 @@ class Choice(BaseModel):
 
 
 class UsageCompletionTokensDetails(BaseModel):
-    """Token details for output tokens in OpenAI chat completion usage."""
+    """Detailed breakdown of output token usage."""
 
     reasoning_tokens: Optional[int] = None
     """Number of tokens used for reasoning (o1/o3 models)."""
 
 
 class UsagePromptTokensDetails(BaseModel):
-    """Token details for prompt tokens in OpenAI chat completion usage."""
+    """Detailed breakdown of input token usage."""
 
     cached_tokens: Optional[int] = None
     """Number of tokens retrieved from cache."""
 
 
 class Usage(BaseModel):
-    """Usage information for OpenAI chat completion."""
+    """Token usage information for the completion."""
 
-    completion_tokens: int
+    completion_tokens: Optional[int] = None
     """Number of tokens in the completion."""
 
-    prompt_tokens: int
-    """Number of tokens in the prompt."""
-
-    total_tokens: int
-    """Total tokens used (prompt + completion)."""
-
     completion_tokens_details: Optional[UsageCompletionTokensDetails] = None
-    """Token details for output tokens in OpenAI chat completion usage."""
+    """Detailed breakdown of output token usage."""
+
+    prompt_tokens: Optional[int] = None
+    """Number of tokens in the prompt."""
 
     prompt_tokens_details: Optional[UsagePromptTokensDetails] = None
-    """Token details for prompt tokens in OpenAI chat completion usage."""
+    """Detailed breakdown of input token usage."""
+
+    total_tokens: Optional[int] = None
+    """Total tokens used (prompt + completion)."""
 
 
 class CompletionCreateResponse(BaseModel):
@@ -238,5 +238,8 @@ class CompletionCreateResponse(BaseModel):
     object: Optional[Literal["chat.completion"]] = None
     """The object type."""
 
+    service_tier: Optional[str] = None
+    """The service tier that was used for this response."""
+
     usage: Optional[Usage] = None
-    """Usage information for OpenAI chat completion."""
+    """Token usage information for the completion."""