janhq · urmauur · Jul 22, 2025 · Jul 21, 2025 · Jul 21, 2025 · Jul 22, 2025
diff --git a/core/src/browser/extensions/engines/AIEngine.ts b/core/src/browser/extensions/engines/AIEngine.ts
@@ -231,7 +231,7 @@ export abstract class AIEngine extends BaseExtension {
   /**
    * Loads a model into memory
    */
-  abstract load(modelId: string): Promise<SessionInfo>
+  abstract load(modelId: string, settings?: any): Promise<SessionInfo>
 
   /**
    * Unloads a model from memory

diff --git a/web-app/src/containers/ModelSetting.tsx b/web-app/src/containers/ModelSetting.tsx
@@ -23,63 +23,63 @@
 }

 export function ModelSetting({
  model,
  provider,
  smallIcon,
 }: ModelSettingProps) {
  const { updateProvider } = useModelProvider()
  const { t } = useTranslation()

  // Create a debounced version of stopModel that waits 500ms after the last call
  const debouncedStopModel = debounce((modelId: string) => {
    stopModel(modelId)
  }, 500)

  const handleSettingChange = (
    key: string,
    value: string | boolean | number
  ) => {
    if (!provider) return

    // Create a copy of the model with updated settings
    const updatedModel = {
      ...model,
      settings: {
        ...model.settings,
        [key]: {
          ...(model.settings?.[key] != null ? model.settings?.[key] : {}),
          controller_props: {
            ...(model.settings?.[key]?.controller_props ?? {}),
            value: value,
          },
        },
      },
    }

    // Find the model index in the provider's models array
    const modelIndex = provider.models.findIndex((m) => m.id === model.id)

    if (modelIndex !== -1) {
      // Create a copy of the provider's models array
      const updatedModels = [...provider.models]

      // Update the specific model in the array
      updatedModels[modelIndex] = updatedModel as Model

      // Update the provider with the new models array
      updateProvider(provider.provider, {
        models: updatedModels,
      })

      const params = Object.entries(updatedModel.settings).reduce(
        (acc, [key, value]) => {
          const rawVal = value.controller_props?.value
          const num = parseFloat(rawVal as string)
          acc[key] = !isNaN(num) ? num : rawVal
          return acc
        },
        {} as Record<string, unknown>
      ) as ModelSettingParams

      updateModel({
        id: model.id,
@@ -87,8 +87,10 @@
         ...(params as unknown as object),
       })
 
-      // Call debounced stopModel after updating the model
-      debouncedStopModel(model.id)
+      // Call debounced stopModel only when updating ctx_len or ngl
+      if (key === 'ctx_len' || key === 'ngl') {
+        debouncedStopModel(model.id)
+      }
     }
   }
 
@@ -106,7 +108,9 @@
       </SheetTrigger>
       <SheetContent className="h-[calc(100%-8px)] top-1 right-1 rounded-e-md overflow-y-auto">
         <SheetHeader>
-          <SheetTitle>{t('common:modelSettings.title', { modelId: model.id })}</SheetTitle>
+          <SheetTitle>
+            {t('common:modelSettings.title', { modelId: model.id })}
+          </SheetTitle>
           <SheetDescription>
             {t('common:modelSettings.description')}
           </SheetDescription>

diff --git a/web-app/src/hooks/useChat.ts b/web-app/src/hooks/useChat.ts
@@ -261,14 +261,36 @@ export const useChat = () => {
           !abortController.signal.aborted &&
           activeProvider
         ) {
+          const modelConfig = activeProvider.models.find(
+            (m) => m.id === selectedModel?.id
+          )
+
+          const modelSettings = modelConfig?.settings
+            ? Object.fromEntries(
+                Object.entries(modelConfig.settings)
+                  .filter(
+                    ([key, value]) =>
+                      key !== 'ctx_len' &&
+                      key !== 'ngl' &&
+                      value.controller_props?.value !== undefined &&
+                      value.controller_props?.value !== null &&
+                      value.controller_props?.value !== ''
+                  )
+                  .map(([key, value]) => [key, value.controller_props?.value])
+              )
+            : undefined
+
           const completion = await sendCompletion(
             activeThread,
             activeProvider,
             builder.getMessages(),
             abortController,
             availableTools,
             currentAssistant.parameters?.stream === false ? false : true,
-            currentAssistant.parameters as unknown as Record<string, object>
+            {
+              ...modelSettings,
+              ...currentAssistant.parameters,
+            } as unknown as Record<string, object>
           )
 
           if (!completion) throw new Error('No completion received')

diff --git a/web-app/src/services/__tests__/models.test.ts b/web-app/src/services/__tests__/models.test.ts
@@ -1,4 +1,5 @@
 import { describe, it, expect, vi, beforeEach } from 'vitest'
+
 import {
   fetchModels,
   fetchModelCatalog,
@@ -10,9 +11,8 @@ import {
   stopModel,
   stopAllModels,
   startModel,
-  configurePullOptions,
 } from '../models'
-import { EngineManager } from '@janhq/core'
+import { EngineManager, Model } from '@janhq/core'
 
 // Mock EngineManager
 vi.mock('@janhq/core', () => ({
@@ -118,7 +118,7 @@ describe('models service', () => {
         settings: [{ key: 'temperature', value: 0.7 }],
       }
 
-      await updateModel(model)
+      await updateModel(model as any)
 
       expect(mockEngine.updateSettings).toHaveBeenCalledWith(model.settings)
     })
@@ -209,7 +209,14 @@ describe('models service', () => {
 
   describe('startModel', () => {
     it('should start model successfully', async () => {
-      const provider = { provider: 'openai', models: [] } as ProviderObject
+      const mockSettings = {
+        ctx_len: { controller_props: { value: 4096 } },
+        ngl: { controller_props: { value: 32 } },
+      }
+      const provider = {
+        provider: 'openai',
+        models: [{ id: 'model1', settings: mockSettings }],
+      } as any
       const model = 'model1'
       const mockSession = { id: 'session1' }
 
@@ -221,11 +228,21 @@ describe('models service', () => {
       const result = await startModel(provider, model)
 
       expect(result).toEqual(mockSession)
-      expect(mockEngine.load).toHaveBeenCalledWith(model)
+      expect(mockEngine.load).toHaveBeenCalledWith(model, {
+        ctx_size: 4096,
+        n_gpu_layers: 32,
+      })
     })
 
     it('should handle start model error', async () => {
-      const provider = { provider: 'openai', models: [] } as ProviderObject
+      const mockSettings = {
+        ctx_len: { controller_props: { value: 4096 } },
+        ngl: { controller_props: { value: 32 } },
+      }
+      const provider = {
+        provider: 'openai',
+        models: [{ id: 'model1', settings: mockSettings }],
+      } as any
       const model = 'model1'
       const error = new Error('Failed to start model')
 
@@ -237,7 +254,14 @@ describe('models service', () => {
       await expect(startModel(provider, model)).rejects.toThrow(error)
     })
     it('should not load model again', async () => {
-      const provider = { provider: 'openai', models: [] } as ProviderObject
+      const mockSettings = {
+        ctx_len: { controller_props: { value: 4096 } },
+        ngl: { controller_props: { value: 32 } },
+      }
+      const provider = {
+        provider: 'openai',
+        models: [{ id: 'model1', settings: mockSettings }],
+      } as any
       const model = 'model1'
 
       mockEngine.getLoadedModels.mockResolvedValue({

diff --git a/web-app/src/services/models.ts b/web-app/src/services/models.ts
@@ -150,7 +150,29 @@ export const startModel = async (
   if (!engine) return undefined
 
   if ((await engine.getLoadedModels()).includes(model)) return undefined
-  return engine.load(model).catch((error) => {
+
+  // Find the model configuration to get settings
+  const modelConfig = provider.models.find((m) => m.id === model)
+
+  // Key mapping function to transform setting keys
+  const mapSettingKey = (key: string): string => {
+    const keyMappings: Record<string, string> = {
+      ctx_len: 'ctx_size',
+      ngl: 'n_gpu_layers',
+    }
+    return keyMappings[key] || key
+  }
+
+  const settings = modelConfig?.settings
+    ? Object.fromEntries(
+        Object.entries(modelConfig.settings).map(([key, value]) => [
+          mapSettingKey(key),
+          value.controller_props?.value,
+        ])
+      )
+    : undefined
+
+  return engine.load(model, settings).catch((error) => {
     console.error(
       `Failed to start model ${model} for provider ${provider.provider}:`,
       error