Skill-Know 知识库系统

以 Skill 搜索为主的知识库系统，支持文档管理、技能管理、智能搜索和 AI 对话。

功能特性

技能管理: 系统技能和文档技能的管理，支持分类、搜索和编辑
文档管理: 文档上传、分类、全文搜索
知识搜索: 自然语言搜索和 SQL 搜索
智能对话: 基于 LangChain 的流式 AI 对话
提示词管理: 系统提示词的查看和编辑
快速设置: 最小化配置即可使用

核心架构

文件夹协议 — 核心设计

这是 Skill-Know 的核心设计，定义了知识的组织、检索和优先级机制。

设计原理

文件夹协议解决三个核心问题：

知识组织：如何用树形结构组织海量知识？
知识迁移：如何在不同文件夹间移动知识而不丢失上下文？
检索优先：如何让某些文件夹的知识优先被检索到？

┌─────────────────────────────────────────────────────────────────────────────────────┐
│                        文件夹协议 — 数据库映射关系                                    │
├─────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                     │
│  ┌───────────────────────────────────────────────────────────────────────────────┐ │
│  │  表结构映射                                                                    │ │
│  │                                                                               │ │
│  │    ┌────────────────────┐         ┌────────────────────┐                      │ │
│  │    │  document_folders  │         │       skills       │                      │ │
│  │    │    (文件夹表)       │         │     (技能表)        │                      │ │
│  │    ├────────────────────┤         ├────────────────────┤                      │ │
│  │    │ id: PK             │ ◄───────│ folder_id: FK      │                      │ │
│  │    │ name: str          │         │ id: PK             │                      │ │
│  │    │ description: text  │         │ name: str          │                      │ │
│  │    │ parent_id: FK ─────┼──┐      │ type: enum         │                      │ │
│  │    │ sort_order: int    │  │      │ category: enum     │                      │ │
│  │    │ is_system: bool    │  │      │ priority: int      │                      │ │
│  │    └────────────────────┘  │      │ abstract (L0)      │                      │ │
│  │                            │      │ overview (L1)      │                      │ │
│  │                            │      │ content (L2)       │                      │ │
│  │                            │      └────────────────────┘                      │ │
│  │                            │                                                    │ │
│  │                            │      自引用关系                                   │ │
│  │                            │      (支持无限嵌套)                               │ │
│  │                            ▼                                                    │ │
│  │    ┌────────────────────┐                                                      │ │
│  │    │  document_folders  │                                                      │ │
│  │    │ parent_id ─────────┼────────► id (父文件夹)                               │ │
│  │    └────────────────────┘                                                      │ │
│  │                                                                               │ │
│  └───────────────────────────────────────────────────────────────────────────────┘ │
│                                                                                     │
│  ┌───────────────────────────────────────────────────────────────────────────────┐ │
│  │  关系说明                                                                      │ │
│  │                                                                               │ │
│  │    1. Skill.folder_id ──► DocumentFolder.id                                   │ │
│  │       - 多对一关系：多个技能可以属于同一个文件夹                               │ │
│  │       - 软删除：folder_id 设置 ondelete="SET NULL"                            │ │
│  │       - 删除文件夹时，技能的 folder_id 置空，技能本身不删除                    │ │
│  │                                                                               │ │
│  │    2. DocumentFolder.parent_id ──► DocumentFolder.id                          │ │
│  │       - 自引用关系：文件夹可以嵌套                                            │ │
│  │       - 树形结构：parent_id=NULL 为根目录                                     │ │
│  │       - 级联删除：删除父文件夹时，子文件夹一并删除                             │ │
│  │                                                                               │ │
│  └───────────────────────────────────────────────────────────────────────────────┘ │
│                                                                                     │
└─────────────────────────────────────────────────────────────────────────────────────┘

文件夹树形结构与查找

┌─────────────────────────────────────────────────────────────────────────────────────┐
│                     文件夹树形结构 — 一层层查找                                       │
├─────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                     │
│  数据库存储 (document_folders 表):                                                   │
│                                                                                     │
│    ┌────────────────────────────────────────────────────────────────────────────┐  │
│    │ id          │ name        │ parent_id │ sort_order │ is_system │           │  │
│    ├─────────────┼─────────────┼───────────┼────────────┼──────────┤           │  │
│    │ folder-000  │ 根目录       │ NULL      │ 0          │ true     │           │  │
│    │ folder-001  │ 技术文档     │ NULL      │ 10         │ false    │           │  │
│    │ folder-002  │ 前端开发     │ folder-001│ 0          │ false    │           │  │
│    │ folder-003  │ 后端开发     │ folder-001│ 1          │ false    │           │  │
│    │ folder-004  │ React        │ folder-002│ 0          │ false    │           │  │
│    │ folder-005  │ Vue          │ folder-002│ 1          │ false    │           │  │
│    │ folder-006  │ FastAPI      │ folder-003│ 0          │ false    │           │  │
│    │ folder-007  │ 产品文档     │ NULL      │ 20         │ false    │           │  │
│    └────────────────────────────────────────────────────────────────────────────┘  │
│                                                                                     │
│  树形结构可视化:                                                                    │
│                                                                                     │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │                                                                             │ │
│    │    📁 根目录 (folder-000, parent_id=NULL, is_system=true)                   │ │
│    │        └── 系统文件夹，不可删除                                              │ │
│    │                                                                             │ │
│    │    📁 技术文档 (folder-001, parent_id=NULL, sort_order=10)                   │ │
│    │        │                                                                    │ │
│    │        ├── 📁 前端开发 (folder-002, parent_id=folder-001)                    │ │
│    │        │       │                                                            │ │
│    │        │       ├── 📁 React (folder-004, parent_id=folder-002)               │ │
│    │        │       │     ├── 📄 React Hooks 入门 (skill.folder_id=folder-004)  │ │
│    │        │       │     └── 📄 React Router 指南                               │ │
│    │        │       │                                                            │ │
│    │        │       └── 📁 Vue (folder-005, parent_id=folder-002)                 │ │
│    │        │             └── 📄 Vue 3 组合式 API                                │ │
│    │        │                                                                    │ │
│    │        └── 📁 后端开发 (folder-003, parent_id=folder-001)                    │ │
│    │              │                                                              │ │
│    │              └── 📁 FastAPI (folder-006, parent_id=folder-003)             │ │
│    │                    ├── 📄 FastAPI 依赖注入                                  │ │
│    │                    └── 📄 FastAPI 路由最佳实践                              │ │
│    │                                                                             │ │
│    │    📁 产品文档 (folder-007, parent_id=NULL, sort_order=20)                   │ │
│    │          └── 📄 需求分析模板                                                │ │
│    │                                                                             │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│                                                                                     │
│  一层层查找算法:                                                                    │
│                                                                                     │
│    def get_folder_path(folder_id: str) -> list[DocumentFolder]:                    │
│        """从当前文件夹向上查找，返回完整路径"""                                      │
│        path = []                                                                   │
│        current = get_folder(folder_id)                                             │
│        while current:                                                              │
│            path.insert(0, current)  # 插入到头部，保持从根到叶的顺序                 │
│            current = get_folder(current.parent_id)  # 向上查找父文件夹              │
│        return path                                                                 │
│                                                                                     │
│    示例: get_folder_path("folder-004") → [技术文档, 前端开发, React]               │
│                                                                                     │
└─────────────────────────────────────────────────────────────────────────────────────┘

文件夹迁移协议

┌─────────────────────────────────────────────────────────────────────────────────────┐
│                        文件夹迁移 — 如何转换文件夹                                   │
├─────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                     │
│  迁移场景:                                                                          │
│                                                                                     │
│    场景1: 移动单个技能到另一个文件夹                                                 │
│    ─────────────────────────────────────────────────────────────────────────────── │
│                                                                                     │
│      ┌──────────────────┐         ┌──────────────────┐                             │
│      │  前端开发         │         │  后端开发         │                             │
│      │  (folder-002)    │         │  (folder-003)    │                             │
│      │                  │         │                  │                             │
│      │  📄 React Hooks  │ ──────► │                  │                             │
│      │  folder_id: 002  │  move   │  📄 React Hooks  │                             │
│      │                  │         │  folder_id: 003  │                             │
│      └──────────────────┘         └──────────────────┘                             │
│                                                                                     │
│      SQL: UPDATE skills SET folder_id = 'folder-003' WHERE id = 'skill-001'        │
│                                                                                     │
│    场景2: 批量迁移文件夹下的所有技能                                                 │
│    ─────────────────────────────────────────────────────────────────────────────── │
│                                                                                     │
│      ┌──────────────────┐         ┌──────────────────┐                             │
│      │  React           │         │  前端框架         │                             │
│      │  (folder-004)    │         │  (folder-008)    │                             │
│      │                  │         │                  │                             │
│      │  📄 Hooks        │         │  📄 Hooks        │                             │
│      │  📄 Router       │ ──────► │  📄 Router       │                             │
│      │  📄 State        │  batch  │  📄 State        │                             │
│      │                  │  move   │                  │                             │
│      └──────────────────┘         └──────────────────┘                             │
│                                                                                     │
│      SQL: UPDATE skills SET folder_id = 'folder-008'                               │
│           WHERE folder_id = 'folder-004'                                          │
│                                                                                     │
│    场景3: 删除文件夹（软删除保护）                                                   │
│    ─────────────────────────────────────────────────────────────────────────────── │
│                                                                                     │
│      删除前:                                                                        │
│      ┌──────────────────┐                                                          │
│      │  临时文件夹       │                                                          │
│      │  (folder-099)    │                                                          │
│      │  📄 临时笔记      │                                                          │
│      │  folder_id: 099  │                                                          │
│      └──────────────────┘                                                          │
│                                                                                     │
│      删除后 (ondelete="SET NULL"):                                                  │
│      ┌──────────────────┐                                                          │
│      │  (文件夹已删除)   │                                                          │
│      │                  │         ┌──────────────────┐                             │
│      │                  │         │  📄 临时笔记      │                             │
│      │                  │         │  folder_id: NULL │  ← 技能保留，文件夹置空      │
│      │                  │         │  (未分类)        │                             │
│      └──────────────────┘         └──────────────────┘                             │
│                                                                                     │
│  迁移规则:                                                                          │
│                                                                                     │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │  1. SYSTEM 技能不可迁移 (folder_id 固定为 NULL)                              │ │
│    │  2. DOCUMENT 技能可迁移 (修改 folder_id 即可)                                 │ │
│    │  3. USER 技能可自由迁移 (包括设置为 NULL，变成未分类)                         │ │
│    │  4. 迁移不影响向量索引 (VectorIndex 通过 URI 关联，不受 folder_id 影响)       │ │
│    │  5. 迁移不影响知识关联 (ContextRelation 通过 URI 关联)                        │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│                                                                                     │
└─────────────────────────────────────────────────────────────────────────────────────┘

文件夹优先级与加分机制

┌─────────────────────────────────────────────────────────────────────────────────────┐
│                     文件夹优先级 — 如何一层层加分                                    │
├─────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                     │
│  优先级来源:                                                                        │
│                                                                                     │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │  来源一: DocumentFolder.sort_order (文件夹排序)                              │ │
│    │  ─────────────────────────────────────────────────────────────────────────  │ │
│    │    - 数值越小，优先级越高                                                    │ │
│    │    - 同级文件夹按 sort_order 排序                                            │ │
│    │    - 示例: 技术文档(10) > 产品文档(20)                                       │ │
│    │                                                                             │ │
│    │  来源二: Skill.priority (技能优先级)                                         │ │
│    │  ─────────────────────────────────────────────────────────────────────────  │ │
│    │    - 数值越小，优先级越高                                                    │ │
│    │    - 同一文件夹内按 priority 排序                                            │ │
│    │    - 示例: React Hooks(10) > React Router(20)                               │ │
│    │                                                                             │ │
│    │  来源三: 检索分数 (语义分 + 热度分)                                          │ │
│    │  ─────────────────────────────────────────────────────────────────────────  │ │
│    │    - L0_SCORE × 0.5 + L1_SCORE × 0.5 = SEMANTIC_SCORE                       │ │
│    │    - SEMANTIC_SCORE × 0.8 + HOTNESS_SCORE × 0.2 = FINAL_SCORE               │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│                                                                                     │
│  加分流程:                                                                          │
│                                                                                     │
│    用户查询 "React Hooks"                                                            │
│        │                                                                            │
│        ▼                                                                            │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │  Step 1: L0 向量检索 (获取候选集)                                            │ │
│    │                                                                             │ │
│    │    候选结果:                                                                 │ │
│    │    ┌────────────────┬─────────────┬─────────────┬─────────────┐            │ │
│    │    │ 技能           │ L0_SCORE    │ folder_id   │ priority    │            │ │
│    │    ├────────────────┼─────────────┼─────────────┼─────────────┤            │ │
│    │    │ React Hooks    │ 0.85        │ folder-004  │ 10          │            │ │
│    │    │ React Router   │ 0.72        │ folder-004  │ 20          │            │ │
│    │    │ Vue Hooks      │ 0.68        │ folder-005  │ 15          │            │ │
│    │    │ FastAPI Hooks  │ 0.45        │ folder-006  │ 30          │            │ │
│    │    └────────────────┴─────────────┴─────────────┴─────────────┘            │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│        │                                                                            │
│        ▼                                                                            │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │  Step 2: L1 Rerank (混合 L0 + L1 分数)                                       │ │
│    │                                                                             │ │
│    │    SEMANTIC_SCORE = L0_SCORE × 0.5 + L1_SCORE × 0.5                         │ │
│    │                                                                             │ │
│    │    ┌────────────────┬─────────────┬─────────────┐                           │ │
│    │    │ 技能           │ L1_SCORE    │ SEMANTIC    │                           │ │
│    │    ├────────────────┼─────────────┼─────────────┤                           │ │
│    │    │ React Hooks    │ 0.90        │ 0.875       │  ← 最相关                 │ │
│    │    │ React Router   │ 0.70        │ 0.710       │                           │ │
│    │    │ Vue Hooks      │ 0.65        │ 0.665       │                           │ │
│    │    │ FastAPI Hooks  │ 0.40        │ 0.425       │                           │ │
│    │    └────────────────┴─────────────┴─────────────┘                           │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│        │                                                                            │
│        ▼                                                                            │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │  Step 3: Hotness 加分 (热度分混合)                                           │ │
│    │                                                                             │ │
│    │    FINAL_SCORE = SEMANTIC × 0.8 + HOTNESS × 0.2                             │ │
│    │                                                                             │ │
│    │    ┌────────────────┬────────────┬─────────────┬─────────────┐             │ │
│    │    │ 技能           │ HOTNESS    │ FINAL_SCORE │ 排名        │             │ │
│    │    ├────────────────┼────────────┼─────────────┼─────────────┤             │ │
│    │    │ React Hooks    │ 0.50       │ 0.800       │ 1           │             │ │
│    │    │ React Router   │ 0.30       │ 0.628       │ 2           │             │ │
│    │    │ Vue Hooks      │ 0.20       │ 0.572       │ 3           │             │ │
│    │    │ FastAPI Hooks  │ 0.10       │ 0.370       │ 4           │             │ │
│    │    └────────────────┴────────────┴─────────────┴─────────────┘             │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│        │                                                                            │
│        ▼                                                                            │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │  Step 4: 文件夹优先级排序 (可选，用于列表展示)                               │ │
│    │                                                                             │ │
│    │    按 (folder.sort_order, skill.priority) 排序:                             │ │
│    │                                                                             │ │
│    │    ┌────────────────┬───────────────────────┬─────────────┐                │ │
│    │    │ 技能           │ 文件夹路径             │ 综合优先级  │                │ │
│    │    ├────────────────┼───────────────────────┼─────────────┤                │ │
│    │    │ React Hooks    │ 技术文档/前端/React    │ 10-10-10    │                │ │
│    │    │ React Router   │ 技术文档/前端/React    │ 10-10-20    │                │ │
│    │    │ Vue Hooks      │ 技术文档/前端/Vue      │ 10-10-15    │                │ │
│    │    │ FastAPI Hooks  │ 技术文档/后端/FastAPI  │ 10-20-30    │                │ │
│    │    └────────────────┴───────────────────────┴─────────────┘                │ │
│    │                                                                             │ │
│    │    排序规则: 文件夹层级越深，路径上每个节点的 sort_order 都参与比较          │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│                                                                                     │
└─────────────────────────────────────────────────────────────────────────────────────┘

加分机制总结：

阶段分数来源权重作用

L0 检索余弦相似度 100% 快速筛选候选集

L1 Rerank L0×0.5 + L1×0.5 100% 精细重排

Hotness 混合语义分×0.8 + 热度分×0.2 100% 最终分数

列表展示文件夹路径 + priority - UI 排序

关键点：

检索分数与文件夹优先级独立计算

检索时按 FINAL_SCORE 排序，不受文件夹影响

列表展示时可按文件夹层级 + priority 排序

文件夹迁移不影响检索分数，只影响 UI 展示顺序

三层内容模型 (L0/L1/L2)

系统采用分层内容模型，这是 Skill-Know 的核心设计理念：

层级	名称	大小	存储位置	检索阶段	评分权重
L0	Abstract (摘要)	~100 tokens	VectorIndex + Skill.abstract	第一层：向量检索	语义分 × 0.5
L1	Overview (概览)	~2k tokens	VectorIndex + Skill.overview	第二层：Rerank 精排	L0分 × 0.5 + L1分 × 0.5
L2	Detail (完整内容)	全量	Skill.content	第三层：最终展示	不参与评分

分层落库流程

┌─────────────────────────────────────────────────────────────────────────────────────┐
│                          分层落库 — 三层内容独立存储                                  │
├─────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                     │
│    原始知识内容                                                                      │
│        │                                                                            │
│        ▼                                                                            │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │  LLM 分层处理                                                                │ │
│    │                                                                             │ │
│    │    原始内容 ──► LLM ──► L0 Abstract (~100 tokens)                           │ │
│    │                         │                                                  │ │
│    │                         └──► L1 Overview (~2k tokens)                       │ │
│    │                                                                             │ │
│    │    L2 Detail = 原始内容（不经过 LLM，直接存储）                              │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│        │                                                                            │
│        │  三层内容分别落库                                                          │
│        ▼                                                                            │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │                                                                             │ │
│    │    ┌──────────────────────────────────────────────────────────────────┐    │ │
│    │    │  SQLite: Skill 表 (三层内容字段)                                   │    │ │
│    │    │                                                                    │    │ │
│    │    │    ┌─────────────────────────────────────────────────────────┐   │    │ │
│    │    │    │  id: "skill-001"                                         │   │    │ │
│    │    │    │  name: "React Hooks 入门"                                │   │    │ │
│    │    │    │  abstract: "React Hooks 是函数组件的状态管理方案..."      │   │    │ │  ← L0 字段
│    │    │    │  overview: "## 功能概述\nReact Hooks 提供..."            │   │    │ │  ← L1 字段
│    │    │    │  content: "完整的长文档内容..."                          │   │    │ │  ← L2 字段
│    │    │    │  uri: "sk://skills/react-hooks-intro"                   │   │    │ │
│    │    │    └─────────────────────────────────────────────────────────┘   │    │ │
│    │    │                                                                    │    │ │
│    │    └──────────────────────────────────────────────────────────────────┘    │ │
│    │                                                                             │ │
│    │    ┌──────────────────────────────────────────────────────────────────┐    │ │
│    │    │  SQLite: VectorIndex 表 (向量索引)                               │    │ │
│    │    │                                                                    │    │ │
│    │    │    ┌─────────────────────────────────────────────────────────┐   │    │ │
│    │    │    │  uri: "sk://skills/react-hooks-intro"                   │   │    │ │
│    │    │    │  level: 0                    ← L0 向量索引               │   │    │ │
│    │    │    │  text: "React Hooks 是函数组件的状态管理方案..."          │   │    │ │
│    │    │    │  vector: [0.123, -0.456, ...]  (1536维)                 │   │    │ │
│    │    │    └─────────────────────────────────────────────────────────┘   │    │ │
│    │    │    ┌─────────────────────────────────────────────────────────┐   │    │ │
│    │    │    │  uri: "sk://skills/react-hooks-intro"                   │   │    │ │
│    │    │    │  level: 1                    ← L1 向量索引 (可选)        │   │    │ │
│    │    │    │  text: "## 功能概述\nReact Hooks 提供..."                │   │    │ │
│    │    │    │  vector: [0.234, -0.567, ...]  (1536维)                 │   │    │ │
│    │    │    └─────────────────────────────────────────────────────────┘   │    │ │
│    │    │                                                                    │    │ │
│    │    └──────────────────────────────────────────────────────────────────┘    │ │
│    │                                                                             │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│                                                                                     │
└─────────────────────────────────────────────────────────────────────────────────────┘

核心设计思想：

L0/L1 向量化：只有摘要和概览会被向量化存入 VectorIndex，保证检索效率

L2 原样存储：完整内容不向量化，避免大向量带来的存储和计算开销

分层独立索引：L0 和 L1 各自独立建立向量索引，支持按层级检索

知识嵌入流程

┌─────────────────────────────────────────────────────────────────────────────────────┐
│                              知识嵌入完整流程                                         │
├─────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                     │
│  ┌──────────────┐     ┌──────────────┐     ┌──────────────┐                         │
│  │  文档上传     │     │ 对话知识提取  │     │ 手动创建技能  │                         │
│  │  (BatchUpload)│     │(KnowledgeExt)│     │  (SkillAPI)  │                         │
│  └──────┬───────┘     └──────┬───────┘     └──────┬───────┘                         │
│         │                    │                    │                                 │
│         └────────────────────┼────────────────────┘                                 │
│                              ▼                                                      │
│  ┌───────────────────────────────────────────────────────────────────────────────┐ │
│  │  Parse 解析层 (ParserRegistry → DocumentParser)                                │ │
│  │  ┌─────────┐  ┌─────────┐  ┌─────────┐  ┌─────────┐                           │ │
│  │  │   txt   │  │   md    │  │   pdf   │  │  docx   │  → ParsedDocument         │ │
│  │  └─────────┘  └─────────┘  └─────────┘  └─────────┘                           │ │
│  └───────────────────────────────────────────────────────────────────────────────┘ │
│                              │                                                      │
│                              ▼                                                      │
│  ┌───────────────────────────────────────────────────────────────────────────────┐ │
│  │  Analyze 分析层 (ContentAnalyzer + LLM)                                        │ │
│  │                                                                               │ │
│  │    原始内容 ──────► LLM ──────► L0 Abstract (~100 tokens)                      │ │
│  │                    │                                                          │ │
│  │                    └────────► L1 Overview (~2k tokens)                        │ │
│  └───────────────────────────────────────────────────────────────────────────────┘ │
│                              │                                                      │
│                              ▼                                                      │
│  ┌───────────────────────────────────────────────────────────────────────────────┐ │
│  │  Dedup 去重层 (KnowledgeDeduplicator)                                          │ │
│  │                                                                               │ │
│  │    ┌─────────────┐                                                            │ │
│  │    │ 向量相似检索  │                                                            │ │
│  │    └──────┬──────┘                                                            │ │
│  │           ▼                                                                   │ │
│  │    ┌─────────────────────────────────────────────────────────┐                │ │
│  │    │                    LLM 去重决策                         │                │ │
│  │    │  ┌────────┐    ┌────────┐    ┌────────┐                │                │ │
│  │    │  │ CREATE │    │  SKIP  │    │ MERGE  │                │                │ │
│  │    │  │ 创建新 │    │ 跳过重复│    │合并到已有│                │                │ │
│  │    │  └───┬────┘    └────────┘    └───┬────┘                │                │ │
│  │    └──────┼─────────────────────────────┼────────────────────┘                │ │
│  │           ▼                           ▼                                     │ │
│  └───────────┼─────────────────────────────┼─────────────────────────────────────┘ │
│              │                           │                                        │
│              ▼                           ▼                                        │
│  ┌───────────────────────────────────────────────────────────────────────────────┐ │
│  │  Store 存储层 (SQLite + SQLAlchemy)                                            │ │
│  │                                                                               │ │
│  │    ┌──────────────────┐        ┌──────────────────┐                            │ │
│  │    │    Skill 表       │        │ ContextRelation  │                            │ │
│  │    │  ┌────────────┐  │        │    知识关联表      │                            │ │
│  │    │  │ L0 abstract│  │        └──────────────────┘                            │ │
│  │    │  │ L1 overview│  │                                                        │ │
│  │    │  │ L2 content │  │                                                        │ │
│  │    │  └────────────┘  │                                                        │ │
│  │    └──────────────────┘                                                        │ │
│  └───────────────────────────────────────────────────────────────────────────────┘ │
│                              │                                                      │
│                              ▼                                                      │
│  ┌───────────────────────────────────────────────────────────────────────────────┐ │
│  │  Index 向量索引层 (异步队列)                                                    │ │
│  │                                                                               │ │
│  │    Skill ──► QueueManager ──► SKILL_INDEXING Task ──► 异步执行                 │ │
│  │                                                                   │           │ │
│  │                                                                   ▼           │ │
│  │    ┌─────────────────────────────────────────────────────────────────────┐   │ │
│  │    │  OpenAIEmbeddings (text-embedding-3-small)                          │   │ │
│  │    │                                                                      │   │ │
│  │    │    L0 Abstract ───► 向量化 ───► VectorIndex 表                       │   │ │
│  │    │    L1 Overview ───► 向量化 ───► VectorIndex 表 (可选)                │   │ │
│  │    └─────────────────────────────────────────────────────────────────────┘   │ │
│  └───────────────────────────────────────────────────────────────────────────────┘ │
│                                                                                     │
└─────────────────────────────────────────────────────────────────────────────────────┘

📊 Mermaid 流程图（点击展开）

flowchart TB
    subgraph 入口["知识入库入口"]
        A1[文档上传]
        A2[对话知识提取]
        A3[手动创建技能]
    end

    subgraph 解析层["Parse 解析层"]
        B1[ParserRegistry]
        B2[DocumentParser<br/>txt/md/pdf/docx]
        B3[解析结果<br/>ParsedDocument]
    end

    subgraph 分析层["Analyze 分析层"]
        C1[ContentAnalyzer]
        C2[LLM 生成 L0 Abstract]
        C3[LLM 生成 L1 Overview]
    end

    subgraph 去重层["Dedup 去重层"]
        D1[KnowledgeDeduplicator]
        D2{去重决策}
        D3[CREATE: 创建新知识]
        D4[SKIP: 跳过重复]
        D5[MERGE: 合并到已有]
    end

    subgraph 存储层["Store 存储层"]
        E1[(SQLite Database)]
        E2[Skill 表<br/>L0/L1/L2 三层内容]
        E3[ContextRelation 表<br/>知识关联]
    end

    subgraph 索引层["Index 向量索引层"]
        F1[QueueManager<br/>异步任务队列]
        F2[TaskType.SKILL_INDEXING]
        F3[OpenAIEmbeddings<br/>text-embedding-3-small]
        F4[VectorStore]
        F5[(VectorIndex 表<br/>向量 + URI 映射)]
    end

    A1 --> B1
    A2 --> B1
    A3 --> B1
    B1 --> B2 --> B3
    B3 --> C1 --> C2 --> C3
    C3 --> D1 --> D2
    D2 -->|新知识| D3 --> E1
    D2 -->|重复| D4
    D2 -->|相似| D5 --> E1
    E1 --> E2 --> E3
    E2 --> F1 --> F2 --> F3 --> F4 --> F5

知识搜索流程 — 分层检索与评分

┌─────────────────────────────────────────────────────────────────────────────────────┐
│                     分层检索 — 一层一层找，一层一层加分                               │
├─────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                     │
│                              ┌──────────────┐                                       │
│                              │  用户查询 Q   │                                       │
│                              └──────┬───────┘                                       │
│                                     │                                               │
│                                     ▼                                               │
│  ═══════════════════════════════════════════════════════════════════════════════════│
│  第一层: L0 向量检索 (VectorIndex.level=0)                                          │
│  ═══════════════════════════════════════════════════════════════════════════════════│
│                                                                                     │
│    Query ──► OpenAIEmbeddings ──► 查询向量 (1536维)                                  │
│                                     │                                               │
│                                     ▼                                               │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │  VectorStore.search(level=0, limit=limit×3)                                 │ │
│    │                                                                             │ │
│    │    ┌───────────────────────────────────────────────────────────────────┐   │ │
│    │    │  查询向量 vs VectorIndex.level=0 向量                               │   │ │
│    │    │                                                                     │   │ │
│    │    │    余弦相似度 = cosine_similarity(query_vec, l0_vec)              │   │ │
│    │    │                                                                     │   │ │
│    │    │    L0_SCORE = 余弦相似度值 (0.0 ~ 1.0)                              │   │ │
│    │    │                                                                     │   │ │
│    │    │    返回: [{uri, L0_SCORE, text, active_count, updated_at}, ...]    │   │ │
│    │    └───────────────────────────────────────────────────────────────────┘   │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│                                     │                                               │
│                                     │  候选集 Candidates (limit×3 条)               │
│                                     ▼                                               │
│  ═══════════════════════════════════════════════════════════════════════════════════│
│  第二层: L1 Rerank 精排 (VectorIndex.level=1)                                       │
│  ═══════════════════════════════════════════════════════════════════════════════════│
│                                                                                     │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │                      候选数 > limit ?                                       │ │
│    │                                                                             │ │
│    │         是 (需要精排)                    否 (跳过精排)                      │ │
│    │              │                              │                               │ │
│    │              ▼                              ▼                               │ │
│    │    ┌───────────────────────┐         直接取前 limit 条                       │ │
│    │    │  L1 向量相似度计算     │                                                 │ │
│    │    │                       │                                                 │ │
│    │    │  L1_SCORE = cosine_sim│                                                 │ │
│    │    │    (query_vec, l1_vec)│                                                 │ │
│    │    │                       │                                                 │ │
│    │    │  ┌─────────────────┐  │                                                 │ │
│    │    │  │ 分数混合公式     │  │                                                 │ │
│    │    │  │                 │  │                                                 │ │
│    │    │  │ SEMANTIC_SCORE  │  │                                                 │ │
│    │    │  │ = L0_SCORE × 0.5│  │                                                 │ │
│    │    │  │ + L1_SCORE × 0.5│  │                                                 │ │
│    │    │  └─────────────────┘  │                                                 │ │
│    │    └───────────────────────┘                                                 │ │
│    │                                                                             │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│                                     │                                               │
│                                     │  精排后的候选集                                │
│                                     ▼                                               │
│  ═══════════════════════════════════════════════════════════════════════════════════│
│  第三层: Hotness Score 热度加分 (时间衰减 + 频次热度)                                │
│  ═══════════════════════════════════════════════════════════════════════════════════│
│                                                                                     │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │  Hotness Score 计算公式                                                     │ │
│    │                                                                             │ │
│    │    ┌───────────────────────────────────────────────────────────────────┐   │ │
│    │    │  hotness = sigmoid(log1p(active_count)) × time_decay(updated_at)  │   │ │
│    │    │                                                                     │   │ │
│    │    │  - sigmoid: 将访问频次映射到 (0, 1)                                │   │ │
│    │    │  - time_decay: 指数衰减，半衰期 7 天                               │   │ │
│    │    │  - 越常访问、越近更新的知识，热度分越高                            │   │ │
│    │    └───────────────────────────────────────────────────────────────────┘   │ │
│    │                                                                             │ │
│    │  ┌───────────────────────────────────────────────────────────────────┐   │ │
│    │    │  最终分数混合公式 (alpha=0.2)                                     │   │ │
│    │    │                                                                     │   │ │
│    │    │  FINAL_SCORE = SEMANTIC_SCORE × 0.8  ← 语义分 (L0+L1)             │   │ │
│    │    │              + HOTNESS_SCORE × 0.2  ← 热度分                       │   │ │
│    │    │                                                                     │   │ │
│    │    │  高频使用、最近更新的知识会获得额外加分                            │   │ │
│    │    └───────────────────────────────────────────────────────────────────┘   │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│                                     │                                               │
│                                     │  按 FINAL_SCORE 排序                          │
│                                     ▼                                               │
│  ═══════════════════════════════════════════════════════════════════════════════════│
│  第四层: 结果组装 (L2 完整内容加载)                                                  │
│  ═══════════════════════════════════════════════════════════════════════════════════│
│                                                                                     │
│    候选结果 ──► 关联 Skill 表获取 L2 完整内容 ──► 加载知识关联 (relations)            │
│                                     │                                               │
│                                     ▼                                               │
│    ┌─────────────────────────────────────────────────────────────────────────────┐ │
│    │  RetrievalResult:                                                            │ │
│    │    uri, skill_id, name, description, category                                │ │
│    │    abstract (L0), overview (L1), content (L2)  ← 三层内容全部返回            │ │
│    │    score: FINAL_SCORE, matched_by: "semantic"                               │ │
│    │    relations: [{target_uri, relation_type}, ...]                             │ │
│    └─────────────────────────────────────────────────────────────────────────────┘ │
│                                     │                                               │
│                                     ▼                                               │
│    更新活跃度 (active_count + 1) ──► 返回 RetrievalResponse                         │
│                                                                                     │
│  ═══════════════════════════════════════════════════════════════════════════════════│
│  降级方案: 文本检索 (当语义检索失败时)                                              │
│  ═══════════════════════════════════════════════════════════════════════════════════│
│                                                                                     │
│    Query ──► ILIKE 关键词匹配 ──► name / abstract / overview / content              │
│                                     │                                               │
│                                     ▼                                               │
│                           文本匹配分数 (无 L0/L1 分层)                              │
│                    (name:0.5 + abstract:0.3 + overview:0.15 + content:0.05)         │
│                                                                                     │
└─────────────────────────────────────────────────────────────────────────────────────┘

分层检索核心要点：

L0 先筛选：用摘要向量快速检索，获取候选集（limit×3），计算 L0_SCORE

L1 再精排：对候选集用概览向量重排，混合 L0+L1 分数得到 SEMANTIC_SCORE

热度加分：访问频次 + 时间衰减计算 HOTNESS_SCORE，与语义分混合得 FINAL_SCORE

L2 最后加载：排序完成后，才从 Skill 表加载完整内容返回给用户

为什么这样设计？

L0 摘要短小，向量检索速度快，适合做大范围筛选

L1 概览适中，向量相似度更精准，适合做精细重排

L2 内容完整，不参与检索，避免大向量开销，只在最后按需加载

热度机制让常用知识排在前面，符合实际使用场景

📊 Mermaid 流程图（点击展开）

flowchart TB
    subgraph 查询入口["查询入口"]
        Q1[用户查询 Query]
    end

    subgraph L0检索["Step 1: L0 向量搜索"]
        S1[OpenAIEmbeddings<br/>生成查询向量]
        S2[VectorStore.search<br/>level=0, limit×3]
        S3[候选集 Candidates<br/>语义相似度筛选]
    end

    subgraph L1重排["Step 2: L1 Rerank 精细筛选"]
        R1{候选数 > limit?}
        R2[Thinking 模式<br/>Rerank Model 重排]
        R3[Fast 模式<br/>向量相似度重排]
        R4[Hotness Score<br/>时间衰减 + 频次热度]
    end

    subgraph 结果组装["Step 3: 结果组装"]
        T1[_enrich_results<br/>关联完整 Skill 数据]
        T2[_load_relations<br/>加载知识关联]
        T3[_update_activity<br/>更新活跃度]
        T4[RetrievalResponse<br/>最终结果]
    end

    subgraph 降级方案["降级: 文本检索"]
        F1[语义检索失败]
        F2[关键词 ILIKE 匹配<br/>name/description/abstract/content]
        F3[文本匹配分数计算]
    end

    Q1 --> S1 --> S2 --> S3
    S3 --> R1
    R1 -->|是| R2
    R1 -->|否| T1
    R2 --> R4
    R3 --> R4
    R4 --> T1
    T1 --> T2 --> T3 --> T4
    S2 -->|失败| F1 --> F2 --> F3 --> T4

对话知识提取流程

┌─────────────────────────────────────────────────────────────────────────────────────┐
│                           对话知识提取完整流程                                        │
├─────────────────────────────────────────────────────────────────────────────────────┤
│                                                                                     │
│   ┌──────────────┐                                                                  │
│   │  对话结束     │                                                                  │
│   │ Conversation │                                                                  │
│   │    End       │                                                                  │
│   └──────┬───────┘                                                                  │
│          │                                                                          │
│          ▼                                                                          │
│   ┌──────────────────────────────────────────────────────────────────────────────┐ │
│   │  KnowledgeExtractor (知识提取器)                                              │ │
│   │                                                                              │ │
│   │    对话消息 ──► LLM 分析 ──► 提取候选知识                                       │ │
│   │                              │                                               │ │
│   │                              ▼                                               │ │
│   │    ┌────────────────────────────────────────────────────────────────────┐   │ │
│   │    │                    知识分类判断                                     │   │ │
│   │    │                                                                    │   │ │
│   │    │  ┌────────────┐  ┌────────────┐  ┌────────────┐                  │   │ │
│   │    │  │    FAQ     │  │ CORRECTION │  │ SUPPLEMENT │                  │   │ │
│   │    │  │ 有价值的   │  │ 用户纠正   │  │ 用户补充   │                  │   │ │
│   │    │  │ 问答对     │  │ AI错误     │  │ 专业知识   │                  │   │ │
│   │    │  └────────────┘  └────────────┘  └────────────┘                  │   │ │
│   │    │                                                                    │   │ │
│   │    │  返回: CandidateKnowledge {title, abstract, content, keywords}   │   │ │
│   │    └────────────────────────────────────────────────────────────────────┘   │ │
│   └──────────────────────────────────────────────────────────────────────────────┘ │
│          │                                                                          │
│          ▼                                                                          │
│   ┌──────────────────────────────────────────────────────────────────────────────┐ │
│   │  SkillProcessor (技能处理管线)                                                 │ │
│   │                                                                              │ │
│   │    候选知识 ──► 去重检查 ──► 生成 L0/L1 ──► 存入数据库 ──► 异步向量索引       │ │
│   │                              │                                               │ │
│   │                              ▼                                               │ │
│   │                    ┌─────────────────┐                                      │ │
│   │                    │ KnowledgeDedup  │                                      │ │
│   │                    │   去重决策       │                                      │ │
│   │                    └─────────────────┘                                      │ │
│   └──────────────────────────────────────────────────────────────────────────────┘ │
│          │                                                                          │
│          ▼                                                                          │
│   ┌──────────────┐                                                                  │
│   │  新知识入库   │                                                                  │
│   │  Skill 表    │                                                                  │
│   │  VectorIndex │                                                                  │
│   └──────────────┘                                                                  │
│                                                                                     │
└─────────────────────────────────────────────────────────────────────────────────────┘

📊 Mermaid 流程图（点击展开）

flowchart LR
    subgraph 对话结束["对话结束"]
        A[Conversation End]
    end

    subgraph 知识提取["KnowledgeExtractor"]
        B[LLM 分析对话]
        C[提取候选知识]
        D[FAQ / CORRECTION / SUPPLEMENT]
    end

    subgraph 入库["SkillProcessor"]
        E[去重检查]
        F[生成 L0/L1]
        G[存入数据库]
        H[异步向量索引]
    end

    A --> B --> C --> D --> E --> F --> G --> H

核心组件说明

组件	文件路径	职责
SkillProcessor	`backend/app/services/skill_processor.py`	技能处理管线：Parse → Analyze → Dedup → Store → Index
SkillRetriever	`backend/app/services/retriever.py`	分层检索器：L0 向量搜索 → L1 Rerank → 结果组装
VectorStore	`backend/app/core/vector_store.py`	向量存储管理：嵌入生成、索引、检索
QueueManager	`backend/app/core/queue.py`	异步任务队列：EMBEDDING、SKILL_INDEXING
SkillKnowService	`backend/app/core/service.py`	聚合服务：统一管理所有子服务生命周期
Context	`backend/app/core/context.py`	统一上下文模型：URI + L0/L1/L2 三层内容
KnowledgeExtractor	`backend/app/services/knowledge_extractor.py`	对话知识提取：从对话中提取有价值知识点

URI 标识体系

sk://skills/{name}      — 技能
sk://documents/{id}     — 文档
sk://knowledge/{id}     — 知识条目

技术栈

后端

Python 3.13+
FastAPI + Uvicorn
SQLAlchemy + SQLite (aiosqlite) / PostgreSQL
LangChain + LangGraph + OpenAI
Qdrant (向量数据库，可选)
StructLog (日志)

前端

Next.js 16
React 19
TailwindCSS 4
Radix UI
Tiptap (富文本编辑器)
Zustand (状态管理)
Motion (动画)

快速开始

1. 启动后端

cd backend

# 使用 uv 安装依赖（推荐）
uv sync

# 或使用 pip
pip install -e .

# 配置环境变量
cp .env.example .env
# 编辑 .env 填入 LLM_API_KEY

# 启动服务
uv run python -m app.main

后端服务运行在 http://localhost:8000

2. 启动前端

cd frontend

# 使用 pnpm 安装依赖（推荐）
pnpm install

# 或使用 npm
npm install

# 启动开发服务器
pnpm dev

前端服务运行在 http://localhost:3000

3. 首次使用

访问 http://localhost:3000，系统会自动跳转到快速设置页面。填入 LLM API Key 并测试连接后即可开始使用。

项目结构

Skill-Know/
├── backend/
│   ├── app/
│   │   ├── core/          # 核心模块（配置、数据库、日志、向量存储）
│   │   │   ├── vector_backends/  # 向量存储后端适配层
│   │   │   └── chat_models/      # 聊天模型配置
│   │   ├── models/        # SQLAlchemy 数据模型
│   │   ├── schemas/       # Pydantic schemas
│   │   ├── services/      # 业务逻辑层
│   │   │   ├── agent/      # AI Agent 工具
│   │   │   ├── skill_search/  # 技能搜索
│   │   │   └── streaming/  # 流式响应
│   │   ├── routers/       # API 路由
│   │   ├── parse/         # 文档解析器注册表
│   │   │   └── parsers/   # txt/md/pdf/docx 解析器
│   │   ├── prompts/       # 系统提示词模板
│   │   └── main.py        # 应用入口
│   ├── packages/          # 本地包
│   │   └── langgraph-agent-kit/  # Agent 开发工具包
│   ├── tests/             # 测试用例
│   └── pyproject.toml
├── frontend/
│   ├── app/               # Next.js App Router
│   ├── components/        # React 组件
│   │   ├── ui/            # 基础 UI 组件 (shadcn/ui)
│   │   └── ...            # 业务组件
│   ├── lib/               # 工具函数和 API 客户端
│   ├── packages/         # 本地包
│   │   ├── embed/        # 嵌入式聊天组件
│   │   └── chat-sdk/     # Chat SDK
│   └── package.json
├── docs/                  # 文档
└── README.md

API 端点

技能管理

GET /api/skills - 技能列表
POST /api/skills - 创建技能
PUT /api/skills/{id} - 更新技能
DELETE /api/skills/{id} - 删除技能

文档管理

GET /api/documents - 文档列表
POST /api/documents/upload - 上传文档（支持批量）
GET /api/documents/{id} - 获取文档详情
DELETE /api/documents/{id} - 删除文档

搜索

GET /api/search - 统一搜索（语义检索 + 文本降级）
GET /api/search/sql - SQL 搜索（高级查询）

对话

POST /api/chat/stream - 流式聊天
GET /api/conversations - 对话列表
DELETE /api/conversations/{id} - 删除对话

系统配置

GET /api/quick-setup/state - 快速设置状态
POST /api/quick-setup/test-connection - 测试 LLM 连接
GET /api/prompts - 提示词列表
PUT /api/prompts/{id} - 更新提示词

其他

GET /api/health - 健康检查
POST /api/pack - 打包导出技能

致谢

本项目核心架构设计灵感来源于 OpenViking 开源项目。

OpenViking 是一个专为 AI Agent 设计的开源上下文数据库（记忆系统），基于渐进式披露原则，其创新性的设计理念深深影响了 Skill-Know 的架构：

文件系统管理范式：将记忆、资源、技能统一管理为虚拟文件系统，通过 URI 精确定位
分层上下文加载 (L0/L1/L2)：基于渐进式披露原则，自动将内容处理为三层结构，按需加载，大幅降低 Token 消耗
目录递归检索：先定位高分目录，再精细化探索，层级式检索提升召回效果
可视化检索轨迹：保留完整检索路径，让上下文可观察、可调试
自动会话管理：上下文自迭代，让 Agent 越用越聪明

特别感谢 OpenViking 团队的杰出工作和开源贡献，为 AI Agent 的上下文管理提供了优雅而高效的解决方案。

OpenViking — The Context Database for AI Agents

GitHub: https://github.com/volcengine/OpenViking

许可证

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.windsurf/skills		.windsurf/skills
backend		backend
docs		docs
frontend		frontend
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
README.md		README.md

阶段	分数来源	权重	作用
L0 检索	余弦相似度	100%	快速筛选候选集
L1 Rerank	L0×0.5 + L1×0.5	100%	精细重排
Hotness 混合	语义分×0.8 + 热度分×0.2	100%	最终分数
列表展示	文件夹路径 + priority	-	UI 排序

Folders and files

Latest commit

History

Repository files navigation

Skill-Know 知识库系统

功能特性

核心架构

文件夹协议 — 核心设计

设计原理

文件夹树形结构与查找

文件夹迁移协议

文件夹优先级与加分机制

三层内容模型 (L0/L1/L2)

分层落库流程

知识嵌入流程

知识搜索流程 — 分层检索与评分

对话知识提取流程

核心组件说明

URI 标识体系

技术栈

后端

前端

快速开始

1. 启动后端

2. 启动前端

3. 首次使用

项目结构

API 端点

技能管理

文档管理

搜索

对话

系统配置

其他

致谢

许可证

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages