Skip to content

v2.6.0

Choose a tag to compare

@shibing624 shibing624 released this 14 Apr 04:00
· 5 commits to main since this release

更新摘要

MedicalGPT v2.6.0 新增了 Agent 工具调用(Function Call / Tool Use)训练能力,主路径覆盖 SFTDPO。同时补齐了工具数据格式处理、样例数据和脚本兼容性,方便在教学和实验场景中直接上手。

主要更新

  • 支持 SFTDPO 的 Agent / Function Call 微调训练
  • 新增多种模型的 tool_format 适配与解析逻辑,覆盖 defaultglm4llama3mistralqwen
  • 补充 data/sft/glaive_toolcall_zh_demo.jsonl 等 tool-call 数据样例
  • 统一本地训练数据为 .jsonl,并将 SFT / 偏好数据字段统一为 ShareGPT 风格
  • 修复本地混合 jsonl 目录加载:SFT 和 DPO 现在可以直接混合普通数据与带 tools 字段的数据文件
  • 多个运行脚本统一默认使用 python3

使用方式

# SFT:普通问答数据和 tool-call 数据可放在同一目录
bash scripts/run_sft.sh

# DPO:普通偏好数据和 tool-call 偏好数据可放在同一目录
bash scripts/run_dpo.sh

说明

  • 本版本的 tool-call 训练主路径为 SFTDPO
  • tools 字段为可选列;普通样本和 tool-call 样本可以混合放在同一训练目录
  • 训练脚本、数据目录和字段命名进一步统一,便于教学仓库维护和用户二次修改

Full Changelog: 2.5.0...2.6.0