v2.6.0
更新摘要
MedicalGPT v2.6.0 新增了 Agent 工具调用(Function Call / Tool Use)训练能力,主路径覆盖 SFT 和 DPO。同时补齐了工具数据格式处理、样例数据和脚本兼容性,方便在教学和实验场景中直接上手。
主要更新
- 支持
SFT和DPO的 Agent / Function Call 微调训练 - 新增多种模型的
tool_format适配与解析逻辑,覆盖default、glm4、llama3、mistral、qwen - 补充
data/sft/glaive_toolcall_zh_demo.jsonl等 tool-call 数据样例 - 统一本地训练数据为
.jsonl,并将 SFT / 偏好数据字段统一为 ShareGPT 风格 - 修复本地混合
jsonl目录加载:SFT 和 DPO 现在可以直接混合普通数据与带tools字段的数据文件 - 多个运行脚本统一默认使用
python3
使用方式
# SFT:普通问答数据和 tool-call 数据可放在同一目录
bash scripts/run_sft.sh
# DPO:普通偏好数据和 tool-call 偏好数据可放在同一目录
bash scripts/run_dpo.sh说明
- 本版本的 tool-call 训练主路径为
SFT和DPO tools字段为可选列;普通样本和 tool-call 样本可以混合放在同一训练目录- 训练脚本、数据目录和字段命名进一步统一,便于教学仓库维护和用户二次修改
Full Changelog: 2.5.0...2.6.0