v2.6.0

shibing624 released this 14 Apr 04:00

· 5 commits to main since this release

8cfe228

更新摘要

MedicalGPT v2.6.0 新增了 Agent 工具调用（Function Call / Tool Use）训练能力，主路径覆盖 SFT 和 DPO。同时补齐了工具数据格式处理、样例数据和脚本兼容性，方便在教学和实验场景中直接上手。

主要更新

支持 SFT 和 DPO 的 Agent / Function Call 微调训练
新增多种模型的 tool_format 适配与解析逻辑，覆盖 default、glm4、llama3、mistral、qwen
补充 data/sft/glaive_toolcall_zh_demo.jsonl 等 tool-call 数据样例
统一本地训练数据为 .jsonl，并将 SFT / 偏好数据字段统一为 ShareGPT 风格
修复本地混合 jsonl 目录加载：SFT 和 DPO 现在可以直接混合普通数据与带 tools 字段的数据文件
多个运行脚本统一默认使用 python3

使用方式

# SFT：普通问答数据和 tool-call 数据可放在同一目录
bash scripts/run_sft.sh

# DPO：普通偏好数据和 tool-call 偏好数据可放在同一目录
bash scripts/run_dpo.sh

说明

本版本的 tool-call 训练主路径为 SFT 和 DPO
tools 字段为可选列；普通样本和 tool-call 样本可以混合放在同一训练目录
训练脚本、数据目录和字段命名进一步统一，便于教学仓库维护和用户二次修改

Full Changelog: 2.5.0...2.6.0

Assets 2