-
Notifications
You must be signed in to change notification settings - Fork 5.9k
Open
Labels
Description
背景
飞桨框架迭代较快,其部分单测没有跟框架同步更新,导致当前很多单测处于不可用状态。
涉及范围
- 截止 2025-09-03 的
develop分支, 排查后发现有 22 个在 GPU 上报错的算子单测 - 本期仅修复算子单测报错
任务
表格中为单测名称,具体文件位于Paddle/test/legacy_test/目录下,文件名为单测名称.py。例如test_activation_op对应的单测文件是Paddle/test/legacy_test/test_activation_op.py
| 序号 | 单测名称 | 认领人 / 状态 / PR号 |
|---|---|---|
| 1 | test_activation_op | @scyyh11 |
| 2 | test_adam_op | @aztice @scyyh11 |
| 3 | test_conv3d_transpose_op | @scyyh11 |
| 4 | test_dropout_op | @aztice |
| 5 | test_elementwise_div_op | @ooooo-create |
| 6 | test_gather_op | @aztice |
| 7 | test_logical_op | @LiaoYFBH |
| 8 | test_mean_op | @WanRui37 |
| 9 | test_memcpy_op | @Dayuxiaoshui |
| 10 | test_normal | @Echo-Nie |
| 11 | test_stack_op | @ooooo-create |
| 12 | test_transformer_api | @aztice |
| 13 | test_conv2d_transpose_op | @Dayuxiaoshui @SZTULDH |
| 14 | test_matmul_v2_op | @scyyh11 |
| 15 | test_allgather | @tjujingzong |
| 16 | test_reducescatter | @tjujingzong |
| 17 | test_flash_attention | @aztice |
| 18 | test_fused_dot_product_attention_op | @LiaoYFBH |
| 19 | test_fused_dot_product_attention_op_static | @youge325 |
| 20 | test_pyramid_hash_op | @Echo-Nie |
| 21 | test_fleet_pyramid_hash | |
| 22 | test_fused_dconv_drelu_dbn_op | @aztice |
| 23 | test_conv2d_op(需要windows环境复现报错) | |
| 24 | test_fused_gemm_epilogue_grad_op(需要windows环境复现报错) |
示例修复
参考 PR: #74839
以 test_conv2d_op 为例,其报错原因是 Paddle 中的数据类型在不同情况下对应不同对象:
paddle.float32可能对应VarDesc.VarType.FP32或DataType.FLOAT32- 对 Tensor 数据类型判断时,仅使用
paddle.float32可能导致判断失败
因此在 op_test.py 中做了对应修改。
注意:不同单测可能存在完全不同的问题,本示例仅作为参考。
复现报错的方式如下。首先参考编译说明进行paddle的编译和安装。需要注意在执行cmake时,添加-DWITH_TESTING=ON。例如:cmake .. -DPY_VERSION=3.10 -DWITH_GPU=ON -DWITH_DISTRIBUTE=ON -DWITH_TESTING=ON。随后参考运行单元测试
代码提交方式
⚠️ 注意:如果 CI 流水线出现报错,但你认为报错原因 与 PR 无关(例如网络问题、某些机器显存不足,或性能测试因随机原因未达标等),可以在 PR 下方评论:
/re-run all-failed来 重新触发 流水线。
认领方式
请大家以 comment 的形式认领任务,如:
【报名】:1、3、2-3
- 多个任务之间需要使用中文顿号分隔,报名多个连续任务可用横线表示,如 1-2
- PR 提交格式:在 PR 的标题中以 【UnitTestFix No.xxx】 开头,注明任务编号
看板信息
| 任务方向 | 任务数量 | 提交作品 / 任务认领 | 提交率 | 完成 | 完成率 |
|---|---|---|---|---|---|
| GPU单测修复 | 24 | 20 / 21 | 83.33% | 19 | 79.17% |
统计信息
排名不分先后 @scyyh11 (3) @aztice (6) @ooooo-create (2) @LiaoYFBH (1) @WanRui37 (1) @Dayuxiaoshui (1) @Echo-Nie (2) @tjujingzong (2) @youge325 (1)
Metadata
Metadata
Labels
Type
Projects
Status
In Progress