[Operator Mechanism] Refine depthwise conv int conversion #79258
[Operator Mechanism] Refine depthwise conv int conversion #79258feixi139 wants to merge 11 commits into
Conversation
CI报告基于以下代码生成(30分钟更新一次): 1 Required任务 : 36/47 通过
2 失败详情🔴 Coverage clone / Clone Paddle — 环境问题(置信度: 高)分析器: 通用分析(fallback)
关键日志:
修复建议:
关联变更: 无(失败发生在合并 PR 前的 🔴 Check approval — 需要 Approval(置信度: 高)该 Job 需要人工 Approval,完成审批后 CI 才会继续执行。
|
fix bugs fix bugs fix bugs Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com> fix bugs fix bugs
ecce61e to
14d88ce
Compare
|
/re-run all-failed |
PaddlePaddle-bot
left a comment
There was a problem hiding this comment.
🤖 Paddle-CI-Agent | pr_review |
2026-06-22 11:49:07
📋 Review 摘要
PR 概述:拆分整理 depthwise conv / gpudnn conv 的大 Tensor 整数溢出和 launch 边界检查。
变更范围:paddle/phi/kernels/gpu/、paddle/phi/kernels/gpudnn/、CUTLASS conv2d util
影响面 Tag:Operator Mechanism
问题
未发现阻塞性问题。PR 规范问题在下面章节报,不要在这里重复
历史 Findings 修复情况
| Finding | 问题 | 状态 |
|---|---|---|
| F1 | ConvRunner::Apply 的 group offset 参数拓宽后调用点仍可能先用 int 溢出 |
✅ 已修复 |
📝 PR 规范检查
符合规范。PR Category Operator Mechanism、PR Types Bug fixes、精度变化 否 均已填写,描述清晰完整。
总体评价
本轮重点回溯了 9 个变更文件中 int64_t 索引提升、int 边界检查、CUDA grid/block launch 配置,以及 gpudnn group offset 的调用链。当前 diff 未确认到需要阻塞合入的新问题;历史 group offset finding 在当前代码中已由 int64_t group_offset_* 计算和传参覆盖。
PR Category
Operator Mechanism
PR Types
Bug fixes
Description
本 PR 拆分并整理 conv 相关文件中的整型溢出修复,主要处理大 Tensor 场景下
int * int、int64_t = int32_t、以及 CUDA launch 参数窄化等问题。主要修改包括:
int * int在结果提升到int64_t前已经发生 int32 溢出的问题。int64_t被错误收窄到int的问题。INT_MAX检查,避免静默截断。UINT32_MAX检查,避免 launch 配置溢出。int64_t,避免不必要的 int32 限制。是否引起精度变化
否