From 8fa903abf222f93e4911f7ddb0a349e58bd1e2af Mon Sep 17 00:00:00 2001 From: nianliunian <1048316300@qq.com> Date: Tue, 12 May 2026 15:11:02 +0800 Subject: [PATCH] [WeeklyReport] ERNIEPartner_24_nianliunian 2026.04.29~2026.05.10 --- .../[WeeklyReport]2026.04.29~2026.05.10.md | 41 +++++++++++++++++++ 1 file changed, 41 insertions(+) create mode 100644 WeeklyReports/Hackathon_10th/ERNIEPartner/ERNIEPartner_24_nianliunian/[WeeklyReport]2026.04.29~2026.05.10.md diff --git a/WeeklyReports/Hackathon_10th/ERNIEPartner/ERNIEPartner_24_nianliunian/[WeeklyReport]2026.04.29~2026.05.10.md b/WeeklyReports/Hackathon_10th/ERNIEPartner/ERNIEPartner_24_nianliunian/[WeeklyReport]2026.04.29~2026.05.10.md new file mode 100644 index 00000000..d404320b --- /dev/null +++ b/WeeklyReports/Hackathon_10th/ERNIEPartner/ERNIEPartner_24_nianliunian/[WeeklyReport]2026.04.29~2026.05.10.md @@ -0,0 +1,41 @@ +### 认领者 GitHub ID +nianliunian + +### 赛题信息 +- **进阶任务序号**:#24 +- **赛题名称**:PaddleOCR-VL-1.5 在此芯 P1 芯片上的端侧部署与优化 +- **关联厂商**:此芯 & Arm + +### 本周工作 + +1. **环境搭建** + - 在此芯上搭建llama.cpp的编译环境:编译cpu和gpu,对比推理性能 + - 通过性能日志,排查llama推理时的性能瓶颈 + - 在本地搭建模型转换和开发测试环境:将模型从 safetensors 转换为 onnx进行推理 + - 编写推理代码 + +2. **模型调研** + - 下载相关模型:paddleocr-vl-1.5 + +3. **问题与解决** + - 问题:llama运行模型较慢,主要瓶颈在图像embedding时 + - 解决:考虑从原始模型中拆解出vision部分和llm部分,使用onnx边缘部署的优势,分别对visionh部分和llm部分完成推理 + + + +### 下周计划 + +1. 调试、完善推理代码,对给定的图像进行测试验证 + +### 当前阻塞(无则填"无") + +- 无 + +### 交付物进展 + +| 交付物 | 状态 | 备注 | +|--------|:----:|------| +| RFC 文档 | ✅ 已完成 | - | +| 代码实现 | 🔄进行中| - | +| README | 🔄进行中| - | +| 演示视频/截图 | ⬜未开始 | - | \ No newline at end of file