GitHub - 1692775560/PaperClaw

PaperClaw — 面向学术科研工作者的高能动性AI自动化辅助系统

大脑(LLM决策引擎) + 手脚(Skill插件执行层) + 记忆(Memory知识管理) 三层协同架构

� Web UI 界面

PaperClaw 现已提供现代化的 Web 用户界面，让您无需命令行即可轻松使用！

✨ 主要特性

🎨 专业深色主题 — 现代化UI设计，护眼配色
🚀 一键启动研究 — 输入主题即可开始23阶段自动化流程
📊 实时进度追踪 — 可视化显示每个阶段的执行状态
💾 智能配置保存 — API Key自动保存，无需重复输入
📄 结果在线查看 — 直接预览和下载生成的论文、代码等产物

🚀 快速开始 Web UI

# 1. 启动后端API服务
cd paperclaw-web/backend
pip install -r requirements.txt
python app.py

# 2. 启动前端界面（新终端）
cd paperclaw-web/frontend
npm install
npm run dev

# 3. 访问浏览器
# 打开 http://localhost:5173

详细使用说明请查看 paperclaw-web/USAGE.md

� 系统定位

PaperClaw 是一套面向学术科研工作者的高能动性 AI 自动化辅助系统。针对传统科研流程中的系统性痛点：

📚 文献检索耗时 — 多源文献自动检索与筛选
🔄 数据处理重复 — 智能实验设计与自动化执行
✍️ 论文写作周期冗长 — AI辅助写作与多轮审稿
📝 基金申请繁琐 — 结构化知识管理与复用

本系统以大语言模型（LLM）为决策核心，构建了大脑 + 手脚 + 记忆三层协同架构，实现科研全流程端到端的智能自动化闭环。

🏗️ 三层协同架构

🧠 大脑层 — LLM决策引擎

核心能力: 智能决策与任务编排

支持多种LLM提供商（OpenAI、DeepSeek、Anthropic、OpenRouter等）
动态多模型路由（复杂任务自动切换最优模型）
ACP协议支持（Agent Client Protocol）
MetaClaw跨运行学习集成

技术特性:

自然语言驱动，无需编程基础
上下文感知的智能提示词管理
多Agent协同决策机制

🦾 手脚层 — Skill插件执行层

核心能力: 科研任务自动化执行

依托 ClawHub 开放技能市场（5700+ 科研 Skill），覆盖9大科研领域：

文献综述 — 多源检索、智能筛选、知识提取
论文写作 — 大纲生成、分段撰写、格式转换
实验设计 — 假设生成、方案设计、代码生成
数据分析 — 统计分析、结果可视化、报告生成
代码生成 — 硬件感知、沙盒执行、自我修复
可视化 — 图表生成、架构图绘制、TikZ/Matplotlib
同行评审 — 多Agent辩论、方法论一致性检查
引用验证 — 4层验证机制、反幻觉防护
知识管理 — 结构化存储、跨会话复用

执行模式:

🏖️ Sandbox模式 — 本地沙盒安全执行
🐳 Docker模式 — 容器化隔离执行
🌐 SSH远程 — GPU服务器远程执行
☁️ Colab Drive — Google Colab协同执行

🧬 记忆层 — Memory知识管理

核心能力: 持续学习与知识沉淀

三层记忆机制:

短期记忆 — 当前运行的上下文状态
- 实验结果缓存
- 中间产物版本控制
- 实时决策日志
中期记忆 — 知识库(KB)系统
- 6大类别结构化存储
- Markdown/Obsidian双后端
- 跨会话知识复用
长期记忆 — 自我进化系统
- 从失败中提取Lessons
- 30天时间衰减机制
- 自动生成可复用Skills

知识库分类:

docs/kb/
├── questions/     # 研究问题
├── literature/    # 文献知识卡片
├── experiments/   # 实验设计与结果
├── findings/      # 研究发现
├── decisions/     # 决策记录与理由
└── reviews/       # 同行评审意见

🔬 23阶段智能流水线

Phase A: 研究范围界定          Phase E: 实验执行
  1. TOPIC_INIT                  12. EXPERIMENT_RUN
  2. PROBLEM_DECOMPOSE           13. ITERATIVE_REFINE  ← 自我修复

Phase B: 文献发现              Phase F: 分析决策
  3. SEARCH_STRATEGY             14. RESULT_ANALYSIS    ← 多Agent
  4. LITERATURE_COLLECT  ← 真实API  15. RESEARCH_DECISION  ← PIVOT/REFINE
  5. LITERATURE_SCREEN   [门控]
  6. KNOWLEDGE_EXTRACT           Phase G: 论文写作
                                 16. PAPER_OUTLINE
Phase C: 知识综合               17. PAPER_DRAFT
  7. SYNTHESIS                   18. PEER_REVIEW        ← 证据检查
  8. HYPOTHESIS_GEN    ← 辩论     19. PAPER_REVISION

Phase D: 实验设计              Phase H: 最终化
  9. EXPERIMENT_DESIGN   [门控]   20. QUALITY_GATE      [门控]
 10. CODE_GENERATION             21. KNOWLEDGE_ARCHIVE
 11. RESOURCE_PLANNING           22. EXPORT_PUBLISH     ← LaTeX
                                 23. CITATION_VERIFY    ← 相关性检查

门控阶段 (5, 9, 20) 可暂停等待人工审批，或使用 --auto-approve 自动通过。

决策循环: 阶段15可触发 REFINE (→ 阶段13) 或 PIVOT (→ 阶段8)，自动版本控制。


输出 → `artifacts/pc-YYYYMMDD-HHMMSS-<hash>/deliverables/` — 可编译的LaTeX、BibTeX、实验代码、图表。

---

## ✨ 核心创新

| 创新点 | 描述 |
|--------|------|
| **🔄 三层记忆架构** | 短期(上下文) + 中期(知识库) + 长期(自我进化)，AI从工具演进为具备持续学习能力的数字科研伙伴 |
| **🎯 动态多模型路由** | 根据任务复杂度自动选择最优LLM，复杂实验自动路由到OpenCode Beast Mode |
| **🌐 开放Skill生态** | ClawHub技能市场5700+科研技能，用户可自定义扩展 |
| **🛡️ 本地私有化部署** | 支持完全离线运行，确保未发表数据与敏感成果的合规安全 |
| **🧬 自我进化系统** | 从每次运行中提取Lessons，30天时间衰减，未来运行自动避免已知陷阱 |
| **🤖 多Agent协同** | 假设生成、结果分析、同行评审均采用结构化多视角辩论 |

---

## 🚀 使用场景

### 场景1: 文献综述自动化
```bash
paperclaw run --topic "Transformer模型在时间序列预测中的应用" \
              --mode literature-review \
              --auto-approve

输出:

50+篇相关文献（OpenAlex + Semantic Scholar + arXiv）
知识卡片提取（方法、数据集、结果）
研究空白分析
综述大纲

场景2: 实验设计与执行

paperclaw run --topic "基于注意力机制的异常检测算法" \
              --mode experiment \
              --gpu-required \
              --auto-approve

输出:

可运行的Python代码（硬件感知）
沙盒/Docker执行结果
统计分析与可视化
实验报告

场景3: 论文全流程生成

paperclaw run --topic "多模态学习在医学影像诊断中的应用" \
              --mode full-auto \
              --conference neurips_2025 \
              --auto-approve

输出:

完整学术论文（5000-6500词）
NeurIPS/ICML/ICLR LaTeX模板
真实引用（4层验证）
实验代码与结果
同行评审报告

🛡️ 安全与合规

数据安全

✅ 支持完全本地部署（无需联网）
✅ 敏感数据不上传云端
✅ Docker沙盒隔离执行
✅ 网络策略精细控制（none/setup_only/pip_only/full）

学术诚信

✅ 4层引用验证（arXiv ID → CrossRef DOI → Semantic Scholar → LLM相关性）
✅ 反AI生成痕迹检测
✅ 方法论-证据一致性检查
✅ NeurIPS审稿清单自动检查

可复现性

✅ 完整实验代码与环境配置
✅ 随机种子固定
✅ 版本控制与回滚
✅ 执行日志完整记录

🎓 技术架构优势

vs 传统科研工具

维度	传统工具	PaperClaw
自动化程度	单点工具，需人工串联	端到端全流程自动化
学习成本	需学习多个工具	自然语言驱动，零编程基础
知识沉淀	分散存储，难以复用	结构化知识库，跨会话复用
持续优化	静态工具	自我进化，从失败中学习
私有化部署	多数依赖云服务	支持完全离线运行

vs AI Scientist / AutoResearch

维度	AI Scientist	PaperClaw
技能生态	封闭系统	开放Skill市场(5700+)
记忆机制	单次运行	三层记忆，持续学习
多模型支持	单一模型	动态多模型路由
本地化	依赖云API	支持完全私有化部署
知识管理	无结构化存储	6类知识库 + Obsidian集成

📦 系统要求

最低配置

Python 3.11+
8GB RAM
20GB 磁盘空间

依赖服务

LLM API（OpenAI/DeepSeek/Anthropic等，或本地部署）
文献API（可选，提高检索质量）:
- Semantic Scholar API Key
- arXiv API（免费）
- OpenAlex API（免费）

🔧 配置示例

# config.paperclaw.yaml
project:
  name: "my-research"
  mode: "full-auto"

research:
  topic: "你的研究主题"
  domains: ["machine-learning", "nlp"]
  daily_paper_count: 10

llm:
  provider: "openai-compatible"
  base_url: "https://api.openai.com/v1"
  api_key_env: "OPENAI_API_KEY"
  primary_model: "gpt-4o"
  fallback_models: ["gpt-4o-mini"]

experiment:
  mode: "sandbox"  # sandbox | docker | ssh_remote
  time_budget_sec: 300
  sandbox:
    python_path: ".venv/bin/python3"
    gpu_required: false

# MetaClaw集成（可选 — 跨运行学习）
metaclaw_bridge:
  enabled: true
  skills_dir: "~/.metaclaw/skills"
  lesson_to_skill:
    enabled: true
    min_severity: "warning"

🌟 路线图

v1.1 (2026 Q2)

ClawHub技能市场Web界面
可视化流程编排器
多语言支持（英文、中文、日文）
移动端监控App

v1.2 (2026 Q3)

基金申请书自动生成
专利撰写辅助
科研团队协作模式
知识图谱可视化

v2.0 (2026 Q4)

多模态输入（语音、图像、视频）
实时科研助手（类ChatGPT界面）
云端SaaS版本
企业级权限管理

🤝 贡献指南

我们欢迎所有形式的贡献！

🐛 Bug报告: 提交Issue并附上复现步骤
💡 功能建议: 在Discussions中讨论新想法
🔧 代码贡献: Fork → 开发 → Pull Request
📚 文档改进: 修正错误、补充示例
🎨 Skill开发: 贡献新的科研技能到ClawHub

详见 CONTRIBUTING.md

📄 开源协议

MIT License — 详见 LICENSE

📌 引用

如果PaperClaw对你的研究有帮助，请引用：

@software{paperclaw2026,
  title = {PaperClaw: 面向学术科研工作者的高能动性AI自动化辅助系统},
  author = {PaperClaw Team},
  year = {2026},
  url = {https://github.com/1692775560/PaperClaw},
  note = {大脑(LLM决策引擎) + 手脚(Skill插件执行层) + 记忆(Memory知识管理) 三层协同架构}
}

🙏 致谢

PaperClaw基于以下开源项目改进而来：

🔬 AutoResearchClaw — 自动化研究流水线
🧠 MetaClaw — 跨运行学习系统
🌐 OpenClaw — Agent协议标准

特别感谢开源社区的贡献者们！

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.claude/skills/researchclaw		.claude/skills/researchclaw
docs		docs
image		image
paperclaw-web		paperclaw-web
researchclaw		researchclaw
scripts		scripts
tests		tests
website		website
.gitignore		.gitignore
.windsurfrules		.windsurfrules
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
PAPERCLAW_GUIDE_CN.md		PAPERCLAW_GUIDE_CN.md
README.md		README.md
config.paperclaw.example.yaml		config.paperclaw.example.yaml
config.paperclaw.yaml		config.paperclaw.yaml
config.researchclaw.example.yaml		config.researchclaw.example.yaml
paperclaw		paperclaw
prompts.default.yaml		prompts.default.yaml
pyproject.toml		pyproject.toml
sentinel.sh		sentinel.sh

Folders and files

Latest commit

History

Repository files navigation

PaperClaw — 面向学术科研工作者的高能动性AI自动化辅助系统

� Web UI 界面

✨ 主要特性

🚀 快速开始 Web UI

� 系统定位

🏗️ 三层协同架构

🧠 大脑层 — LLM决策引擎

🦾 手脚层 — Skill插件执行层

🧬 记忆层 — Memory知识管理

🔬 23阶段智能流水线

场景2: 实验设计与执行

场景3: 论文全流程生成

🛡️ 安全与合规

数据安全

学术诚信

可复现性

🎓 技术架构优势

vs 传统科研工具

vs AI Scientist / AutoResearch

📦 系统要求

最低配置

推荐配置

依赖服务

🔧 配置示例

🌟 路线图

v1.1 (2026 Q2)

v1.2 (2026 Q3)

v2.0 (2026 Q4)

🤝 贡献指南

📄 开源协议

📌 引用

🙏 致谢

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages