一个 Chrome 扩展(Manifest V3),用于半自动采集 Boss 直聘岗位信息, 生成本地 Excel + 详情页长截图 + 采集日志。
- 输入岗位关键词 / 城市 / 薪资区间 / 最大数量 / 保存子目录
- 自动打开 Boss 直聘,等待用户手动登录
- 自动搜索 → 慢速浏览列表 → 进入详情 → 抓取岗位信息
- 整页长截图(滚动拼接),保存 PNG
- 本地按薪资区间过滤
- 生成
.xlsx,包含可点击的岗位链接 - 检测到验证码 / 登录失效 / 风控提示自动暂停,处理后点页面右上角横条按钮继续
- 生成
collection.log完整采集日志
- Chrome 打开
chrome://extensions/ - 右上角开启 开发者模式
- 点击 加载已解压的扩展程序,选择本目录
F:\trae\boss-web - 工具栏出现 "Boss 岗位采集" 图标
- 点击工具栏图标打开弹窗
- 填写关键词 / 城市 / 薪资区间(K 为单位,例:15 ~ 40)/ 数量
- 点击 开始采集
- 在弹出的 Boss 页面手动登录
- 等待自动采集,弹窗会显示进度
- 完成后所有文件保存在:
~/Downloads/boss-collector/<任务子目录>/ ├── screenshots/ # 整页 PNG 截图 ├── boss_<关键词>_<时间>.xlsx # 岗位列表(含超链接 / 截图路径) └── collection.log # 采集日志
Excel 列:岗位名称 / 公司 / 薪资 / 城市 / 经验 / 学历 / JD / 公司信息 / 岗位链接(可点击)/ 截图路径 / 采集时间。
截图未嵌入 Excel,Excel 仅记录其相对路径。
- 出于 Chrome MV3 安全限制,文件只能保存到 Downloads 目录下。
- 城市优先匹配内置城市码表;未命中时直接传字符串,Boss 可能跳转到全国。
可扩展
content/content.js中的CITY_CODES表。 - 节奏为"保守模式":列表滚动 3-6s 随机、详情停留 5-9s 随机、整页截图边滚边抓。 仍可能触发风控;触发时插件会暂停,处理完点页面右上角横条按钮继续。
- 采集到的薪资若为"面议"等无数字范围会被过滤掉。
- 单页截图高度被限制在约 12000 像素,超长详情页会截断。
boss-web/
├── manifest.json
├── popup/ # 弹窗 UI
├── background/ # service worker,任务编排
├── content/ # 注入 Boss 页面的脚本
└── lib/
└── xlsx-writer.js # 自研最小化 XLSX writer(无外部依赖)