开发者与产品经理协作地图
这页是 Agent 工程的角色化入口,目标是让开发者与产品经理在同一张图上协作。
角色目标
开发者
- 把能力做成可运行系统:可靠、可观测、可回滚。
- 将 Prompt、工具、检索、模型路由都纳入版本管理。
- 建立质量门禁和错误回放机制。
产品经理
- 把能力转成可验证的业务价值。
- 为每个 Agent 功能定义成功标准、失败容忍度、人工兜底。
- 管理上线节奏、风险级别、反馈闭环。
协作阶段
阶段 1:问题定义
yaml
阶段: 问题定义
时长: 1-2 天
产出: PRD + 技术可行性说明
开发者:
- 明确输入输出边界
- 预估技术路径、时延与成本
- 标记高风险环节
- 评估现有能力复用度
产品经理:
- 定义业务目标和北极星指标
- 明确用户场景和失败容忍度
- 识别合规影响范围
- 定义人工兜底策略
交付物:
- 问题定义文档
- 风险清单 v1
- 技术可行性评估阶段 2:方案设计
yaml
阶段: 方案设计
时长: 3-5 天
产出: 技术方案 + 体验设计
开发者:
- 选择架构路线(长上下文/RAG/Agent/混合)
- 设计 Prompt 结构与输出协议
- 定义失败路径与降级策略
- 设计评测方案
产品经理:
- 确认体验路径和关键交互文案
- 约束可解释性和可追溯性要求
- 评审里程碑范围
- 定义验收标准
交付物:
- 架构设计文档
- Prompt 设计文档
- 交互流程图
- 评测方案阶段 3:实现与集成
yaml
阶段: 实现与集成
时长: 1-2 周
产出: 可测试版本
开发者:
- 实现 Prompt 和工具链
- 构建检索管线(如需要)
- 实现评测流水线
- 集成监控与告警
产品经理:
- 准备测试数据集
- 验收核心场景
- 收集边界案例
- 准备用户文档
交付物:
- 可部署版本
- 评测基线
- 监控面板阶段 4:评测与门禁
yaml
阶段: 评测与门禁
时长: 3-5 天
产出: 上线决策
开发者:
- 运行自动化评测
- 分析失败样本
- 优化关键指标
- 准备回滚方案
产品经理:
- 确认上线阈值
- 对齐业务验收标准
- 组织人工评审
- 制定灰度策略
交付物:
- 评测报告
- 上线门禁清单
- 灰度策略
- 回滚预案阶段 5:上线与监控
yaml
阶段: 上线与监控
时长: 持续
产出: 稳定运行
开发者:
- 配置监控告警
- 实现灰度发布
- 准备快速回滚
- 监控关键指标
产品经理:
- 监控业务指标
- 收集用户反馈
- 组织周度复盘
- 调整优先级
交付物:
- 监控面板
- 周报模板
- 复盘记录三条技术线分工
Skill 技术线
yaml
技术线: Skill
开发者职责:
主导:
- Skill 结构设计
- 脚本与自动化实现
- 版本管理与发布
参与:
- 任务边界定义
- 验收标准制定
产品经理职责:
主导:
- 任务边界定义
- 业务价值评估
- 使用场景梳理
参与:
- 结构设计评审
- 验收测试
协作产出:
- SKILL.md
- 参考资料目录
- 自动化脚本
- 验收用例llms.txt 技术线
yaml
技术线: llms.txt
开发者职责:
主导:
- 格式与规范
- 发布自动化
- 链接可达性校验
参与:
- 内容优先级讨论
产品经理职责:
主导:
- 内容优先级排序
- 阅读路径设计
- 关键信息完整性检查
参与:
- 格式评审
协作产出:
- llms.txt
- llms-full.txt
- 更新流程文档MCP 技术线
yaml
技术线: MCP
开发者职责:
主导:
- Server 设计与实现
- 安全与协议
- 性能优化
参与:
- 能力清单评审
产品经理职责:
主导:
- 能力清单定义
- 治理规则制定
- 用户体验验收
参与:
- 安全评审
协作产出:
- MCP Server 实现
- 工具定义文档
- 安全策略文档
- 治理规则文档周会模板
会议议程(30 分钟)
markdown
# Agent 工程周会
## 1. 上周回顾(5 分钟)
- 关键指标变化
- 上周承诺完成情况
## 2. 风险更新(5 分钟)
- 新增风险
- 风险状态变化
- 缓解措施进展
## 3. 评测变化摘要(10 分钟)
- 评测结果变化
- 失败样本分析
- 优化方案
## 4. 下周优先级(10 分钟)
- P0 事项(必须完成)
- P1 事项(应该完成)
- P2 事项(可以做)
- 负责人确认周报模板
markdown
# Agent 工程周报
## 基本信息
- 周期:YYYY-MM-DD ~ YYYY-MM-DD
- 参与人:[开发者列表] + [产品经理列表]
## 关键指标
| 指标 | 上周 | 本周 | 变化 |
| ---------- | ---- | ---- | ---- |
| 任务成功率 | X% | X% | +X% |
| 事实准确率 | X% | X% | +X% |
| P95 时延 | Xs | Xs | -Xs |
| 成本 | $X | $X | +$X |
## 本周完成
- [ ] 任务 1
- [ ] 任务 2
## 风险更新
| 风险 | 状态 | 缓解措施 |
| ------ | ---------------- | -------- |
| 风险 1 | 新增/持续/已解决 | 描述 |
## 评测变化
- 变化 1:描述
- 变化 2:描述
## 下周计划
### P0(必须完成)
- [ ] 任务 1(负责人)
### P1(应该完成)
- [ ] 任务 2(负责人)
### P2(可以做)
- [ ] 任务 3(负责人)
## 需要决策
- 决策项 1:描述 + 建议方案 + 需决策人决策清单
必须双方确认
markdown
- [ ] 问题定义是否清晰
- [ ] 成功标准是否可量化
- [ ] 失败容忍度是否明确
- [ ] 人工兜底策略是否定义
- [ ] 上线门禁是否通过
- [ ] 灰度策略是否合理
- [ ] 回滚条件是否明确开发者独立决策
markdown
- [ ] 技术方案选择
- [ ] 模型路由策略
- [ ] 评测自动化程度
- [ ] 监控告警阈值
- [ ] 回滚技术实现产品经理独立决策
markdown
- [ ] 业务优先级
- [ ] 用户体验标准
- [ ] 人工复核策略
- [ ] 灰度放量节奏
- [ ] 对外沟通策略常见协作问题
问题 1:需求频繁变更
表现: 产品经理频繁调整需求,开发者疲于应付
解决:
- 设立需求冻结期
- 变更需要双方确认
- 变更记录存档
问题 2:验收标准模糊
表现: 上线时对"好"的定义不一致
解决:
- 问题定义阶段明确量化指标
- 验收标准文档化
- 评测基线双方确认
问题 3:风险沟通不及时
表现: 风险在上线前才暴露
解决:
- 每周风险更新机制
- 风险清单版本化管理
- 高风险提前预警
问题 4:复盘流于形式
表现: 复盘没有产出,问题重复出现
解决:
- 复盘产出具体行动项
- 行动项有负责人和截止日期
- 下周复盘跟踪上周行动项
