里程碑定位 : M2.3 是 Stage 2 的第三个发布,重点是企业级功能与生产监控
发布时间 : 2026-04-27 (目标)
发布版本 : v0.4.0-rc.1
面向对象 : 企业用户 + 生产环境试点
关键成果 : OpenMetrics 监控 + Web UI + 集群同步 + 安全认证
✅ OpenMetrics 监控接口 (Prometheus 兼容)
✅ Web UI 管理界面 (React 前端)
✅ 集群模式 (多设备自动同步)
✅ TLS 安全通信 + RBAC 权限控制
✅ 分布式追踪 (OpenTelemetry)
✅ 企业级日志系统 (ELK 兼容)
功能
描述
工作量
依赖
OpenMetrics
Prometheus /metrics 端点
400 LOC
基础库
Web UI
React 仪表板
1200 LOC
Node.js
集群模式
RAFT 一致性算法
600 LOC
PTP 时钟
TLS/RBAC
安全认证
300 LOC
Openssl
OpenTelemetry
分布式追踪
250 LOC
追踪库
ELK 日志
结构化日志
200 LOC
JSON 序列化
第 1 周 (Mar 17-23) - 监控基础架构
日期
任务
目标 LOC
关键输出
3/17
OpenMetrics 框架
100
/metrics 端点、指标数据结构
3/18
核心指标采集
150
PTP、TSN、系统指标采集
3/19
Prometheus 适配
80
格式化输出、标签管理
3/20-21
集成与性能优化
70
<1% 开销验证、缓存机制
3/23
单元测试与文档
-
测试覆盖 80%+, Doxygen
日期
任务
关键输出
3/17
原型设计
Figma 仪表板设计
3/18
项目骨架
React 项目结构、路由配置
3/19
基础组件库
通用 UI 组件 (表格、图表、卡片)
3/20
API 集成
fetch /metrics, WebSocket 连接
3/23
初步审查
UI 规范化、反馈收集
日期
任务
关键输出
3/17
Docker Compose
完整应用栈 (后端+前端+Prometheus)
3/18
Kubernetes 准备
Helm Chart 骨架
3/19-23
开发环境
本地开发环境文档、CI/CD 流水线
第 2 周 (Mar 24-30) - Web UI 与集群基础
日期
任务
目标 LOC
关键输出
3/24
实时仪表板
200
指标图表、数值展示、刷新
3/25
配置页面
150
PTP/TSN 参数编辑、保存
3/26
设备管理
150
设备列表、状态监控、添加删除
3/27
告警管理
100
告警规则配置、告警历史
3/30
测试与优化
-
响应式设计、性能优化
日期
任务
目标 LOC
关键输出
3/24
集群发现机制
80
设备自动发现、心跳检测
3/25
RAFT 框架集成
120
Leader 选举、日志复制基础
3/26
状态同步
100
时钟状态、配置同步
3/27-30
集成测试
-
单机→3 节点集群测试
日期
任务
关键输出
3/24
认证框架设计
JWT + 刷新令牌方案
3/25
后端认证实现
用户验证、令牌生成
3/26
前端认证集成
登录页面、令牌管理
3/27-30
测试与文档
认证流程完整
第 3 周 (Mar 31 - Apr 6) - 安全与追踪
日期
任务
目标 LOC
关键输出
3/31
TLS 支持
80
HTTPS 端点、证书管理
4/1
RBAC 实现
150
角色定义、权限检查
4/2
审计日志
70
操作记录、变更跟踪
4/3-6
安全测试
-
渗透测试、合规性检查
日期
任务
目标 LOC
关键输出
3/31
OpenTelemetry 集成
80
追踪导出器配置
4/1
关键路径追踪
120
PTP/TSN 关键操作追踪
4/2
Jaeger 兼容性
50
追踪数据格式验证
4/3-6
追踪验证
-
端到端追踪验证
日期
任务
目标 LOC
关键输出
3/31
结构化日志
80
JSON 格式日志、时间戳
4/1
ELK 适配
70
Logstash 配置、索引管理
4/2
日志级别管理
50
动态日志级别调整
4/3-6
ELK 栈测试
-
日志收集、查询验证
日期
任务
关键输出
4/7-8
功能集成
所有模块联合测试
4/9
端到端测试
用户场景验证
4/10
性能验证
监控开销 <1%, 响应 <200ms
4/11
安全扫描
代码扫描、依赖检查
4/12
文档完成
API、部署、运维指南
4/13
发布准备
v0.4.0-rc.1 标签、镜像构建
日期
任务
关键输出
4/7
Release Notes
功能清单、已知问题
4/8
部署文档
Docker、Kubernetes 部署指南
4/9
运维手册
监控、告警、故障排除
4/10
用户指南
Web UI 使用、配置说明
4/11
开发者文档
API 参考、扩展指南
4/13
社区通知
发布公告、邮件通知
1. 指标导出
- PTP 指标: 精度、延迟、收敛时间、偏差
- TSN 指标: 队列长度、丢包率、延迟、吞吐量
- 系统指标: CPU、内存、网络 I/O
- 格式: Prometheus text format
2. 数据聚合
- 1 分钟平均值
- 1 小时 P95/P99
- 日统计 min/max/avg
3. 性能指标
- 导出开销: <1% CPU
- 内存占用: <50MB
- 网络开销: <100 KB/min
1. 实时监控
- 指标图表 (折线、柱状、仪表)
- 告警面板 (实时告警, 历史记录)
- 设备状态 (在线/离线, 性能指标)
2. 配置管理
- PTP Master 参数调整
- TSN 流量规则编辑
- 设备配置下发
3. 数据分析
- 性能趋势分析 (日/周/月)
- 对比分析 (多设备对比)
- 导出数据 (CSV/JSON)
4. 响应式设计
- 桌面端 (1920x1080)
- 平板端 (768x1024)
- 移动端 (375x667)
1. 集群架构
- 最多 N 个节点
- RAFT 一致性
- 自动故障转移 <1s
2. 功能特性
- Leader 自动选举
- 日志复制与应用
- 快照与恢复
- 节点动态增删
3. 数据同步
- 时钟状态同步
- 配置变更同步
- 优先级: Leader → Follower
1. 用户认证
- JWT 令牌认证
- 用户密码管理
- 会话管理
2. 权限控制 (RBAC)
- 角色: Admin, Operator, Viewer
- 权限: 读、写、删除
- 资源级权限控制
3. 传输安全
- TLS 1.3 强制
- 证书管理
- HTTPS 重定向
4. 审计日志
- 所有操作记录
- 变更追踪
- 合规性报告
功能
验收标准
OpenMetrics
/metrics 端点正常, Prometheus 能采集
Web UI
所有页面响应式, 5 大功能正常
集群
3 节点集群正常运行, Leader 转移 <1s
安全
TLS+RBAC 完整, 无安全漏洞
追踪
OpenTelemetry 导出, Jaeger 可视化
日志
ELK 栈完整, 日志查询正常
Web UI:
- 首屏加载: <2s
- 交互响应: <200ms
- 内存占用: <200MB
监控:
- 指标采集开销: <1% CPU
- 导出延迟: <100ms
- 内存占用: <50MB
集群:
- 节点发现: <5s
- 数据同步: <100ms
- Leader 转移: <1s
- 代码行数: 2500+ LOC
* 后端: 1100+ LOC
* 前端: 1200+ LOC
* 基础设施: 200+ LOC
- 测试覆盖: 80%+
* 后端单元测试: 85%+
* 前端组件测试: 75%+
* 集成测试: 5+ 场景
- 编译检查:
* 0 编译警告
* 0 内存泄漏
* TypeScript 严格模式
- 渗透测试: OWASP Top 10 全覆盖
- 代码扫描: SonarQube 无 Critical 问题
- 依赖检查: 无已知高危漏洞
- 日志审计: 100% 操作记录
ID
风险
概率
影响
缓解措施
RISK-M23-001
Web UI 开发延期
40%
中
4/1 简化 UI, 推后高级功能
RISK-M23-002
RAFT 一致性问题
25%
高
3/20 选型替代方案 (etcd)
RISK-M23-003
TLS 性能开销过大
15%
中
4/3 开启 TLS 优化, 连接复用
RISK-M23-004
前后端集成困难
30%
中
3/20 API 早期冻结, 并行开发
✅ OpenMetrics 完整导出
✅ Web UI 所有页面正常
✅ 集群 3 节点稳定运行
✅ TLS+RBAC 完整实现
✅ 代码覆盖率 80%+
✅ 安全扫描 0 Critical
✅ 性能指标达标
❌ Web UI 功能不完整 (<60%)
❌ 集群同步不稳定 (一致性失败)
❌ 安全漏洞无法修复
❌ 代码覆盖率 <75%