Files
Pre_Seg_Server/doc
admin 5ab4602535 feat: 完善视频传播、标注编辑和拆帧闭环
- 接入 SAM2 视频传播能力:新增 /api/ai/propagate,支持用当前帧 mask/polygon/bbox 作为 seed,通过 SAM2 video predictor 向前、向后或双向传播,并可保存为真实 annotation。
- 接入 SAM3 video tracker:通过独立 Python 3.12 external worker 调用 SAM3 video predictor/tracker,使用本地 checkpoint 与 bbox seed 执行视频级跟踪,并在模型状态中标记 video_track 能力。
- 完善 SAM 模型分发:sam_registry 按 model_id 明确区分 sam2 propagation 与 sam3 video_track,避免两个模型链路混用。
- 打通前端“传播片段”:VideoWorkspace 使用当前选中 mask 和当前 AI 模型调用后端传播接口,传播结果回写并刷新工作区已保存标注。
- 增强 SAM3 本地 checkpoint 配置:新增 sam3_checkpoint_path 配置和 .env.example 示例,状态检查改为基于本地 checkpoint/独立环境/模型包可用性。
- 完善视频拆帧参数:/api/media/parse 支持 parse_fps、max_frames、target_width,后端任务保存帧时间戳、源帧号和 frame_sequence 元数据。
- 增加运行时 schema 兼容处理:启动时为旧 frames 表补充 timestamp_ms 和 source_frame_number 列,避免旧库升级后缺字段。
- 强化 Canvas 标注编辑:补齐多边形闭合、点工具、顶点拖拽、边中点插入、Delete/Backspace 删除、区域合并和重叠去除等交互。
- 增强语义分类联动:选中 mask 后可通过右侧语义分类树更新标签、颜色和 class metadata,并同步到保存/导出链路。
- 增加关键帧时间轴体验:FrameTimeline 显示具体时间信息,并支持键盘左右方向键切换关键帧。
- 完善 AI 交互分割参数:前端保留正向点、反向点、框选和 interactive prompt 的调用状态,支持 SAM2 细化候选区域与 SAM3 bbox 入口。
- 扩展后端/前端 API 类型:新增 propagateMasks、传播请求/响应 schema,并补齐 annotation、导出、模型状态和任务接口的测试覆盖。
- 更新项目文档:同步 README、AGENTS、接口契约、需求冻结、设计冻结、前端元素审计、实施计划和测试计划,标明真实功能边界与剩余风险。
- 增加测试覆盖:补充 SAM2/SAM3 传播、SAM3 状态、媒体拆帧参数、Canvas 编辑、语义标签切换、时间轴、工作区传播和 API 合约测试。
- 加强仓库安全边界:将 sam3权重/ 加入 .gitignore,避免本地模型权重被误提交。

验证:npm run test:run;pytest backend/tests;npm run lint;npm run build;python -m py_compile;git diff --check。
2026-05-01 20:27:33 +08:00
..

项目文档索引

本目录用于记录当前代码库的真实状态、目标设计与实现差距。文档依据包括:

  • 根目录 Word 文档:语义分割系统构建方案.docx
  • 前端源码:src/App.tsxsrc/components/*.tsxsrc/lib/api.tssrc/store/useStore.ts
  • 后端源码:backend/main.pybackend/routers/*.pybackend/schemas.pybackend/models.py
  • 运行时 OpenAPIhttp://localhost:8000/openapi.json

文档结构

文档 内容
01-purpose-and-word-summary.md 为什么要做这个系统Word 方案中的目标,以及当前代码的落地程度
02-current-implementation-map.md 当前系统怎么运行,前后端、存储、数据流具体怎么串起来
03-frontend-element-audit.md 前端逐页面/逐元素审计真实可用、半可用、Mock/UI-only、接口不通
04-api-contracts.md 前端 API 封装、后端 FastAPI 接口、已完成对齐项和剩余接口问题
05-implementation-plan.md 后续要把 Mock 变成真实功能的建议实施顺序
06-fastapi-docs-explained.md http://192.168.3.11:8000/docs 是什么,怎么看和怎么用
07-current-requirements-freeze.md 当前版本需求冻结,测试以此为准
08-current-design-freeze.md 当前版本设计冻结,记录模块、数据流和接口边界
09-test-plan.md 需求到测试文件的覆盖矩阵和运行命令

状态标记

标记 含义
真实可用 已接真实前端状态或后端 API按当前代码能完成主要动作
部分可用 有真实数据或真实 UI但存在关键缺口例如只读、不能持久化、缺少错误处理
Mock / UI-only 只有展示或本地状态变化,没有真实业务效果
接口不通 前端调用和后端接口契约不一致,按当前代码大概率失败
目标设计 Word 方案中提出,但当前代码尚未实现