Skip to content

【案例】镜准(JINGZHUN):商品视觉质检与自动改稿 #23

Description

@XiaoyangBi

我做了什么

我做了一个名为“镜准(JINGZHUN)”的电商素材视觉质检与自动改稿应用,面向商品主图和短视频素材,帮助商家先定位低转化问题,再生成可执行的改稿方案。

核心能力:

  • 三步工作流:上传素材与商品信息 -> 视觉质检 -> 自动改稿
  • 支持图片 / 视频素材,支持淘宝、天猫、京东、抖音、小红书、拼多多等平台
  • 自动输出综合评分、问题列表、改稿方向
  • 可继续生成重制主图 / 首屏预览、改稿脚本、字幕精简版与分镜

使用的工具

  • TRAE / 百炼 CLI
  • 百炼模型调用封装:blVisionDescribeblChatJSONblImageEdit
  • 视觉理解模型:qwen3-vl-plus
  • 质检 / 改稿生成模型:qwen3.7-max
  • 图像编辑模型:qwen-image-2.0
  • 前端:Next.js + React

效果展示

  1. 单素材入口支持直接上传主图或短视频,也支持预置案例一键填表和自动上传。
  2. 视觉质检页会给出综合分、问题列表、证据、建议动作,以及首屏与平台化改稿方向。
  3. 自动改稿页会输出重制预览、改稿脚本、字幕精简版、分镜内容,方便继续投放或二次制作。
  4. 整体定位是“帮商家找到低转化素材,并自动给出平台化改稿方案”。

踩坑记录

  • 视觉质检依赖素材状态,如果没有先完成上传,后续步骤会直接失效,因此流程里加了草稿态与缺失重定向保护。
  • 模型调用和本地 CLI 环境不一定稳定,所以做了 fallback 方案;即使 bl 或模型不可用,也能生成保守版质检报告和预览结果。
  • 不同平台的视觉风格差异明显,改稿时不能只做统一文案,需要同时处理首屏层级、字幕密度和平台调性。
  • 图片与视频两类素材链路不同,视频更关注前 3 秒节奏和字幕压缩,图片更关注主标题、留白和卖点聚焦。
  • 我做了什么

效果展示

Image Image Image Image

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions