我做了什么
使用 Antigravity + 百炼 CLI,搭建了一个具有顶级视觉品味的电商内容策展工坊。
用户只需上传一张商品参考照或草图并输入简短说明:
- 后端调用 Qwen-VL (bl vision describe) 提取商品高保真的器形、材质、色彩和标签特征。
- 将主体特征融入三个专业电商镜头 Prompt(全景意境、宏观特写、生活日常),通过百炼 bl image generate 并行生成多角度的三帧主图分镜。
- 将第一张分镜大片传入 HappyHorse (bl video generate) 烘焙出 5 秒的光影微移运镜视频。
- 使用 CosyVoice 闪播模型 (bl speech synthesize) 朗读由 Qwen3.7 策划的优雅杂志解说文案。
- 前端利用 React + Tailwind CSS v4 + Framer Motion 编排成 Bento Grid 展示面板,带有 3D 深度随动、发光打字机、分镜切换视差以及沉浸式有声视频剧院弹窗。
使用的工具
- 百炼 CLI:
- bl vision describe(多模态主体特征提取)
- bl image generate(多视角主图分镜渲染)
- bl video generate(氛围感图像变视频)
- bl speech synthesize(CosyVoice 旁白配音合成)
- bl text chat(Qwen 广告解说词撰写)
- 其他:React、Tailwind CSS v4、Framer Motion 、Node.js Express 后端服务器,Antigravity
效果展示
踩坑记录(可选)
以下由 AI 总结和生成
- 命令行特殊字符转义语法错误:Qwen-VL 返回的英文视觉描述中往往包含双引号(")和圆括号(())。当使用 Node.js 的 exec 进行 shell 字符串拼接时,这些字符直接破坏了外部命令行包裹,导致进程中断。
- 解决方法:后端全面废弃 exec 拼接,改用 Node 原生安全的 execFile("bl", ["text", "chat", "--message", textPrompt]) 数组传参模式,不经由 Shell 解析,完美根治了任何符号导致运行中断的问题,并强制开启 --output text 纯文本接收模式。
- Qwen-Image 多种子高度重合问题:直接调用 bl image generate --n 3 产生的 3 张图只有微小光斑变动,视角完全没有变化。
- 解决方法:设计了专业电商镜头 Prompt 矩阵(全景意境Establishing、微距特写Macro、生活日常Lifestyle),进行多路并行并发调用,不仅完美拉开了视角与拍摄构图的丰富度,同时保证了生图效率。
- CosyVoice-v3-flash 声音命名限制:新版声音名称必须带有 _v3 后缀(如 longwan_v3),如果填入老版音色名(如 longwan 或 longanyang)会直接报 418 请求错误。
- 解决方法:使用 bl speech synthesize --list-voices --model cosyvoice-v3-flash 查询并更新音色 ID 后解决。
- 视频由于 Object-Cover 产生画幅截断:由于 Bento 布局中视频卡片尺寸固定,object-cover 填充模式会导致长画幅视频的边缘被裁剪,且默认循环播放时处于静音状态。
- 解决方法:在卡片边缘新增了网格内“Fit / Fill”自适应画幅切换开关,并集成了沉浸式 Fullscreen Lightbox 剧院模式,点击可唤醒解除静音、带全套原装控制器的无损大片播放弹窗。
我做了什么
使用 Antigravity + 百炼 CLI,搭建了一个具有顶级视觉品味的电商内容策展工坊。
用户只需上传一张商品参考照或草图并输入简短说明:
使用的工具
效果展示
踩坑记录(可选)