Skip to content

[Bug] 导出Excel(QA问答对)时未保留段落顺序,导致知识库迁移后结构错乱 #4818

@liutanming6-afk

Description

@liutanming6-afk

Contact Information

3265490198@qq.com

MaxKB Version

v2.6.1

Problem Description

在进行知识库迁移(复制)时,使用"导出Excel(QA问答对)→导入QA问答对"的官方推荐路径,发现导出的Excel文件行顺序与原文档段落顺序不一致,导致迁移后的知识库段落结构完全错乱。
具体说明:原文档按"1. nerdctl部署 → 2. nerdctl基础环境安装 → 3. JumpServer安装配置"的顺序分段,但导出后的Excel中第1章内容出现在第20行,整体顺序被打乱。这破坏了文档的逻辑结构和阅读顺序。

Image Image Image Image

Steps to Reproduce

  1. 创建知识库并上传一份有明确章节顺序的文档;
  2. 等待系统自动分段完成,确认分段详情中段落顺序正确(与原文档一致);
  3. 勾选该文档,点击【导出】,选择"Excel(QA问答对)"格式,下载到本地;
  4. 打开导出的.xlsx文件,发现"章节标题"列的顺序出现错乱;
  5. 使用此Excel文件通过【上传文档→QA问答对】导入到新知识库;
  6. 查看导入后的分段详情,发现标题列表顺序同样错乱。

The expected correct result

导出的Excel文件应该严格按照原文档的段落顺序排列,这样用户通过"导出-导入"方式迁移知识库时,能够完整保留原文档的结构和逻辑顺序。

Related log output

Additional Information

使用zip导出导入也会出现同样的顺序混乱

Metadata

Metadata

Assignees

Labels

Type

No type

Projects

No projects

Milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions