需求背景
目前 Clawith 不支持上传扫描件(如 PDF 图片、扫描的合同/发票/报表等)进行文字识别。用户希望平台能够识别扫描件中的文字内容,并进行后续的数据处理。
需求描述
- 支持上传扫描件(PDF/图片格式)进行 OCR 文字识别
- 将 ETL(Extract-Transform-Load)能力封装为 MCP Server 接入 Clawith
功能要求
OCR 识别能力
ETL 能力 MCP 化
集成方式
技术建议
- OCR 服务可选:飞书开放平台 OCR、百度 OCR、阿里云 OCR、Tesseract 等
- ETL 框架可参考:Airbyte、dbt、Pandas 等
- 注意文件存储安全与隐私保护
- 考虑大文件处理的性能与超时问题
应用场景
- 发票/报销单自动识别与录入
- 合同关键信息提取
- 报表数据自动化处理
- 名片/证件信息识别
- 历史纸质文档数字化
优先级
中高 - 提升平台数据处理能力,扩展 Agent 应用场景
报告信息
需求背景
目前 Clawith 不支持上传扫描件(如 PDF 图片、扫描的合同/发票/报表等)进行文字识别。用户希望平台能够识别扫描件中的文字内容,并进行后续的数据处理。
需求描述
功能要求
OCR 识别能力
ETL 能力 MCP 化
集成方式
技术建议
应用场景
优先级
中高 - 提升平台数据处理能力,扩展 Agent 应用场景
报告信息