Files
DEMO-AGENT/docs/原型设计/1.1.资料包导入页原型设计.md

3.6 KiB

资料包导入页原型设计

1. 页面目标

把注册申报资料的导入、解包、扫描、目录汇总和章节点识别结果集中展示出来,让用户第一眼就明白本平台的输入对象是“资料包”,不是单篇文档。

本页还需要明确表达:资料包不是孤立文件集合,而是会与一个审核会话绑定,对话标题默认采用解析后的产品名称。

2. 适用角色

  • 注册资料专员
  • 文档整理人员
  • 演示讲解人

3. 页面布局分区

页面建议采用“三段式”:

  1. 顶部导入条
  2. 中部处理看板
  3. 底部目录汇总区

建议分区:

  • 顶部:批次信息、上传入口、导入方式切换
  • 左侧:文件 / 压缩包导入队列
  • 中部:处理流水线
  • 右侧:异常与待复核箱
  • 底部:目录树与目录汇总表

4. 核心卡片 / 表格 / 状态区

4.1 导入入口卡

展示:

  • 批量文件上传
  • 文件夹导入
  • 压缩包导入
  • 支持格式标签:pdf / docx / doc / zip / rar / 7z

4.2 处理流水线

按步骤展示:

  1. 创建批次
  2. 文件校验
  3. 解包
  4. 文件树扫描
  5. 页数统计
  6. 章节点识别
  7. 目录汇总

每一步显示:

  • 当前状态
  • 处理数量
  • 成功 / 失败数

4.3 异常箱

展示以下异常类型:

  • 页数待复核
  • 扩展名与 MIME 不一致
  • 扫描件待 OCR
  • 章节点识别失败
  • 解包失败

4.4 目录汇总表

表格列建议:

  • 产品名称
  • 关联会话
  • 原始相对路径
  • 文件名
  • 文件类型
  • 页数
  • 页数可信度
  • 章节点
  • 资料名称
  • 处理状态
  • 是否命中法规目录

5. 关键字段定义

页面主要消费 registration_overview_report

关键字段:

  • batch_id
  • product_name
  • conversation_id
  • file_count
  • supported_file_count
  • failed_file_count
  • total_page_count
  • page_count_status
  • chapter_summary
  • documents[]

目录条目关键字段:

  • original_filename
  • relative_path
  • file_type
  • chapter_code
  • chapter_name
  • page_count
  • page_count_confidence
  • processing_status
  • needs_manual_review

6. 关键交互

  • 点击“上传压缩包”后,展示模拟导入进度。
  • 点击目录树节点,可在右侧高亮对应文件。
  • 点击异常项,可筛选下方表格。
  • 点击单个文件行,可打开“文档详情抽屉”,展示页数统计方式和章节点识别结果。
  • 点击资料包标题或“查看对话”,跳转到关联会话。
  • 页面顶部搜索框支持按产品名称或批次号搜索资料包。
  • 点击“在对话中查看完整性节点”,切回 审核智能体 中的对应节点结果。

7. 与上下游页面的数据关系

上游:无,属于演示主线起点。

下游:

  • 法规完整性检查页直接消费目录汇总结果。
  • 字段抽取页复用文档主数据、文本状态和章节点结果。
  • 治理台中的 RAG 文档源管理可从该页二级入口进入。

8. 演示话术重点

  • 强调本平台处理的是整套注册资料,不是单文档聊天。
  • 强调资料包会与会话绑定,用户后续是围绕该产品资料持续对话和追溯。
  • 强调压缩包、目录层级、页数和章节点是后续审核的事实基础。
  • 强调异常箱的价值在于把“资料问题”前置,而不是等到审核后才发现。

9. 与知识库 / 治理台的关联入口

本页应提供以下治理入口:

  • 查看 RAG 入库策略
  • 查看支持文件类型配置
  • 查看章节点识别规则
  • 重跑切片任务

这些入口统一打开治理台抽屉,不在本页直接展开 CRUD。