# 资料包导入页原型设计 ## 1. 页面目标 把注册申报资料的导入、解包、扫描、目录汇总和章节点识别结果集中展示出来,让用户第一眼就明白本平台的输入对象是“资料包”,不是单篇文档。 本页还需要明确表达:资料包不是孤立文件集合,而是会与一个审核会话绑定,对话标题默认采用解析后的产品名称。 ## 2. 适用角色 - 注册资料专员 - 文档整理人员 - 演示讲解人 ## 3. 页面布局分区 页面建议采用“三段式”: 1. 顶部导入条 2. 中部处理看板 3. 底部目录汇总区 建议分区: - 顶部:批次信息、上传入口、导入方式切换 - 左侧:文件 / 压缩包导入队列 - 中部:处理流水线 - 右侧:异常与待复核箱 - 底部:目录树与目录汇总表 ## 4. 核心卡片 / 表格 / 状态区 ### 4.1 导入入口卡 展示: - 批量文件上传 - 文件夹导入 - 压缩包导入 - 支持格式标签:`pdf / docx / doc / zip / rar / 7z` ### 4.2 处理流水线 按步骤展示: 1. 创建批次 2. 文件校验 3. 解包 4. 文件树扫描 5. 页数统计 6. 章节点识别 7. 目录汇总 每一步显示: - 当前状态 - 处理数量 - 成功 / 失败数 ### 4.3 异常箱 展示以下异常类型: - 页数待复核 - 扩展名与 MIME 不一致 - 扫描件待 OCR - 章节点识别失败 - 解包失败 ### 4.4 目录汇总表 表格列建议: - 产品名称 - 关联会话 - 原始相对路径 - 文件名 - 文件类型 - 页数 - 页数可信度 - 章节点 - 资料名称 - 处理状态 - 是否命中法规目录 ## 5. 关键字段定义 页面主要消费 `registration_overview_report`。 关键字段: - `batch_id` - `product_name` - `conversation_id` - `file_count` - `supported_file_count` - `failed_file_count` - `total_page_count` - `page_count_status` - `chapter_summary` - `documents[]` 目录条目关键字段: - `original_filename` - `relative_path` - `file_type` - `chapter_code` - `chapter_name` - `page_count` - `page_count_confidence` - `processing_status` - `needs_manual_review` ## 6. 关键交互 - 点击“上传压缩包”后,展示模拟导入进度。 - 点击目录树节点,可在右侧高亮对应文件。 - 点击异常项,可筛选下方表格。 - 点击单个文件行,可打开“文档详情抽屉”,展示页数统计方式和章节点识别结果。 - 点击资料包标题或“查看对话”,跳转到关联会话。 - 页面顶部搜索框支持按产品名称或批次号搜索资料包。 - 点击“在对话中查看完整性节点”,切回 `审核智能体` 中的对应节点结果。 ## 7. 与上下游页面的数据关系 上游:无,属于演示主线起点。 下游: - 法规完整性检查页直接消费目录汇总结果。 - 字段抽取页复用文档主数据、文本状态和章节点结果。 - 治理台中的 RAG 文档源管理可从该页二级入口进入。 ## 8. 演示话术重点 - 强调本平台处理的是整套注册资料,不是单文档聊天。 - 强调资料包会与会话绑定,用户后续是围绕该产品资料持续对话和追溯。 - 强调压缩包、目录层级、页数和章节点是后续审核的事实基础。 - 强调异常箱的价值在于把“资料问题”前置,而不是等到审核后才发现。 ## 9. 与知识库 / 治理台的关联入口 本页应提供以下治理入口: - `查看 RAG 入库策略` - `查看支持文件类型配置` - `查看章节点识别规则` - `重跑切片任务` 这些入口统一打开治理台抽屉,不在本页直接展开 CRUD。