# 字段抽取与字段池页原型设计 ## 1. 页面目标 展示从说明书、申请表、产品列表等资料中抽取出的结构化字段,并把来源、置信度、标准值、待复核状态和是否可回填统一展示出来。 在最新版原型中,本页对应 `审核智能体` 中“字段抽取”节点的细化视图。 ## 2. 适用角色 - 注册资料专员 - 数据校对人员 - 模板回填使用人 ## 3. 页面布局分区 建议采用“顶部摘要 + 中部字段池表格 + 右侧来源证据抽屉”。 分区如下: - 顶部:字段抽取统计 - 中部:字段池主表 - 下方:待复核字段区 - 右侧:字段来源详情抽屉 ## 4. 核心卡片 / 表格 / 状态区 ### 4.1 抽取摘要卡 展示: - 目标字段数量 - 已抽取数量 - 待复核字段数量 - 冲突候选数量 - 可回填字段数量 ### 4.2 字段池主表 列建议: - 字段编码 - 中文字段名 - 标准值 - 原文值 - 来源文档 - 来源位置 - 抽取方式 - 置信度 - 冲突状态 - 待复核状态 - 是否可回填 ### 4.3 待复核区 重点突出: - 低置信度字段 - 长文本归纳字段 - 来源不唯一字段 ## 5. 关键字段定义 页面主要消费 `registration_field_extraction_report`。 关键字段: - `target_field_count` - `extracted_field_count` - `manual_review_field_count` - `conflict_candidate_count` - `field_pool_status` - `field_pool_items[]` - `manual_review_fields[]` - `evidence_refs[]` 字段池条目关键字段: - `field_key` - `field_label` - `standard_value` - `raw_value` - `source_document_name` - `source_location` - `extract_method` - `confidence` - `conflict_status` - `manual_review_required` - `fillable` ## 6. 关键交互 - 支持按“全部 / 可回填 / 待复核 / 高置信度”切换。 - 点击字段行打开来源详情。 - 点击“查看原文片段”展开证据区。 - 点击“标记推荐值”模拟人工确认。 - 点击“在对话中查看一致性核查节点”,回到 `审核智能体` 继续主线。 ## 7. 与上下游页面的数据关系 上游: - 来自资料导入页的文档主数据 - 来自完整性检查页的前置校验状态 下游: - 一致性核查页直接使用字段池 - Word 回填导出页使用可回填字段集 ## 8. 演示话术重点 - 强调统一字段池是后续一致性核查和回填导出的中间事实层。 - 强调固定字段优先规则抽取,长文本才交给 LLM 辅助归纳。 - 强调每个字段都有来源,不是“模型猜你要什么”。 ## 9. 与知识库 / 治理台的关联入口 本页应提供: - `维护字段 Schema` - `维护字段来源优先级` - `查看字段映射规则` - `重跑抽取策略` 这些入口接入治理台的字段 Schema 和模板映射 CRUD。