Files
DEMO-AGENT/docs/原型设计/1.4.字段抽取与字段池页原型设计.md

2.6 KiB

字段抽取与字段池页原型设计

1. 页面目标

展示从说明书、申请表、产品列表等资料中抽取出的结构化字段,并把来源、置信度、标准值、待复核状态和是否可回填统一展示出来。

2. 适用角色

  • 注册资料专员
  • 数据校对人员
  • 模板回填使用人

3. 页面布局分区

建议采用“顶部摘要 + 中部字段池表格 + 右侧来源证据抽屉”。

分区如下:

  • 顶部:字段抽取统计
  • 中部:字段池主表
  • 下方:待复核字段区
  • 右侧:字段来源详情抽屉

4. 核心卡片 / 表格 / 状态区

4.1 抽取摘要卡

展示:

  • 目标字段数量
  • 已抽取数量
  • 待复核字段数量
  • 冲突候选数量
  • 可回填字段数量

4.2 字段池主表

列建议:

  • 字段编码
  • 中文字段名
  • 标准值
  • 原文值
  • 来源文档
  • 来源位置
  • 抽取方式
  • 置信度
  • 冲突状态
  • 待复核状态
  • 是否可回填

4.3 待复核区

重点突出:

  • 低置信度字段
  • 长文本归纳字段
  • 来源不唯一字段

5. 关键字段定义

页面主要消费 registration_field_extraction_report

关键字段:

  • target_field_count
  • extracted_field_count
  • manual_review_field_count
  • conflict_candidate_count
  • field_pool_status
  • field_pool_items[]
  • manual_review_fields[]
  • evidence_refs[]

字段池条目关键字段:

  • field_key
  • field_label
  • standard_value
  • raw_value
  • source_document_name
  • source_location
  • extract_method
  • confidence
  • conflict_status
  • manual_review_required
  • fillable

6. 关键交互

  • 支持按“全部 / 可回填 / 待复核 / 高置信度”切换。
  • 点击字段行打开来源详情。
  • 点击“查看原文片段”展开证据区。
  • 点击“标记推荐值”模拟人工确认。
  • 点击“进入一致性核查”继续主线。

7. 与上下游页面的数据关系

上游:

  • 来自资料导入页的文档主数据
  • 来自完整性检查页的前置校验状态

下游:

  • 一致性核查页直接使用字段池
  • Word 回填导出页使用可回填字段集

8. 演示话术重点

  • 强调统一字段池是后续一致性核查和回填导出的中间事实层。
  • 强调固定字段优先规则抽取,长文本才交给 LLM 辅助归纳。
  • 强调每个字段都有来源,不是“模型猜你要什么”。

9. 与知识库 / 治理台的关联入口

本页应提供:

  • 维护字段 Schema
  • 维护字段来源优先级
  • 查看字段映射规则
  • 重跑抽取策略

这些入口接入治理台的字段 Schema 和模板映射 CRUD。