2.6 KiB
2.6 KiB
字段抽取与字段池页原型设计
1. 页面目标
展示从说明书、申请表、产品列表等资料中抽取出的结构化字段,并把来源、置信度、标准值、待复核状态和是否可回填统一展示出来。
2. 适用角色
- 注册资料专员
- 数据校对人员
- 模板回填使用人
3. 页面布局分区
建议采用“顶部摘要 + 中部字段池表格 + 右侧来源证据抽屉”。
分区如下:
- 顶部:字段抽取统计
- 中部:字段池主表
- 下方:待复核字段区
- 右侧:字段来源详情抽屉
4. 核心卡片 / 表格 / 状态区
4.1 抽取摘要卡
展示:
- 目标字段数量
- 已抽取数量
- 待复核字段数量
- 冲突候选数量
- 可回填字段数量
4.2 字段池主表
列建议:
- 字段编码
- 中文字段名
- 标准值
- 原文值
- 来源文档
- 来源位置
- 抽取方式
- 置信度
- 冲突状态
- 待复核状态
- 是否可回填
4.3 待复核区
重点突出:
- 低置信度字段
- 长文本归纳字段
- 来源不唯一字段
5. 关键字段定义
页面主要消费 registration_field_extraction_report。
关键字段:
target_field_countextracted_field_countmanual_review_field_countconflict_candidate_countfield_pool_statusfield_pool_items[]manual_review_fields[]evidence_refs[]
字段池条目关键字段:
field_keyfield_labelstandard_valueraw_valuesource_document_namesource_locationextract_methodconfidenceconflict_statusmanual_review_requiredfillable
6. 关键交互
- 支持按“全部 / 可回填 / 待复核 / 高置信度”切换。
- 点击字段行打开来源详情。
- 点击“查看原文片段”展开证据区。
- 点击“标记推荐值”模拟人工确认。
- 点击“进入一致性核查”继续主线。
7. 与上下游页面的数据关系
上游:
- 来自资料导入页的文档主数据
- 来自完整性检查页的前置校验状态
下游:
- 一致性核查页直接使用字段池
- Word 回填导出页使用可回填字段集
8. 演示话术重点
- 强调统一字段池是后续一致性核查和回填导出的中间事实层。
- 强调固定字段优先规则抽取,长文本才交给 LLM 辅助归纳。
- 强调每个字段都有来源,不是“模型猜你要什么”。
9. 与知识库 / 治理台的关联入口
本页应提供:
维护字段 Schema维护字段来源优先级查看字段映射规则重跑抽取策略
这些入口接入治理台的字段 Schema 和模板映射 CRUD。