字段抽取报告生成Skill 设计

1. Skill 定位

字段抽取报告生成Skill 负责将字段池写入结果组装成稳定的 registration_field_extraction_report，并生成页面展示、审计和飞书摘要所需的数据结构。

英文实现标识建议使用 FieldExtractionReportBuildSkill。

2. 输入

@dataclass
class FieldExtractionReportBuildInput:
    context: FieldExtractionContext
    field_pool_items: list[FieldPoolItem]
    manual_review_fields: list[dict]
    tool_calls: list[dict]

3. 输出

@dataclass
class FieldExtractionReportBuildOutput:
    report: dict
    display_sections: list[dict]
    audit_payload: dict
    feishu_summary_payload: dict

4. 报告结构

报告必须包含：

report_type
batch_id
field_schema_id
field_schema_version
summary
field_pool_items
manual_review_fields
evidence_refs
tool_calls

5. 核心方法

5.1 `run(input) -> FieldExtractionReportBuildOutput`

主入口方法。

5.2 `build_summary(field_pool_items) -> dict`

汇总字段数量、已抽取数量、待复核数量和冲突候选数量。

5.3 `build_field_rows(field_pool_items) -> list[dict]`

生成字段池页面表格。

5.4 `build_audit_payload(report, context) -> dict`

生成审计载荷。

5.5 `build_feishu_summary_payload(report) -> dict`

生成飞书摘要载荷。

6. 技术实现

使用技术：

dataclass/Pydantic
JSONField
Audit 服务
页面展示 schema

7. 异常处理

字段池为空：输出空报告并提示无可用字段。
报告字段缺失：任务失败。
审计写入失败：报告仍返回，但记录系统警告。
飞书摘要构建失败：不影响 Web 报告。

8. 测试要点

输出 schema 稳定。
字段池行展示完整。
审计载荷包含字段 schema 版本。
飞书摘要不包含敏感信息。

1.9 KiB Raw Blame History