docs(project): 更新 RAG 与模型平台现状
This commit is contained in:
42
AGENT.md
42
AGENT.md
@@ -11,8 +11,8 @@
|
||||
- 文件上传与附件管理
|
||||
- 前后端统一的管理控制台
|
||||
|
||||
当前阶段已经完成平台骨架、公共接口规范、知识库/知识文档管理、文档上传与解析入口。
|
||||
后续重点从"元数据可管"推进到"RAG 可检索"和"Agent 可运行"。
|
||||
当前阶段已经完成平台骨架、公共接口规范、知识库/知识文档管理、文档上传、文档解析、解析快照与手动切片入口。
|
||||
后续重点从"文档可切片"推进到"向量可检索"、"模型可路由"和"Agent 可运行"。
|
||||
|
||||
## 2. 总体设计思路
|
||||
|
||||
@@ -51,16 +51,17 @@
|
||||
|
||||
- `rag_store`:知识库主表(已完成 CRUD、编码唯一性校验)
|
||||
- `rag_document`:知识库文档表(已完成 CRUD、条件查询、批量上传、启停用)
|
||||
- `rag_chunk`:知识切片表结构、实体、Mapper、Service(已完成结构,待生成逻辑)
|
||||
- `rag_chunk_embedding`:切片向量表结构、实体、Mapper、Service(已完成结构,待向量化逻辑)
|
||||
- `rag_chunk`:知识切片表结构、实体、Mapper、Service、定长/分隔符切片器与手动切片入口(已完成基础闭环)
|
||||
- `rag_chunk_embedding`:切片向量表结构、实体、Mapper、Service(已完成结构,待模型网关接入后生成向量)
|
||||
- RAG 解析状态枚举 `RagParseStatusEnum`(已完成)
|
||||
- RAG 索引状态枚举 `RagIndexStatusEnum`(已完成)
|
||||
- RAG 切片策略枚举 `RagChunkStrategyEnum`(已完成)
|
||||
- 文档解析接口 `/api/rag/documents/parse`(已完成状态流转和文本抽取,尚未落切片)
|
||||
- 文档解析接口 `/api/rag/documents/parse`(已完成状态流转、文本抽取和解析快照保存)
|
||||
- 文档切片接口 `/api/rag/documents/chunk`(已完成按解析快照生成并替换 `rag_chunk`)
|
||||
|
||||
后续计划继续扩展:
|
||||
|
||||
- 将解析结果按切片策略写入 `rag_chunk`
|
||||
- 接入模型服务商配置与模型路由,统一管理 Ollama、硅基流动、百炼等模型来源
|
||||
- 调用 Embedding 模型并写入 `rag_chunk_embedding`
|
||||
- 检索召回与重排序
|
||||
- 索引任务、失败重试和任务日志
|
||||
@@ -97,11 +98,12 @@
|
||||
已具备的页面与布局:
|
||||
|
||||
- 左侧管理菜单与品牌区(232px 侧边栏)
|
||||
- 工作台(占位)
|
||||
- RAG 工作台(文档解析与切片概览)
|
||||
- 系统枚举管理页(完整 CRUD + 批量新增)
|
||||
- 附件管理入口(占位)
|
||||
- 知识库管理页(完整 CRUD + 概览卡片 + 双栏详情 + 批量上传入口)
|
||||
- 知识文档页(条件查询 + 批量上传 + 批量解析入口 + 编辑/启停用/删除)
|
||||
- 知识文档页(条件查询 + 批量上传 + 解析重试 + 批量切片 + 编辑/启停用/删除)
|
||||
- 切片任务页(解析成功/失败文档概览与切片入口)
|
||||
|
||||
前端技术要点:
|
||||
|
||||
@@ -121,7 +123,8 @@
|
||||
后续控制台至少继续覆盖:
|
||||
|
||||
- 附件管理页面前端联调
|
||||
- RAG 检索配置、索引任务和最近任务页面联调
|
||||
- RAG 检索配置、向量索引任务和最近任务页面联调
|
||||
- 模型服务商、模型配置、路由规则和调用日志管理
|
||||
- Agent 调试页
|
||||
- 执行日志查看
|
||||
|
||||
@@ -213,27 +216,28 @@
|
||||
2. ~~收紧基础模块~~ `sys_enum`、`sys_attachment`(已完成)
|
||||
3. ~~补全 RAG 基础元数据管理~~ `rag_store`、`rag_document`(已完成)
|
||||
4. ~~补全 RAG 文档上传与解析入口~~ 批量上传、Tika 文本抽取、解析状态流转(已完成)
|
||||
5. 接入切片生成与切片持久化
|
||||
6. 接入 Spring AI Embedding / Chat 模型
|
||||
7. 建立 Agent 运行时骨架
|
||||
8. ~~补前端控制台基础骨架~~(已完成,部分高级页面待联调)
|
||||
5. ~~接入切片生成与切片持久化~~(已完成定长/分隔符切片与手动切片入口)
|
||||
6. 建设模型服务商配置与模型路由层
|
||||
7. 接入 Embedding / Chat 模型并完成向量写入
|
||||
8. 建立 Agent 运行时骨架
|
||||
9. ~~补前端控制台基础骨架~~(已完成,部分高级页面待联调)
|
||||
|
||||
剩余重点:
|
||||
|
||||
- 完成 RAG 解析结果到 `rag_chunk` 的落库闭环
|
||||
- 完成模型服务商配置、模型配置、路由规则和调用日志基础能力
|
||||
- 接入 Embedding,生成并保存 `rag_chunk_embedding`
|
||||
- 补齐索引任务、重试、重建索引和最近任务接口
|
||||
- 接入 Spring AI 并实现最小模型调用链路
|
||||
- 接入 OpenAI-compatible / Spring AI 适配层并实现最小模型调用链路
|
||||
|
||||
## 7. 下一步建议
|
||||
|
||||
结合当前代码状态,接下来建议重点做:
|
||||
|
||||
- 实现解析结果切片:根据 `RagChunkStrategyEnum` 生成 `rag_chunk`
|
||||
- 实现索引入口:对切片调用 Embedding 模型并写入 `rag_chunk_embedding`
|
||||
- 实现模型服务商和模型配置表:支持 Ollama、硅基流动、百炼等 OpenAI-compatible 来源
|
||||
- 实现 Embedding 网关:对已落库切片调用 Embedding 模型并写入 `rag_chunk_embedding`
|
||||
- 把 `indexStatus` 从手工字段推进为真实状态流转
|
||||
- 补齐重建索引、失败重试、最近任务接口和前端展示
|
||||
- 接入 Spring AI,实现最小 Chat / Embedding 调用链路
|
||||
- 接入模型路由,实现本地小模型与云端大模型的成本优先调用链路
|
||||
|
||||
## 8. 文档用途说明
|
||||
|
||||
@@ -247,5 +251,7 @@
|
||||
|
||||
- `agent-runtime.md`
|
||||
- `rag-design.md`
|
||||
- `MODEL_PROVIDER_REQUIREMENTS.md`
|
||||
- `MODEL_PROVIDER_DESIGN.md`
|
||||
- `api-style.md`
|
||||
- `frontend-console.md`
|
||||
|
||||
Reference in New Issue
Block a user