docs(project): 更新 RAG 与模型平台现状

This commit is contained in:
2026-05-25 00:39:11 +08:00
parent 705034d41b
commit 58a6786f17
5 changed files with 110 additions and 60 deletions

View File

@@ -86,7 +86,7 @@
- 维护 RAG 知识库主数据CRUD + 编码唯一性校验)。
- 维护知识库文档与附件的关联关系。
- 支持知识文档批量上传、解析入口解析状态流转。
- 支持知识文档批量上传、解析入口解析快照、手动切片入口和状态流转。
- 定义切片、向量、解析状态、索引状态和 RAG 相关来源常量。
关键类:
@@ -102,6 +102,10 @@
| RagStoreServiceImpl | `rag/service/impl/RagStoreServiceImpl.java` |
| RagDocumentServiceImpl | `rag/service/impl/RagDocumentServiceImpl.java` |
| RagDocumentParseServiceImpl | `rag/service/impl/RagDocumentParseServiceImpl.java` |
| RagDocumentChunkServiceImpl | `rag/service/impl/RagDocumentChunkServiceImpl.java` |
| ChunkerFactory | `rag/parse/ChunkerFactory.java` |
| FixedLengthChunker | `rag/parse/impl/FixedLengthChunker.java` |
| DelimiterChunker | `rag/parse/impl/DelimiterChunker.java` |
| RagParseStatusEnum | `rag/enums/RagParseStatusEnum.java` |
| RagIndexStatusEnum | `rag/enums/RagIndexStatusEnum.java` |
| RagChunkStrategyEnum | `rag/enums/RagChunkStrategyEnum.java` |
@@ -125,12 +129,14 @@
| POST | `/api/rag/documents/delete` | 删除知识文档 |
| POST | `/api/rag/documents/batchUpload` | 批量上传文档并创建 `rag_document` |
| POST | `/api/rag/documents/parse` | 批量解析知识文档 |
| POST | `/api/rag/documents/chunk` | 按策略异步生成文档切片 |
当前边界:
- 知识库 CRUD、文档 CRUD、批量上传、Tika 文本解析和状态流转已完成。
- 解析结果当前只返回给调用方并更新文档状态,尚未写入 `rag_chunk`
- `rag_chunk``rag_chunk_embedding` 的结构层已就绪,尚未实现切片生成、向量化、索引任务和检索问答。
- 知识库 CRUD、文档 CRUD、批量上传、Tika 文本解析、解析快照和状态流转已完成。
- `rag_chunk` 已支持基于解析快照的手动异步切片,当前已落地定长切片和分隔符切片
- `rag_chunk_embedding` 的结构层已就绪,尚未实现模型调用、向量化、索引任务和检索问答。
- 模型服务商配置与路由已有需求/设计文档,后续会作为 Embedding、Chat 和 Rerank 的统一接入层。
## 4. 数据模型关系
@@ -177,15 +183,16 @@
## 7. 当前不足
- RAG 尚未进入"可检索链路",当前完成上传解析,但未完成切片、向量化和召回。
- RAG 尚未进入"可检索链路",当前完成上传解析和手动切片,但未完成向量化和召回。
- 模型服务商配置、模型路由和调用日志尚未落地代码。
- Agent 运行时相关模型与服务尚未开始建设。
- 前端部分页面(工作台、附件管理、检索配置、最近任务)为占位或后续能力提示。
- 前端部分页面(附件管理、检索配置、最近任务)为占位或后续能力提示。
- 缺少鉴权、租户、操作日志。
## 8. 建议演进方向
1. 补 RAG 最小检索闭环:解析文本 → 生成切片 → 生成向量 → 检索召回。
2. 接入 Spring AI实现最小模型调用链路
2. 建设模型服务商配置与路由层,统一接入 Ollama、硅基流动、百炼等 OpenAI-compatible 来源
3. 建设 Agent 域模型Agent、Session、Message、Tool、Task。
4. 补齐索引任务、重试、重建索引和前端任务视图。
5. 衔接模型供应商、工作流编排和前端管理台。
5. 衔接模型供应商、Spring AI 适配层、工作流编排和前端管理台。