Commit Graph

13 Commits (24e434eb3a3ebd00211c02da7ed27a5b96c5fd53)

Author SHA1 Message Date
陈曦 1383caf249 LPMM 知识库删除能力与自检脚本增强(附关键健壮性修复)
为 LPMM 新增安全可控的删除能力:
KGManager.delete_paragraphs 支持按段落/实体哈希删除图节点及关联边,可选清理孤立实体,并从图中重建元数据
统一删除脚本 scripts/delete_lpmm_items.py,支持按批次(OpenIE 文件)、哈希文件、原始文本段落、关键字搜索进行删除,内置 dry-run 和最大节点数保护
新增自检与回归脚本:
scripts/inspect_lpmm_batch.py / scripts/inspect_lpmm_global.py 用于批次级和全局状态检查
scripts/test_lpmm_retrieval.py 一键初始化 LPMM 并用固定问题测试检索效果。
健壮性与性能保护:
在 KGManager.kg_search 中对 ent_appear_cnt 缺失增加兜底,避免实体权重计算时的 KeyError。
增加同义实体数量限制与 PPR 节点/关系阈值,必要时自动退回纯向量检索
文档补充:
docs-src/lpmm_user_guide.md:面向零基础用户的导入 / 删除 / 自检脚本使用指南
docs-src/lpmm_parameters_guide.md:[lpmm_knowledge] 关键参数说明与简单调参建议
2025-11-27 13:20:12 +08:00
墨梓柒 163dbb6b90
超级Ruff 2025-09-09 19:25:12 +08:00
墨梓柒 f15e074cca
feat: 重构信息提取模块,移除LLMClient依赖,改为使用LLMRequest,优化数据加载和处理逻辑 2025-07-15 16:54:25 +08:00
春河晴 7b4e7b94f8
use structlog instead of loguru 2025-06-11 15:17:08 +09:00
墨梓柒 ab2b7ec9ed
feat: 知识库小重构x2 2025-06-07 13:46:24 +08:00
SengokuCola fed71bccad fix:调整目录结构,优化hfc prompt,移除日程,移除动态和llm判断willing模式, 2025-05-13 18:37:55 +08:00
墨梓柒 5fafa2a892 feat: 增强数据导入处理,新增非法文段检测与用户确认删除功能;优化原始数据路径创建与日志记录 2025-05-05 21:27:11 +08:00
SengokuCola 021ac90ead fix:修改bat错误描述 2025-05-02 19:46:04 +08:00
SengokuCola deae6f95cb Merge branch 'dev' of https://github.com/MaiM-with-u/MaiBot into dev 2025-05-02 19:19:33 +08:00
SengokuCola a859f9238f better:优化可读性 2025-05-02 19:17:59 +08:00
墨梓柒 03961b71a2 feat: 更新数据路径配置,增强数据处理功能并优化错误提示 2025-05-02 13:42:28 +08:00
github-actions[bot] b6ce33f469 🤖 自动格式化代码 [skip ci] 2025-04-28 14:30:40 +00:00
墨梓柒 93b4a431c9 杀另一部分文件 2025-04-28 22:29:11 +08:00