介绍
1.1、Cortexa
Cortexa 是一个面向企业生产环境的 RAG 知识平台,围绕三大核心能力构建:
RAG 快速问答:适合日常知识查询,毫秒级返回带引用的答案
ReAct Agent 智能推理:自主编排知识检索、MCP 工具与网络搜索,完成复杂多步任务
Wiki 模式:让 Agent 从原始文档中自治生成相互链接的 Markdown 知识库与可视化知识图谱
搭建完全可私有化部署的模块化架构,Cortexa 帮团队把分散文档沉淀为可查询、可推理、可持续演进的专属知识资产。
1.2、整体能力一览
Cortexa 的能力栈分三层,共 24 个独立可交付的产品模块。
2、架构设计
2.1、三层架构视角
Cortexa 在外部视角上分为三层:客户端层 / 业务层 / 存储层。
Cortexa 三层架构 — 客户端层接入多端,业务层 Java+Python 双栈协作,存储层多组件分工
2.2、业务层内部分层
主服务采用经典四层结构,层与层之间不允许跨层调用。
啰嗦换演进 — 分层的「啰嗦感」换来的是可演进性,这是企业产品五年后还能维护的本钱。
2.3、五大架构思想
2.4、模块化可插拔 — 核心模式
2.5、同步异步双路径
队列叠加三个工程考量:可重试(失败回到队列)、可去重(同资源短时间多次触发只处理一次)、死信兜底(超过重试次数进死信表)。这套机制保证文档处理和向量化任务即便偶有失败也不会丢,生产环境跑得住。
3、功能模块设计
挑出最具工程价值的六个核心模块,讲清楚每个模块「解决什么 / 关键设计 / 工程亮点」。
3.1、六模块全景
3.2、RAG 问答流水线 — Plugin 责任链
Cortexa 的 RAG 流水线不是「检索-生成」两步,真实链路有十余个阶段。我们将其抽象为责任链(Chain of Responsibility)结构,由 EventManager 调度。
抗胡编不依赖 prompt 工程,而是工程层判断:Plugin 5 之后若搜索结果完全为空,直接返回预设话术,不进入 LLM 生成阶段。说白了,RAG 翻车 90% 翻在「该说不知道的时候非要说」,这事儿在系统层就该解决,不该交给 prompt。
4.3、Wiki 自动知识网络 — Map-Reduce
Wiki 模式是 Cortexa 差异化的核心,采用 LLM 驱动的 Map-Reduce 范式实现知识沉淀。
4.4、智能搜索与问答会话
Cortexa 对外提供三种交互模式,共享同一套检索能力。
三种模式共享检索引擎,差异在「后处理深度」。这一抽象让客户能按场景选型:对延迟敏感选普通搜索,对答案要求高选问答会话。
4.5、Agent ReAct 执行闭环
如果 RAG 是「Cortexa 帮我答」,Agent 是「Cortexa 帮我做」。
跨轮 KB 工具结果脱敏是一个非常微妙的生产化设计:多轮对话中,前序回合的 KB 检索结果可能与当前 KB 状态不一致。我们将历史 KB 结果替换为提示文本「知识库可能已变更,请重新检索」,强制 LLM 重新检索而非沿用旧结果。这事儿避免了 90% 的「为什么 AI 还在用过时信息」类投诉。
4.6、安全纵深防御(模型管理 + 沙箱)
模型管理与沙箱执行共同构成 Cortexa 的安全底座,采用 6 层纵深防御。
总结
参考文档:https://mp.weixin.qq.com/s/UF54KfM8dKF1KW3_69W8xw?mpshare=1&scene=1&srcid=0522COWsiXWgpE0lIcfYIzfO&sharer_shareinfo=b769f785b260459be4db8ea6326073c8&sharer_shareinfo_first=3e1590f843ed5f9c4a11cc3fa7bbef04&version=5.0.8.99856&platform=mac#rd