概要
独立设计并持续迭代 Windows 微信生态智能助手运行时,围绕稳定接入、分层记忆、可降级 RAG 与运行治理,交付可长期运行的桌面化 AI 助手。
业务价值
将微信自动回复脚本升级为具备接入治理、运行诊断与成本分析能力的桌面智能助手,降低长期运行和排障成本。
工程深度
覆盖 `BaseTransport` 抽象、LangGraph 运行时、三层记忆、可降级 RAG、配置热重载与 Prometheus 风格观测链路。
证据来源
README / HIGHLIGHTS / SYSTEM_CHAINS / tests / recent commits
仓库 · 置信度 高 · 验证时间 2026-03-19
- 证据级别:严格复核(核心区仅展示可复核指标)
- 来源类型:仓库/代码记录
- 来源链接:已提供公开链接,可独立复核
- 验证时间:2026-03-19(距今 12 天,时效性高)
判定原因:判定为高置信度:按严格口径整理,可回溯到仓库或代码记录,包含可访问来源链接,验证时间距今 12 天。
查看证据背景
目标是在 Windows 微信生态下交付可长期运行的智能助手,同时兼顾消息接入稳定性、记忆增强、配置治理与运行诊断。
挑战
微信接入边界依赖桌面环境且稳定性敏感;如果把记忆、RAG、诊断和配置能力耦合在主回复链路内,系统很难长期运行与排障。
行动与成果
解决方案
- 重构运行时:以
LangChain + LangGraph 编排 load_context / build_prompt / invoke / finalize_request,把同步回复与后台成长任务分层处理。 - 抽象接入边界:将微信入口统一收敛到
BaseTransport,隔离 Windows 微信版本、权限与消息通道的环境差异。 - 构建三层记忆:落地 SQLite 短期记忆、运行期向量记忆与导出语料 RAG,并支持轻量重排与可选本地
Cross-Encoder 自动回退。 - 补齐治理能力:完善
/api/status、/api/metrics、/api/config/audit、成本分析、配置热重载与 GitHub Release 发布链路。
成果
交付面向 Windows 微信生态的长期运行智能助手,形成从消息接入、记忆增强到运行观测、配置治理与发布交付的完整闭环。
关键指标
抽象 `BaseTransport` 接入层并以 `LangGraph` 重构回复主链,将同步回复与后台成长任务解耦,建立适合长期运行的微信助手架构。 构建 SQLite 短期记忆、运行期向量记忆与导出语料 RAG 三层记忆体系,支持轻量重排与可选本地 `Cross-Encoder` 自动回退,平衡召回质量与部署成本。 补齐 `/api/status`、`/api/metrics`、`/api/config/audit`、成本分析与 GitHub Release 发布链路,完善运行观测、配置审计与交付能力。 落地配置热重载与回复预算控制机制,支持 2 秒回复 deadline 策略,降低桌面场景下的阻塞风险并提升可用性。 技术栈
PythonQuartAsyncioLangGraphRAGElectronSQLiteChromaDBBaseTransportCost Analytics