会议主题:智能体架构设计与业务落地研讨会
发言人:大石头、党章、笑、风浪、188****8895等12人
会议摘要:本次会议围绕智能体(Agent)的架构设计、技能管理及业务落地进行了深度研讨,重点探讨了服务端与客户端的技能分层策略、招投标文档生成中的格式合规难题,以及面向特定场景的单机版 RAG 系统实现方案。


一、智能体架构设计与技能管理策略
针对智能体开发中技能维护成本高、上下文过长及安全管控难的问题,与会者提出了以下解决方案:

  1. 分层架构与技能管理
    服务端与客户端分层策略:大石头提出将技能维护在服务端,客户端仅处理本地特权数据(如本地文件、浏览器操作)。服务端根据用户身份和场景动态加载技能,并通过拦截机制处理服务端工具调用,以此实现技能的统一管理与复用。
    技能依赖与引用机制:建立了技能间的层次关系,例如基础名词解释技能作为底层依赖,上层业务技能可直接引用,避免重复开发。
    上下文长度控制方案:针对长对话导致的 Token 超限问题,建议采用 LangGraph 等框架进行摘要压缩,或通过限制对话轮数来控制成本。
  2. 安全与权限管控
    安全边界隔离:风浪提出将部署智能体的机器隔离在独立网络环境,仅允许访问外网,以降低内网数据泄露风险。
    商业平台兜底:建议优先使用腾讯云、阿里云等大厂提供的智能体服务,利用其内置的安全网关(如阿里百炼的 High Grass)进行敏感词过滤和数据脱敏,规避自研带来的安全责任风险。
    二、业务场景落地与挑战
    会议深入讨论了智能体在具体业务场景中的应用,特别是数据处理与招投标领域的特殊需求。
  3. 数据处理与 Excel 自动化
    非标数据处理方案:八紫分享了利用智能体处理非标 Excel 数据导入的需求,通过将 Excel 转换为 JSON 格式,利用大模型识别字段映射规则,自动调用内部接口补充数据,显著提升了业务人员处理散乱数据的效率。
    数仓替代方案:大石头指出,对于复杂的数据重组需求,标准方案应是构建数仓(Data Warehouse)进行数据清洗与重组,而非单纯依赖代码或智能体脚本。
  4. 招投标文档生成难题
    格式合规性挑战:笑指出在电网、核电等特殊行业招投标中,文档格式(如字体、字号、颜色)要求极为严苛,且每年标准可能变化,大模型难以直接生成完全合规的 Word 文档。
    人机协同模式:由于标书涉及重大法律责任,业务方无法接受完全自动化生成。最终方案倾向于将智能体作为辅助工具,用于提取招标要求、生成初稿模板,人工负责最终审核与格式调整。
    三、技术实现与前沿探索
  5. 单机版 RAG 与多模态处理
    离线环境部署:党章分享了在单机离线环境下构建 RAG 系统的方案,利用 Qwen-7B 等轻量化模型,结合 Milvus 向量库和本地 OCR 服务,实现文档的本地检索与问答。
    图文混排处理:针对 PDF 中的图文混排和表格,提出了“布局分析+多模态模型”的方案,即先用布局分析识别图片位置,再用大模型生成图片摘要,结合上下文进行结构化存储。
  6. 自我进化与知识蒸馏
    知识进化层设计:大石头探索了智能体的自我进化能力,提出通过异步任务捕获业务专家的反馈,自动提取并更新知识库中的规则(如惩罚价格计算),并引入五维评分机制对用户可信度进行分级,防止数据污染。
    技能自动生成:探讨了通过对话让智能体自行总结并生成 Skills 的可能性,以降低人工编写技能的成本。

四、待办事项
尝试使用 Skill Creator 工具或本地模型开发 Skills。 @党章
验证 Hugging Face 重排模型(Reranker)在本地环境下的适配性。 @党章