治理原则
安全不是上线后的补丁,而是 AI 落地的前置条件
从业务诊断开始确认数据、权限、模型、工具和审计边界,避免 Agent 进入生产流程后才发现无法追溯、无法解释或无法复核。
数据边界优先
先定义数据在哪里处理、哪些数据可出域、哪些场景必须留在客户环境。
权限分级可验证
把组织、角色、项目空间和数据域纳入统一权限模型,避免越权访问。
关键结论人工确认
高敏场景不追求零人工自动裁决,低置信、敏感或对外承诺类输出进入复核。
全链路审计留痕
记录会话、知识命中、工具调用、模型版本和人工操作,便于复盘与追责。
控制面
四类控制能力覆盖身份、数据、模型与运维
安全能力需要落在可配置、可验收、可导出的控制项上,而不是停留在承诺层面。
身份与访问控制
统一企业身份、组织架构、访问策略和设备边界。
知识与数据治理
从知识接入、审批发布、版本追溯到字段脱敏形成闭环。
模型与 Agent 安全
通过模型网关、工具白名单和输出审查控制 Agent 行为边界。
运维与版本治理
把模型、知识、Agent 和部署包纳入版本、发布、回滚与备份机制。
审计日志
记录关键动作,而不是只保存最终答案
企业 AI 的审计对象包括用户会话、知识命中、工具调用、模型配置和人工操作。
审计目标
让安全、业务和运维团队能够回答:谁在什么时候问了什么,Agent 基于哪些知识和工具输出,是否经过人工复核,当前版本能否回滚。
用户会话
用于服务复盘、质检、争议追踪和敏感输出定位。
知识命中
确认答案是否来自授权范围,并支持来源追溯。
工具调用
追踪 Agent 对业务系统的读写动作,降低误操作风险。
模型与配置
支持灰度发布、效果对比、回滚和合规抽样。
场景边界
不同场景的人工复核边界不同
元话 AI 建议在方案启动阶段就明确哪些内容可以自动辅助,哪些内容必须转人工确认。
企业知识库
敏感制度、薪酬、合同、客户资料按角色权限返回;无来源答案进入复核。
智能客服
退款、赔付、合同承诺、价格承诺等默认转人工;保留会话摘要和工单记录。
金融文档
AI 仅做检索、摘要和资料检查辅助;风控、合规和客户承诺必须人工确认。
法律尽调
风险建议、法律意见和报告定稿必须由法务确认,不能直接作为最终结论。
跨境电商
退款、赔付、争议和平台处罚风险转人工;商品功效与合规承诺需业务审核。
治理流程
从评估、设计、上线到运维持续治理
安全合规不是单个页面或单个开关,而是贯穿 AI FDE 交付的持续动作。
01 评估
02 设计
03 上线
04 运维
交付物
建议在验收前准备的安全材料
这些交付物可以帮助客户的业务、安全、法务和运维团队共同确认上线边界。