检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome EdgeFirefox X

首页科技前沿与新兴产业经社风向经社风向

AI“模型崩溃”倒逼治理转型:零信任数据战略成为企业新防线

供稿人:顾洁供稿时间:2026-06-18 10:04:57关键词:AI模型,零信任数据

互联网上AI生成内容的激增,使得新一代大语言模型越来越多地依赖于前代模型输出的、可能存在偏差或不准确的数据进行训练,这一循环正将人工智能推向一个危险的临界点——“模型崩溃”。咨询公司Gartner最新分析显示,84%的受访者预计其所在组织将在2026年增加对生成式AI的投入,这意味着AI生成数据的体量将持续攀升,模型崩溃的风险亦随之加剧。当AI工具的回答可能不再准确反映现实时,企业亟需重新审视自身的数据治理策略。在这场由AI自身引发的信任危机中,零信任数据治理正从可选策略转变为企业生存的必需品。

模型崩溃:AI训练的数据困境

大型语言模型的训练通常依赖于从网络抓取的数据。然而,随着生成式AI的普及,这些数据源中AI生成内容的占比不断提高,形成潜在的恶性循环:未来的大语言模型将越来越多地在前代模型产生的输出上进行训练,而这些输出本身可能已包含不准确或有偏差的信息。业界将这一现象称为“模型崩溃”,即AI工具的回答逐渐偏离现实,无法准确反映真实世界状况。

更令人担忧的是,随着2026年生成式AI投资持续增长,AI生成数据在训练语料库中的占比进一步上升,使模型崩溃的风险呈指数级放大。模型崩溃本质上是一种“污染”过程:当AI反复在自身生成的数据上训练时,原始分布中概率较低的事件逐渐消失,模型输出多样性下降,最终导致对现实世界表征的失真。这类似于生物界的近亲繁殖,每一代都在丧失遗传多样性,最终引发种群退化。经济合作与发展组织(OECD)已将此事标记为“AI危害”事件,并指出若得不到有效解决,可能引发错误信息或偏见等严重后果。

零信任:从网络安全到数据治理

面对上述挑战,Gartner建议企业采取一项已在网络安全领域得到广泛验证的策略——零信任。该策略的核心原则是“永不信任,始终验证”。将其应用于数据治理,意味着组织不能再隐含地信任任何数据,也不能假设数据均由人类生成。

Gartner预测,到2028年,未经验证的AI生成数据激增将促使50%的组织为数据治理实施零信任策略。数据治理专家Emily Winks进一步阐释了零信任数据治理的核心要义:将“永不信任,始终验证”的原则应用于每一个数据访问请求,无论该请求来自人类用户、系统还是AI代理。这意味着每个访问请求都必须经过身份验证、授权和持续验证,不再存在任何隐含的信任。

核心原则:零信任数据治理的七大支柱

根据美国国家标准与技术研究院(NIST)的零信任架构标准,零信任数据治理建立在七大核心原则之上,这些原则共同构成了应对AI生成数据风险的操作框架。

第一,所有数据访问均需验证,无论其来源如何——是来自BI工具中的人类分析师、调用MCP服务器的AI代理,还是自动化管道,都必须遵守相同的治理标准。

第二,最小权限访问:每个数据访问请求被独立评估,对某一数据集的授权不会自动扩展至下游资产。这对AI代理尤为重要,因为一个用户提示可能触发对多个数据存储的检索,若访问策略未在检索时执行,敏感数据便可能进入模型的上下文窗口。

第三,动态的、基于策略的治理:静态的角色分配被基于上下文的实时策略评估所取代,治理策略能够响应数据资产中不断变化的条件,而非一成不变。

第四,通过主动元数据管理实现持续监控;第五,持续验证与重新评估:信任永远不会是永久的,随着上下文的变化,访问和治理控制会被动态地重新评估。

第六,元数据智能驱动治理改进:组织收集并分析所有数据资产的元数据,利用这些洞察持续改进治理策略,形成良性的反馈循环。

第七,假设数据污染,这是零信任“假设受损”思维模式在数据治理中的延伸。随着AI生成内容的增长,治理必须假设任何数据集都可能包含合成、不准确或有偏见的数据,每一条数据在使用前都需要经过来源验证。

战略行动:构建AI时代的治理框架

面对日益紧迫的挑战,Gartner建议企业采取一系列战略行动。首先,任命专门的AI治理负责人,由其统筹AI治理的整体工作,包括零信任政策的制定、AI风险管理和合规运营,并与数据及分析团队紧密合作。其次,建立跨职能团队,成员应涵盖网络安全、数据与分析及其他相关利益方,负责开展全面的数据风险评估。第三,更新现有治理框架,新的或更新的框架应主要聚焦于安全、元数据管理和与伦理相关的政策,以应对AI生成数据带来的新风险。

在实施路径上,专家建议采取分阶段的方法:发现和分类所有数据资产;映射身份和当前访问状态,审计现有权限;定义并实施最小权限策略;执行持续验证;最后进行监控、审计和迭代。

主动元数据管理:零信任的技术基石

在整个零信任数据治理架构中,主动元数据管理被Gartner称为“关键差异化因素”。元数据记录了数据的来源、生成方式、修改历史和流转路径,为验证数据可信度提供了基础。没有元数据层,零信任治理将退化为一系列孤立的点控措施。一个统一的、元数据驱动的上下文层,能够使零信任治理在复杂的多系统数据环境中具备可操作性,实现自动化的发现与分类、集中式策略管理、列级和行级治理、审计追踪与数据血缘,以及AI代理治理。对于AI生成数据,元数据需要额外记录其是否由AI生成、使用了何种模型等信息,这些信息构成了数据“身份证明”的关键部分。

合规挑战与未来展望

展望未来,零信任数据治理的意义远不止于风险规避。那些能够率先建立零信任数据治理框架的组织,将获得双重优势:有效规避AI生成数据带来的风险,同时通过对数据质量的严格控制,训练出更可靠、更具差异化的AI模型。零信任数据治理并非对AI的不信任,而是对AI负责任发展的必要保障,它代表了从“被动应对”到“主动设计”的治理范式转变——在数据进入系统之前便建立验证机制。当模型崩溃的阴影笼罩AI发展之路时,零信任或许正是那道不可或缺的防线。

参考文献:

[1].Woollacott E. Fears over AI model collapse are fueling a shift to zero trust data governance strategies[EB/OL]. (2026-01-22)[2026-04-14]. https://www.itpro.com/security/data-protection/fears-over-ai-model-collapse-are-fueling-a-shift-to-zero-trust-data-governance-strategies.

[2].OECD. Rising AI-generated data spurs zero trust data governance amid model collapse fears[EB/OL]. (2026-01-20)[2026-04-14]. https://oecd.ai/en/incidents/2026-01-20-8f75.

[3].Winks E. Zero trust data governance: why it should be every CDO’s priority in 2026[EB/OL]. (2026-04-03)[2026-04-14]. https://atlan.com/know/zero-trust-data-governance/.

[4].Gartner. Gartner predicts by 2028, 50 percent of organizations will adopt zero trust data governance as unverified AI-generated data grows[EB/OL]. [2026-01-21]. https://www.gartner.com/en/newsroom/press-releases/2026-01-21-gartner-predicts-by-2028-50-percent-of-organizations-will-adopt-zero-trust-data-governance-as-unverified-ai-generated-data-grows?utm_source=chatgpt.com.