Steve Sun

【译文】请不要搞个"企业大脑"就指望自动形成学习循环

原文Please don’t implement a “company brain” and expect a learning loop
作者:Seth Rosen
声明:本文由 AI 翻译,可能包含错误

Satya 的那篇推文爆了,不奇怪。

他把两件事联系在了一起——人力资本和算力资本——通过一个学习循环:人类如何引导 AI,AI 如何让人类更聪明,以及整个系统如何滚雪球。

我们团队花了九个月研究和构建这个东西。

学习循环是你的长期 AI 战略。 没有它,AI 在当下很惊艳,但长期来看会无声地衰减。

长期 AI 工作远不止一次 Codex 或 Claude 会话。它是每个员工每天早上醒来,都在迭代团队和组织的整体目标。

你的长期学习循环有四个属性。

1. 最小可行上下文(Minimum Viable Context)

给系统注入你公司独有的判断力,而不是你公司说过的所有话。

2. 结构化、可溯源、多人协作

每个人和每个 Agent 都建立在同一个共享基础上,中间决策可以追溯和评判。

3. 可执行

一旦工作变得可见,Agent 就能直接在上面操作。

4. 复利效应

用越多,系统就越好。AI 衰减的反面。


从最小可行上下文开始

上下文是你最宝贵的资产,也是最危险的资产。所以,不要把整个公司的东西都灌进一个共享知识图谱。不要搞什么"全企业大脑"。

从一个精挑细选的共享知识集开始,花时间把它精简到最小。从你公司 expertise 真正重要的决策入手:战略、产品权衡、客户理解、风险评估、市场解读、销售判断、工程架构、运营手册。机会不是自动化通用工作,而是找到人力资本能创造差异化判断的地方。

人类可以通过会议、Offsite 和深度工作来过滤上下文、结合自己的世界认知。AI 不能来参加你的 Offsite。你需要像 onboarding 新员工那样构建干净的上下文——你不会让新同事第一天就访问所有东西,然后说"开始干吧"。

这就是共享系统的起点。

让工作结构化、多人协作

一旦每个人和每个 Agent 都基于同一个最小可行上下文工作,所有未来的工作都对这个上下文进行构建和评估。

这意味着要把你的最小可行上下文变成:假设、源上下文、中间推理、示例、约束条件、评价标准、决策和产出。不要把你公司的学习埋藏在 prompt、聊天记录或个人记忆里。 让推理可见、可编辑、可复用,跨人、跨 Agent、跨团队。

让系统可执行

一旦工作可见,Agent 就能操作了。把产出物组织成可重复的回路——有依赖、输入、中间产出、最终交付物。现在 AI 不再只是回答问题,而是参与一个可回放、可审查、可改进的治理式工作系统。

大量的组织工作是相互依赖的:产品、工程、市场、支持都在依赖彼此的产出。一个重要的产出物通常会在下游被多个领域复用,远超最初生产它的团队。如果 AI 只用来生产最终产出物——一份市场简报、一段代码、一篇技术支持文章——那么它们背后的所有中间工作,每个部门都要重做一遍。

这些中间产出物也是可溯源的。人和 AI 都能看到一个决策或文档是如何被实际生产出来的——这是学习循环的基础。

概念上,这跟数据工程非常像——像 dbt 这类工具就是用来建模组织业务逻辑的。有很多模式可以借鉴。

一切天然产生复利

我们称之为看护模式(stewardship pattern),也是系统产生复利的方式。

每个人都可以保留自己的个人工具——Claude、Codex、随便什么。约束只有一个:每次会话结束时,共享结构要比开始时更好——更新结构、补充缺失、审查产物。这样个人工具才能在组织层面产生复利。没有这个契约,它们只会碎片化组织。这既是人的问题,也是 AI 的问题。

当一个基本原则被添加或修改时,明确的结构知道哪些需要更新、哪些不再对齐。这就是 AI 衰减的反面。

然后,改变你奖励的东西

你必须奖励那些推动这件事的人。

大多数组织把精力花在采购 AI 工具上,结果只培养出一小撮精英早期采用者。

如果每个员工都有自己的聊天、自己的记忆、自己的文件——少数人会私下变强,组织什么都没有。甚至可能加速走向冲突的方向。这叫 “AI 英雄主义”,靠英雄球拿不了冠军。

忽略那些不使用或不改进组织系统的 AI 输出。奖励构建系统的人,和使用系统的人。

#AI #Learning Loop #Company Brain #Translation #Seth Rosen #Organizational AI