值得信赖的区块链资讯!
比推数据  |  比推终端  |  比推英文  |  比推 APP  | 

下载比推 APP

值得信赖的区块链资讯!
iPhone
Android

AI六层楼,99%的公司还在第一层

BitpushNews

作者:Ann Miura-Ko (早期风险投资人,专注种子轮和天使轮)

原标题:Everyone wants to be AI-pilled. Most Companies Are Still Level 1

编译及整理:BitpushNews


Image

在过去的几周里,我将办公室访问的范围从“AI化”的初创公司扩大到了规模化企业——最近走访了拥有 1,500 人的 Ramp。早期的走访让我看到了在 8 人或 50 人规模下,“AI原生”是什么样子的。在微型初创公司,很容易说公司是 AI 原生的,因为创始人就是这样的人。每个人都离客户很近,每个人都在构建,每个人都在实验。公司的“操作系统”主要就是人。

但在规模化公司,门槛要高得多。AI 不能再只是创始团队的一种性格特征,它必须成为公司 DNA 的一部分。

关于什么是真正的 AI 原生,这类问题让我想起过去我们对自动驾驶(AV)分级的争论。多年来,自动驾驶领域的每个人都在追求 L5 级全自动驾驶。这些分级之所以重要,是因为它们强制要求了精准性。定速巡航不是自动化,车道保持也不是自动化,驾驶辅助与自动驾驶并不是一回事。

类似的事情也正在“AI化”组织中发生。

目前,“AI化”被当作一个二进制概念在使用:要么是,要么不是。但在实践中,不同公司的强度(AI 嵌入组织日常工作的深度)和技术能力(AI 实际上被允许看到什么、做什么、改变什么)各不相同。

一个员工使用 ChatGPT 总结会议的公司,与一个代理(Agents)可以查询记录系统、采取受限行动、在团队间传播工作流并改进未来工作方式的公司,并不属于同一个类别。两者都可能自称为“AI 先锋”,但它们并不在同一水平上运行。

因此,更好的问题不是:“这家公司被 AI 化了吗?”而是:这个组织实际上达到了什么水平的自主化? 进一步细化:

  • AI 能看到什么? 你们公司的工作对机器来说是可理解的吗?还是说它只存在于人们的大脑中、未经记录的会议里,以及 AI 无法读取的 SaaS 工具中?

  • AI 能做什么? 它能对记录系统采取行动吗(例如:开启 PR、更新 CRM、核对发票)?还是只能总结人类已经写下的东西?

  • 谁能扩展系统? 非工程师人员是否在发布生产级别的内部工具?还是说每一个工作流都由几个“高级用户”维系,一旦他们离职,工作成果也随之流失?

  • 组织发生了怎样的变化? 还是说你只是在用 2023 年的组织架构配上更好的“自动补全”功能?

答案可以归纳为六个等级。

L0:表演式 AI (AI as Theater)

  • AI 能看到什么? 没有任何结构化的信息。知识存在于大脑、无记录的会议和 AI 无法读取的 SaaS 工具中。

  • AI 能做什么? 没有任何实质影响。如果有人粘贴了转录文本,也许能总结一下会议。

  • 谁能扩展系统? 没人。AI 是个人工具,无治理,无集成。

  • 组织改变了什么? 毫无变化。同样的架构,同样的招聘计划,同样的交接方式,同样依赖经理作为信息路由器。

  • 硬核测试: AI 能否端到端地完成任何周期性的业务流程?

  • 常见误区: CEO 发表了关于 AI 转型的精彩演讲,但公司依然通过同样的执行会议、状态更新、汇报关系和人员编制计划来运作。宣言并不等于采用。

L1:个人生产力 (Personal Productivity)

  • AI 能看到什么? 每个人的个人 AI 只看得到该用户喂给它的内容:保存的提示词、草稿文件、私人知识库。没有组织层面的可见性。

  • AI 能做什么? 帮助个人起草、总结、头脑风暴、写代码。无法对记录系统采取行动。

  • 谁能扩展系统? 每个用户都在独立“重新发明轮子”。高级用户是英雄,但他们的工作流会随其离职而消失。

  • 组织改变了什么? 毫无变化。同样的架构。也许雇了一位“AI 主管”,拥有预算权并购买了一些 AI 产品。

  • 硬核测试: 如果你最顶尖的 AI 用户明天离职,他们的工作流会留在公司吗?

  • 常见误区: “80% 的员工每周都在使用 AI!”这可能是真的,但毫无意义。

L2:团队工作流 (Team Workflow)

  • AI 能看到什么? 团队拥有共享上下文,例如每个团队都有 claude.md、共享提示词、特定职能的 MCP 集成。AI 在团队边界内拥有可见性。

  • AI 能做什么? 职能工作流。例如 AI 用于销售线索开发、技术支持的一线分流、工程代码审查。在团队领域内采取受限行动。

  • 谁能扩展系统? 在团队内部,非工程师可以利用共享工作流。跨团队则不行。每个职能部门都在私下重复造轮子。

  • 组织改变了什么? 角色内的职能效率提升。一个配备 AI 的客户成功经理(CSM)可以处理 200 个账户(以前是 50 个)。招聘放缓,但组织形态不变,角色边界清晰。

  • 硬核测试: 这个工作流是否跨越了团队边界?还是每个部门都在构建自己私有的 AI 技术栈?

  • 常见误区: “我们在每个部门都有 AI 工作流。”但这些工作流并不互联,所以公司只是 AI 增强型孤岛的集合,而不是 AI 原生组织。

L3:组织基础设施 (Organizational Infrastructure)

  • AI 能看到什么? 整个组织都是可查询的。跨职能上下文可访问。核心记录系统通过 CLI / MCP / 定义良好的 API 暴露,并集成到一个代理可以观察并采取行动(而不只是观察)的视图中。

  • AI 能做什么? 代理可以跨系统操作。它们更新 CRM、开启 PR、路由工单、运行分析、起草客户沟通、核对发票。跨职能但仍受限。

  • 谁能扩展系统? 非工程师不仅是共享技能的使用者,更是创造者。销售代表将电话分析打包成可共享的技能;客户体验工程师打包工单调查模式。技能在职能间水平流动。

  • 组织改变了什么? 组织架构图看起来与 2023 年的版本有实质性不同。具体形态各异——可能是零 PM 团队,可能是 PM 作为代理编排者和产品策展人,或者是角色纯粹收敛为“构建者”。统一的信号是:公司在“AI 如何改变谁做什么”上做出了明确的结构性选择,且这种选择是显而易见的。相比于最大化员工人数,公司更倾向于最大化 Token 使用量,哪怕这会带来令人不安的 API 账单。

  • 硬核测试: 一个代理能否跨系统回答:上个冲刺阶段发布了什么?是谁要求的?发布后出了什么问题?客户怎么说?公司下一步该怎么做?——且无需召开跨职能会议。

  • 常见误区: 堆积如山的会议转录和没有综合分析的仪表盘。捕获并不等同于可理解。 静态的档案库并不是操作系统。

L4:复合型操作系统 (Compounding Operating System)

  • AI 能看到什么? 不仅是发生了什么,还有事件之间的关系。系统维护自己的上下文,使得代理可以更新代理,技能市场传播成功经验并消除重复劳动,系统学习应该呈现什么内容。捕获、综合与查询是持续进行的。

  • AI 能做什么? 代理在特定领域内拥有基于政策的决策权。安全代理检测、验证、修复,然后开启 PR,并由人类在合并步骤进行审查。拥有专为公司核心业务打造的定制化内部框架。主动消除阻碍代理发挥作用的软件障碍。

  • 谁能扩展系统? 非工程师发布生产级别的内部工具。财务人员构建自动合同审查工具,客户经理在不到一小时内发布销售工具。他们都不是工程师,没有提交工单,而是自己发现痛点,原型化解决方案,只有在需要进入生产环境时才拉入工程团队。

  • 组织改变了什么? 等级制度向代理工作流的“频道管理者”塌陷。新的原型角色出现。薪酬/晋升与 AI 熟练度明确挂钩。从客户信号到发布的时间以小时计。

  • 硬核测试: 给我看一个因为系统从之前的运行中学习而变得更好的工作流,而不是因为某个英雄手动改进了它。另外:给我看三个非工程师在过去一个季度发布的生产工具。

  • 常见误区: 代理泛滥。一百个脆弱的自动化并不等于复合型操作系统。L4 需要管理下的复合(生命周期、可观测性、评估),而不是混乱的激增。没有精简和纪律,工厂就会堵塞。

L5:虚拟自运行组织 (Virtually Self-driving Organization)

一个清晰的运营定义(请注意,我意识到 L5 目前尚不存在,所以我描述的是我认为它可能的样子):L5 组织是指其核心运营闭环能够感知现实、诊断问题、发起工作、在授权范围内执行、更新共享记忆并改进未来行为——而人类负责治理战略、品味、风险、价值观和处理例外情况,而不是自己运行这些闭环。

L5 的六个标志:

  • 系统在未被要求的情况下注意到重要事项。

  • 系统跨越多个上下文来源进行综合。

  • 系统决定是否有必要采取行动。

  • 系统在授权范围内行动。

  • 当不确定性或后果超过其权限时,系统进行上报。

  • 系统更新共享记忆,以便改进未来的行为。

通过四个维度的透视:

  • AI 能看到什么? 生成性的——系统提出自己的问题,识别自身知识的差距,提议并运行调查。

  • AI 能做什么? 拥有针对新决策的授权,而不只是配置好的政策。L4 到 L5 的跨越:在 L4,系统改进是因为人类指示它这么做;在 L5,是因为它注意到自己应该这么做。

  • 谁能扩展系统? 非工程师直接为面向客户的产品本身做贡献,或者产品被重塑,使得任何人都可以在不写代码的情况下扩展它。 “内部工具”和“产品功能”之间的界限消失。

  • 组织改变了什么? 真正的流动性。代理是拥有实质性授权的组织成员。组织自我修改或提出角色变更、团队边界调整。入职引导变为系统驱动。制度性知识在人员更替中完美保留,因为它存在于系统中,而非任何个人身上。

  • 硬核测试: 公司最近在没有人类发起的情况下,注意到、决定、执行并学习了哪件重要的事情?不是阈值警报,不是预设的自动化,也不是代理总结人类发现的问题。而是系统综合出的、人类尚未将其构思为问题的事项。

  • 常见误区: “虚假自主”模式。公司声称具有自运行行为,但系统只是在执行预配置的规则或弹出基于阈值的警报。人类仍然在承担所有的“察觉”工作。将真正的生成行为与美化后的可观测性区分开来,是这个阶段的公开挑战。

有趣的是,一家公司很少能在四个维度上处于同一水平,但这种不对称性会告诉你下一次干预应该集中在哪里。有时 AI 看到了很多但能做的很少;AI 可能做了很多但只有工程师能扩展它;或者组织架构改变了,但底层支撑却很薄弱。

史蒂夫·布兰克(Steve Blank)曾说过,初创公司并不是大公司的缩小版。同样,一家“AI化”的公司也不仅仅是旧公司的 AI 辅助版。它们是围绕新运营模型重建的组织。我们仍在学习这到底意味着什么,但那些保持好奇并积极投入的人,在快速向上攀升并看到业务运营及利润的实际影响时,将拥有复合增长的优势。


Twitter:https://twitter.com/BitpushNewsCN

比推 TG 交流群:https://t.me/BitPushCommunity

比推 TG 订阅: https://t.me/bitpush

说明: 比推所有文章只代表作者观点,不构成投资建议

比推快讯

更多 >>

下载比推 APP

24 小时追踪区块链行业资讯、热点头条、事实报道、深度洞察。

邮件订阅

金融科技决策者们都在看的区块链简报与深度分析,「比推」帮你划重点。