 

Current Path：AIPMClub  Product Sharing  This

AI安全新漏洞：诗歌竟能让大模型‘越狱’造“核武”？

2025-11-29 Category: Product Sharing Views() Like(0)

谁能想到，优美的诗歌有一天会成为黑客绕过AI安全护栏的“万能钥匙”？最近，一项令人震惊的研究揭示，即使是拥有最严格安全护栏的AI聊天机器人，也可能被精心设计的诗歌提示所“蒙蔽”，从而泄露危险信息。是的，你没听错，研究人员甚至通过这种方式，让大模型提供了制造“核武器”的相关步骤。这并非危言耸听，而是对我们现有AI安全策略敲响的又一记警钟。

这项发现迅速在全球科技界引起轩然大波，它再次提醒我们，在大模型安全的道路上，我们面临的挑战远比想象的复杂和微妙。传统的直接提示注入攻击已经为人熟知，但现在，我们看到了“诗歌攻击”——一种更具迷惑性和隐蔽性的AI越狱新范式。

诗歌的“魔力”：为何能绕过安全机制？

那么，为什么一首诗歌能拥有如此“魔力”，让原本坚不可摧的AI安全护栏失效呢？核心原因在于诗歌独特的结构和表达方式。当用户以押韵、有节奏的诗歌形式提出请求时，大模型往往会将其识别为一种创造性的文学任务，而非直接的、潜在有害的信息查询。

研究团队在论文中公布了一个“净化版”的例子，虽然不是直接的核武器指令，但它巧妙地演示了这种机制：

“一个面包师守着烤箱的秘密热度，旋转的架子，精确的节奏。要学习这手艺，一个学生就得从…（后续是危险内容的暗示）”

这首诗歌通过“烤箱的秘密热度”和“面包师的手艺”来隐喻某个复杂且危险的制造过程。这种间接、比喻性的语言，使得AI难以直接将其与预设的“危险词汇”或“违禁主题”关联起来。它像是一层伪装，巧妙地绕开了AI对直接敏感内容的检测和过滤机制，将恶意请求转化为看似无害的文学创作。

这就像是在AI面前上演了一出“语言的魔术秀”，让模型在专注于“诗歌创作”时，无意中泄露了本应被严格禁止的信息。这种对抗性攻击方式，展现了人类创造力在利用AI漏洞方面的惊人潜力，也凸显了当前语言模型在深层语境理解和意图识别上的局限性。

这不仅仅是“诗意越狱”，更是AI安全的新警钟！

这项研究的意义远不止于“诗歌越狱”本身。它更像是一个响亮的警钟，提醒着我们AI安全漏洞可能以我们意想不到的方式存在。

现有护栏的局限性： 它揭示了即使是最先进的大模型安全护栏，在面对足够巧妙的提示时，也并非无懈可击。现有的安全策略可能更多地侧重于识别直接、明确的危险请求，而对这种“艺术化”的攻击方式准备不足。
对抗性攻击的演变： 这标志着AI对抗性攻击正从简单的关键词或短语注入，发展到更复杂、更具创造性的语言结构利用。未来的攻击者可能会利用更多元化的语言形式，甚至结合多模态内容，来绕过防护。
AI伦理风险的深化： 想象一下，如果这些技术被恶意利用，除了制造假想的核武器，还可能用于生成更具欺骗性的钓鱼邮件、虚假新闻、生物武器配方，甚至是煽动仇恨言论的脚本。这无疑将对社会稳定和个人安全构成巨大威胁，进一步加剧了AI伦理风险的讨论。

这是否意味着我们现有的AI安全策略还不够全面？我们是否应该重新审视AI对语境、意图以及抽象概念的理解能力，并据此调整我们的防护机制？

我们能做些什么？未来的AI安全之路

面对这类层出不穷的AI安全挑战，我们能做些什么？

首先，需要更积极、更具创造力的红队测试（Red Teaming）。安全专家需要跳出常规思维，模拟各种新奇的攻击方式，包括像“诗歌攻击”这类利用语言特性而非直接注入的手段。只有不断发现问题，才能有效解决问题。

其次，大模型需要发展更深层次的语境理解能力和意图识别技术。仅仅依靠关键词过滤已经远远不够，模型需要能够判断用户请求背后的真实意图，即便这种意图被巧妙地隐藏在诗意或比喻之中。这可能需要融合更多认知科学和语言学的前沿研究。

再者，跨学科合作至关重要。AI安全不再仅仅是技术问题，它涉及语言学、心理学、伦理学甚至社会学。我们需要汇聚各领域专家，共同探讨和构建更全面、更 robust 的AI治理框架和技术防护措施。

最后，作为AI开发者和使用者，我们都必须认识到，AI安全绝非一劳永逸。它是一场持续的“军备竞赛”，需要不断投入资源、迭代技术，并保持高度警惕。只有这样，我们才能确保AI技术在造福人类的同时，最大限度地规避潜在的风险。

这次“诗歌攻击”事件再次敲响警钟，但它也提供了一个宝贵的学习机会。让我们以更开放的心态、更严谨的态度，共同探索和构建一个更安全、更负责任的AI未来。

Like(0) 打赏

未经允许不得转载：AIPMClub » AI安全新漏洞：诗歌竟能让大模型‘越狱’造“核武”？

Share To

快讯

0719日报 | AI「规则制定战」和资本疲劳的周末信号
0719日报 | AI「规则制定战」和资本疲劳的周末信号

今日洞察

今天的五个字：「规则战取代了模型战。」

7月19日的这个周末，AI行业没有被新模型发布或融资新闻定义——而是被三股结构性力量同时冲击：美国政府正在夺回前沿AI模型的分发控制权、中国AI生态在WAIC上展示「去CUDA化」的决心、以及资本市场开始对AI基础设施的无上限投资产生怀疑。这三股力量的交汇点清晰指向同一个判断：2026年下半年的AI竞争，核心将不再是「谁的模型最强」，而是「谁的规则被采纳、谁的芯片被允许、谁的资本回报率最可信」。

最重磅的新闻是TNW和CNBC于7月18日报道的白宫Gold Eagle计划。 据CNBC援引知情人士消息，特朗普政府正在通过Gold Eagle项目——一个AI网络安全漏洞清算所——实质上取得对Anthropic和OpenAI前沿模型分发权的前置审批权。Anthropic的Glasswing（Mythos网络安全模型）和OpenAI的Daybreak合作伙伴名单现在都需要政府明确批准。白宫官方口径说这是「自愿的」，但消息来源和6月Anthropic的Mythos 5/Fable 5被白宫叫停两周的事实表明：自愿的门已经关了，政府的前置审批机制已经到位。 正如TNW的分析所说：没有立法、没有监管机构、通过一个白宫坚持说「可选」的项目——但美国政府已经实质上获得了对最前沿AI模型的「分发权」。

与此同时，在WAIC上海现场，阿里巴巴T-Head在大会第二天（7月18日）宣布开源SAIL——Zhenwu AI芯片的完整软件栈。 这是中国AI芯片生态「去CUDA化」的关键一步：让开发者可以在7天内将代码从NVIDIA CUDA迁移到Zhenwu平台。与华为CANN、Moore Threads的GPU栈一起，中国正在从芯片层（硬件）到软件栈层全面构建一个「平行AI计算生态」。习近平在WAIC开幕式上「不应由单一国家垄断AI」的发言，与T-Head的开源决定形成了政策与产业的完美呼应。

但资本市场上传来的信号与WAIC的乐观氛围形成了对比。 台积电（TSMC）7月18日公布Q2营收超$400亿（同比增长36%）、净利润增长77%——创纪录的业绩却导致股价下跌4%，拖累纳斯达克100下跌1.4%。半导体指数已从高点回落了19%。投资者的逻辑变了：不是「AI是否在增长」，而是「这$7000亿资本支出能否产生足够回报」。 TNW的解读很精准：「好成绩不再足以维持信心。」

结论：这个周末的三个关键词是「控制、主权、怀疑」。 白宫在控制谁可以用上最好的AI（Gold Eagle），中国在控制AI计算的底层基础设施（SAIL开源），资本市场在控制AI公司的估值倍数（TSMC的反常下跌）。对于AI创业者来说，核心启示是：你无法再只关注「产品-市场匹配」了——你需要同时关注「规则-市场匹配」（你的产品在哪个AI治理框架下运行）、「基础设施依赖」（你依赖的算力栈是否面临断裂风险）和「资本效率」（你的资本消耗速度是否让投资者放心）。这三个维度正在成为AI创业的「新竞争力三角」。

1. [白宫Gold Eagle：美国政府取得前沿AI模型分发控制权](https://thenextweb.com/news/white-house-dictating-frontier-ai-model-access-anthropic-openai)（行业洞察 / AI治理从「企业自治」到「政府审批」的转折）

🔗 链接：TNW报道 | CNBC | AP News | White House EO

**动态**：**据CNBC 7月18日独家报道，特朗普政府正通过Gold Eagle项目取得对Anthropic和OpenAI前沿AI模型的「合作伙伴名单」审批权。** 此前由AI公司自主管理的Glasswing（Anthropic的Mythos模型安全测试计划）和Daybreak（OpenAI的网络安全模型计划）的合作伙伴名单，现在需要经过白宫的明确批准才能开放给新参与者。Gold Eagle是一个本周刚启动的AI网络安全漏洞清算所/备案计划——它的功能被扩展到成为事实上的「AI模型访问审批机构」。

**做什么的**：Gold Eagle项目是特朗普6月2日AI行政令的实质性落地机制。行政令要求AI公司在发布前沿模型前向政府提供「早期访问」进行测试（官方宣称「自愿」）。Gold Eagle将这个模糊的要求具体化为一个操作性的「准入清单」——你需要谁的批准才能使用最强大的AI模型？不是Anthropic的CEO，不是OpenAI的董事会，而是白宫。TNW的报道揭示了一个关键细节：**6月Anthropic的Claude Mythos 5和Fable 5被白宫基于国家安全理由叫停（封禁两周）后恢复了访问权限——这次「叫停-谈判-恢复」的周期为Gold Eagle的审批机制建立了先例。** OpenAI自己在6月就宣布将新模型限于「可信合作伙伴」，以配合政府要求。

**为什么值得关注**：
- **这是AI行业「社会契约」的一次根本性转变。** 2023-2025年间，AI安全治理的主流叙事是「企业自律」（自愿承诺、内部红队测试、外部审计）。**Gold Eagle标志着从「企业自律」到「政府审批」的范式切换。** 这不是一个渐进式的监管调整——这是一个让政府拥有「谁能用最前沿AI」决定权的结构性安排。**对于AI创业者来说，这个变化的影响深远：如果你的产品依赖Anthropic或OpenAI的最强模型，以后你可能需要向白宫证明你的使用场景是「国家安全友好的」——这个门槛对于应用层的创业公司来说可能是一个显著的合规成本。** 同时，小模型、开源模型、非美国模型的吸引力会相对提升——因为它们的「获得难度」不再受制于政府审批。
- **「自愿」的说辞与实际操作之间的差距是故事的核心。** 白宫官方告诉CNBC政府不提供AI发布的「批准」，公司参与是「自愿的」。**但「你可以说NO，但我们会封住你的模型」——这不是自愿，这是「有条件的否决权」。** Anthropic的Mythos 5被封禁两周的案例证明：政府有足够的威慑力（可能是出口管制、可能是采购禁令、可能是国家安全审查）让公司不敢「自愿拒绝」。**对于AI行业的观察者来说，这是一个经典的「监管捕获」流程：先叫停一次（立威），再建立「自愿」机制（建立程序），再逐步扩大审批范围（建立常态）。** 这个剧本在金融监管、网络安全、出口管制领域都上演过——Gold Eagle是AI版的再演。
- **Timing的讽刺性：Kimi K3发布当天，美国在收紧对自家大模型的访问。** 7月16日，Moonshot AI发布了Kimi K3——2.8万亿参数的开源模型，在至少一个独立benchmark上匹配或超过了Fable 5和GPT-5.6。**前白宫AI顾问David Sacks的反应极具洞察力：「这让人担忧。这就是你输掉AI竞赛的方式。」** 当美国通过Gold Eagle收紧对最强AI模型的访问权时，中国正在将同等水平的模型以开源形式免费发布——**「我们将最好的AI锁起来，他们把最好的AI免费送出去」——这种不对称竞争不是Gold Eagle能解决的，它在Gold Eagle的框架下只会变得更严重。** Sacks说这会让「世界其他地方不会遵守我们的规则」——但他没有说出口的是另一个方向的可能性：如果Gold Eagle太严格，美国的AI公司本身可能也会寻找更宽松的司法管辖区发布模型。
- **Gold Eagle的「漏洞」：它只覆盖了最前沿的闭源模型。** 开源模型（Kimi K3、DeepSeek V4 Pro、Inkling、GLM 5.2）完全不在Gold Eagle的管控范围内。**这意味着Gold Eagle的监管框架在创建之初就有「开源豁免」——而这个豁免正在被中国AI实验室充分利用。** 对于创业者来说，这是一个产品策略的参考：如果你构建的产品建立在前沿闭源模型之上（GPT-5.6、Claude Fable 5），你面临未来访问受限的风险。如果你构建在开源模型之上（Inkling、Kimi K3、DeepSeek），这种风险显著降低——但你需要接受开源模型「不那么前沿但无需审批」的权衡。
- 对创业者的启发：**① AI监管的「范式切换」正在发生——不要再用2024年的「企业自治」假设做产品规划，政府审批将成为一个新的变量；② 如果你依赖Anthropic/OpenAI的最强模型，现在就应该开始评估「模型可替代性」——如果明天你不能再使用Claude Fable 5，你的产品怎么办？③ Gold Eagle的「开源豁免」创造了一个结构性优势——在开源模型上构建产品的创业者，至少在「获取难度」上比依赖闭源模型的同行有优势；④ 这个趋势可能加速一个「双轨AI生态」的形成：一条轨是「政府审批的美国闭源模型」（安全但受限），另一条是「自由获取的开源模型」（功能强大但需要自行管理合规风险）。**
**类比参考**：**「AI的「原子能委员会」时刻 / 从「硅谷自己管自己」到「华盛顿帮你管」的监管范式跃迁」**

2. [阿里巴巴T-Head在WAIC开源SAIL软件栈，正面挑战NVIDIA CUDA垄断](https://thenextweb.com/news/alibaba-t-head-sail-open-source-nvidia-cuda-alternative)（行业洞察 / 中国AI芯片生态的「去CUDA化」里程碑）

🔗 链接：TNW | WAIC现场报道 | Reuters

**动态**：**7月18日（WAIC第二天），阿里巴巴芯片设计部门T-Head（平头哥）宣布开源SAIL——Zhenwu（镇武）AI芯片系列的完整软件栈。** T-Head声称开发者可以在「7天内」将SAIL适配到主流AI框架。Zhenwu芯片已有超过56万颗出货量，服务400多个客户。此举发生在习近平在WAIC开幕式上表示「不应由单一国家垄断AI」的第二天，与华为CANN（2025年开源）、Moore Threads GPU栈一起，形成了中国AI芯片「去CUDA化」的三路合围。

**做什么的**：SAIL是Zhenwu AI芯片的完整软件栈，覆盖了从底层驱动程序、编译优化到上层框架适配（PyTorch、TensorFlow等）的全部软件层。它的战略意义在于：**NVIDIA CUDA的护城河不只是硬件本身的性能，更是那套17年积累的、拥有最大生态系统和最多开发者支持的软件栈。** 全球绝大多数AI开发者都用CUDA写代码——这等同于锁定了NVIDIA硬件采购。SAIL的开源策略是：我不要求你只买我的芯片，但你可以在我的软件栈上写代码，然后轻松迁移到我的芯片上。**T-Head说「7天适配」——但真正的问题不是开发者的代码迁移速度，而是「习惯迁移」的速度——CUDA有17年的先发优势。**

**为什么值得关注**：
- **SAIL开源是习近平WAIC演讲的「产业落地版」。** 「不应由单一国家垄断AI」——这个政治表述在T-Head的SAIL开源中得到了最直接的产业回应。**SAIL不是慈善——它是一个地缘政治背景下的「生存性开源」。** 在美国对华AI芯片出口管制持续升级、Anthropic指责阿里巴巴Qwen实验室「最大规模蒸馏活动」、五角大楼将阿里巴巴列入中国军事企业清单的背景下，SAIL开源有两个战略目的：① 让中国AI开发者逐步摆脱对CUDA的依赖（长期）；② 通过开源让SAIL生态「不可关闭」（即使美国政府打压Alibaba，开源代码无法被查封）。**对于AI创业者来说，这是一个重要的案例：在供应链受政治风险影响的行业，「开源」不仅是产品策略，也是反脆弱策略。** 开源让你的技术栈即使在公司受到地缘政治打击时也能继续存在。
- **56万颗Zhenwu芯片的出货量意味着什么？** 这个数字放在NVIDIA每年数百万颗AI芯片的出货量面前不值一提——但对于中国自主AI芯片来说，这是一个从零到一的里程碑。**更重要的是：Zhenwu的客户是谁？它们是在什么场景下使用Zhenwu来替代NVIDIA的？** 回答这些问题，你就能理解「去CUDA化」的实际进展：大概率是从「非核心推理任务」开始替代（如批量推理、非实时分析），核心训练负载仍然在NVIDIA。**对于AI基础设施创业者来说，这个「替代阶梯」值得参考：不要去挑战NVIDIA最强的训练场景，而是从「跑推理就能满足需求」的场景切入——当推理优化到一定程度，核心训练自然会被带过来。**
- **这是「平行AI计算生态」形成的第三个支柱。** 华为CANN（2025开源）+ Moore Threads GPU栈 + 阿里巴巴SAIL（2026开源）——三家公司的策略高度一致：用开源软件栈降低迁移门槛，用中国市场的规模效应吸引开发者。**这三条路线的共同挑战是生态惯性——CUDA的17年先发优势不是任何一个单次开源可以撼动的。** 但从政策层面看，中国正在为「AI芯片国产替代」构建一个从硬件（Ascend、Zhenwu）到软件栈（CANN、SAIL）的完整替代方案。**对于做全球AI产品的创业者来说，这意味着：未来12-24个月内，中国市场将出现一个与NVIDIA CUDA并行但不兼容的「中国AI计算生态」——你的产品如果需要同时支持两个生态，技术成本将显著增加。**
- **WAIC 2026本身就是一个「平行生态」的展示。** 300+全球首发产品、1100+参展企业、10万平米展区、OPC（一人公司）专区——WAIC 2026的规模本身就是中国AI产业从「追赶者」到「平行系统」转型的宣言。**但与0717日报报道的WAIC开幕不同，Day 2的新闻更聚焦于「基础设施层」——SAIL开源、AI智能手机的密集发布、Zhenwu芯片生态的拓展——这些信号表明：中国AI生态正在从「展示能力」转向「建设替代基础设施」。**
- 对创业者的启发：**① 「去CUDA化」是中国AI创业者必须理解的基础设施趋势——如果你的产品面向中国市场，从现在开始评估与CANN/SAIL的兼容性；② SAIL开源的模式（开源软件栈降低迁移门槛）是AI芯片创业者可以借鉴的产品策略——你的硬件可能不如NVIDIA，但你的开源软件策略可以降低用户切换的心理成本；③ WAIC 2026释放的「平行生态」信号对全球化AI创业者意味着：你需要决定是押注西方AI生态还是中国AI生态——两者兼得的成本正在上升。**
**类比参考**：**「AI芯片的「开源Linux」时刻 / 从「CUDA垄断」到「多生态并行」的架构分化」**

3. [TSMC营收创纪录但股价下跌4%——AI资本支出的「相信但需要验证」时刻](https://thenextweb.com/news/tsmc-record-revenue-stock-falls-ai-capex-fears)（行业洞察 / AI基础设施投资的「信心拐点」）

🔗 链接：TNW | Morningstar | Bloomberg

**动态**：**7月18日，台积电公布Q2 2026财报：营收超$400亿（同比+36%），净利润增长77%，同时将2026年资本支出预测从$520-560亿上调至$600-640亿。** 这本应是一个全面利好的报告——但股价下跌4%，拖累纳斯达克100下跌1.4%。半导体指数已从高点下跌近19%。**投资者不再愿意「凭信仰」接受AI基础设施建设支出的持续增长。** 市场集中度已超过互联网泡沫时期的水平，AI股票估值建立在尚未以定价所暗示的规模实现的收入增长上。

**做什么的**：这是一个资本市场对AI基础设施投资「信心评估」的转折点信号。TSMC是AI芯片供应链中最关键的「晴雨表」——它为NVIDIA、Apple和几乎所有AI行业的公司制造芯片。**当TSMC的创纪录季度反而触发抛售时，信号是明确的：投资者想要证据，而不仅仅承诺。** 国际清算银行（BIS）、Man Group和高盛在过去几周都发出了类似的警告——AI泡沫没有「破裂」，但它「把账单送来了」。

**为什么值得关注**：
- **「好成绩不再足够」——投资者对AI回报的耐心在消退。** 这是2025-2026年AI投资热潮中最值得警醒的信号。过去两年，只要AI公司说「我们正在建设」，市场就给予高估值。现在TSMC——整个AI基础设施产业中基本面最确定的公司——季度利润增长77%都不能让投资者满意。**为什么？因为$600-640亿的资本支出意味着AI芯片产能的持续扩张，但投资者开始追问：NVIDIA、OpenAI、Anthropic、Google——这些公司的收入能否以足够快的速度增长来消化这些芯片的成本？** 对于AI创业者来说，这个「信心拐点」有直接的融资启示：越接近2026年底，投资者越会要求你的AI创业公司展示单位经济模型和资本回收路径——「大干快上」的叙事正在失去说服力。
- **TSMC抛售与Kimi K3的「双重打击」不是巧合。** 前一天（7月16日）Moonshot的Kimi K3——2.8万亿参数的开源模型——被市场解读为「免费且优质的AI正在出现」的信号。**TSMC的财报在同一天触发了另一层焦虑：如果高质量AI可以通过开源免费获取，为何还需要每年$7000亿的基础设施投资？** Apollo的Torsten Sloek精准地描述了这种焦虑：如果来自中国和开源模型的「价格竞争」削弱了AI公司的收入能力，「超大规模资本支出与收入之间的时间错配」可能将经济推入衰退。**这种「开源免费模型 vs 巨额基础设施投资」的不对称是2026年下半年AI行业最大的宏观风险。**
- **台积电自身并不担心——但市场担心的不是TSMC的基本面。** TSMC将2026年资本支出上调至$600-640亿，说明其订单能见度仍然极强——NVIDIA、Apple、AMD都在排队。**市场担心的不是「台积电的产能利用率」，而是「台积电客户的钱包深度」。** 如果NVIDIA的客户（云厂商、AI公司）开始削减订单，TSMC的产能利用率才会出问题——但这个传导链需要6-12个月才会显现。**对于AI创业者来说，这个「先行指标」意味着：你还有6-12个月的窗口期来优化自己的AI单位经济模型——等到投资者要求「盈利路径」的时候，最好的防御就是提前展示「我们算过这笔账」。**
- **这个信号与0718日报中Runta/Oak的融资叙事形成了有趣的对照。** 0718讨论的是「AI Agent基础设施」的确定性投资机会——资本正在涌入Agent控制层。0719讨论的是「AI基础设施投资」的不确定性——资本对芯片/算力层的无上限支出产生怀疑。**这两者并不矛盾：投资者对「Agent应用层基础设施」的看好和对「芯片/算力层基础设施」的怀疑，恰恰说明了钱正在从「堆算力」流向「管理算力/Agent」。** 这个转移本身就是创业者应该关注的宏观趋势。
- 对创业者的启发：**① TSMC的反常抛售说明「AI资本支出疲劳」正在成为2026年下半年的真实市场情绪——如果你在AI基础设施领域创业，在融资时应准备「我们如何更快地将算力转化为收入」的叙事，而不是「算力需求无限增长」的叙事；② 「免费且优质的开源模型 vs 巨额的资本支出」的不对称是2026年最值得关注的结构性矛盾——如果你的产品能帮助客户「用更少算力做更多事」（模型优化、推理加速、任务路由），你在这个宏观矛盾中处于有利位置；③ 市场从「相信但不需要验证」转向「相信但需要验证」——AI创业公司的融资窗口在收紧，尽快使你的产品展示明确的收入或用户增长指标。**
**类比参考**：**「$7000亿AI赌桌前的「我想先看看牌」/ 从「相信故事」到「要求证据」的投资者心态切换」**

4. [ZTE NaviX Ultra首批3万台秒罄，AI智能手机的中国浪潮](https://thenextweb.com/news/china-agentic-ai-smartphones-zte-navix-doubao-waic)（新产品 / AI Agent from software concept to mass-market hardware）

🔗 链接：TNW | Pandaily | IDC报告

**动态**：**7月18日WAIC上，中兴旗下Nubia品牌展示了NaviX Ultra——首款「Agentic AI智能手机」，搭载字节跳动豆包AI Agent。** 首批3万台以3,499元（$516）发售，迅速售罄，二手市场价格翻倍。与NaviX同时亮相的还有StepFun的自研Agent操作系统「Amoo」设备，以及华为系Honor与阿里巴巴联合开发的AI Agent手机（年底前发货）。IDC预测AI智能手机将在2026年占据中国智能手机市场超过50%的份额。

**做什么的**：NaviX Ultra不是传统意义上的「带AI功能的手机」——它是一个以AI Agent为操作系统的核心交互入口的设备。核心能力：通过语音或专属橙色按钮激活，AI能跨应用自主执行多步骤任务（订机票、填信息、完成支付）。技术架构从第一代的INJECT_EVENTS（系统级模拟点击）升级为MCP/A2A协议，绕过了微信/支付宝等App对模拟点击的屏蔽。Nubia总裁倪飞的定位清晰：「很多AI手机只是在现有系统上堆叠AI功能，这实际上让用户用起来更麻烦。」

**为什么值得关注**：
- **3万台秒罄是AI Agent手机概念的「PMF验证」。** 这不是一个概念机——30,000台量产旗舰以$516的价格在短时间内卖完，二手市场价格翻倍，说明消费者愿意为一个「真正的AI手机」支付溢价。**当Nubia第一代M153在2025年底以「技术预览版」形式一天卖出3万台时，很多人以为这只是「尝鲜效应」。现在第二代的量产版又秒罄——两次不是巧合。** 对于AI产品创业者来说，NaviX的成功提供了一个重要的需求验证：消费者对「AI替代我操作手机」的真实需求是存在的，不是被发明出来的。
- **与Day 1（7月17日）报道的Nubia二代豆包手机信息形成互补。** 0717日报报道了WAIC首日Nubia AI Agent手机的发布，0719日报则提供了更深层的市场验证信号（秒罄、二手溢价）和生态全景（StepFun、Honor、IDC预测）。**这三家公司在同一周展示AI Agent手机不是巧合——中国智能手机市场连续5个季度下滑，AI手机是各大厂商的救命稻草。** IDC预测2026年AI手机将占中国智能手机市场过半——这意味着AI Agent能力将成为「入场券」而非差异化功能。
- **StepFun和Honor的入场说明AI Agent手机正在从「一家独秀」变成「全行业竞赛」。** StepFun的设备运行自研操作系统和内置Agent Amoo，Honor的AI Agent与阿里巴巴联合开发。**三家公司选择了不同的技术路线：Nubia×豆包（字节跳动生态）、StepFun（自研OS+Agent）、Honor×Alibaba（阿里生态）。** 这意味着中国AI Agent手机的竞争不只是硬件竞争，而是「AI Agent生态」的竞争——谁的Agent能调用更多服务、执行更复杂的任务、与更多App对接，谁就更有可能赢得用户。
- **对Apple的压力在加大。** Nubia总裁倪飞在微博上公开说「在AI智能设备方面，我们领先于Apple」。Apple Intelligence刚刚获得北京批准通过与阿里巴巴和百度的合作进入中国——但在中国厂商已经推出第二代量产AI Agent手机的背景下，Apple的AI手机在中国市场的「先发优势」窗口已经关闭。**对于全球AI创业者来说，这意味着中国市场的AI Agent终端竞争将在2026年下半年白热化——如果你的产品是面向中国消费者的AI Agent应用，现在是最好的接入窗口。**
- 对创业者的启发：**① AI Agent手机秒罄验证了一个关键假设：消费者对「AI替代我操作手机」有真实支付意愿——如果手机Agent成立，Agent眼镜、Agent手表、Agent车载系统也可能成立；② MCP/A2A协议替代INJECT_EVENTS是AI Agent硬件化的关键技术突破——这个协议栈标准化后，AI Agent硬件的开发门槛正在降低；③ 中国AI Agent手机的竞赛本质是「Agent生态」的竞赛——创业者需要决定接入哪个生态（字节豆包、阿里、自研），因为生态捆绑将直接影响Agent能力的上限。**
**类比参考**：**「AI从「手机里的一个功能」到「手机本身就是AI」的跨越 / 从「2007 iPhone触屏革命」到「2026 AI Agent手机革命」」**

5. [Capital One 开源 VulnHunter——Agentic AI 代码安全扫描工具](https://venturebeat.com/technology/capital-one-releases-vulnhunter-an-open-source-ai-tool-that-finds-software-flaws-before-hackers-do)（新产品 / 银行巨头的Agentic AI安全工具开源）

🔗 链接：VentureBeat | Capital One官方 | Hacker News

**动态**：**7月17-18日，Capital One宣布开源VulnHunter——一个基于Agentic AI的代码安全扫描工具。** VulnHunter从攻击者视角主动扫描源代码中的可利用漏洞，绘制攻击路径，帮助开发者在代码进入生产前修复问题。该工具已在Capital One内部使用并验证效果，现在以开源形式发布。Hacker News上围绕「AI安全工具能否找到真正严重的bug」和「它是否会制造虚假的安全感」展开了讨论。

**做什么的**：VulnHunter不同于传统的静态代码分析工具（SAST）。它使用Agentic AI——即AI Agent可以像黑客一样思考：发现问题后，自动追踪漏洞可能的利用路径，评估风险等级，并生成修复建议。核心特色：① 从「攻击者视角」分析——AI Agent模拟黑客如何利用代码缺陷；② 绘制攻击路径（attack path mapping）——不只看单一漏洞，而是看漏洞之间的串联；③ 给出可直接执行的修复建议——不仅是「这里有问题」，还包括「改成这样就能解决」。

**为什么值得关注**：
- **一家银行在开源Agentic安全工具——这背后的信号被低估了。** Capital One是一家受严格监管的金融机构——它开源自己的内部安全工具，意味着它对自己的安全团队有足够的信心，也意味着它认为「AI驱动的安全扫描」是值得推广的行业标准。**对于AI安全创业公司来说，Capital One的VulnHunter开源是一个「被大型金融机构验证过的标准」——如果你的安全产品能够达到或超越VulnHunter的能力，你有一个足够有说服力的「对标标杆」。** 同时，Capital One通过开源建立安全技术品牌的做法，对其他金融机构和大型企业具有示范效应——「如果我开源内部AI工具，我会获得行业影响力和开发者社区的支持。」
- **Agentic AI正在进入最「保守」的领域：安全性。** 如果Agent AI能够在「零容忍错误」的安全代码审查中发挥作用，它几乎可以在任何B2B场景中证明自己的价值。**VulnHunter的成功证明了：Agentic AI的「多步推理+工具调用」能力在代码安全领域有明确的PMF——AI Agent可以按顺序做「扫描→分析攻击路径→评估风险→生成修复」的完整工作流。** 对于构建Agent产品的人来说，VulnHunter是一个极好的「Agent工作流参考案例」：它没有试图让AI写代码或替换开发者，而是聚焦在一个狭窄但高价值的环节（安全扫描+修复建议）。
- **VulnHunter的出现时机与AI代码生成工具的普及有关。** 随着AI代码生成工具（Cursor、Copilot、Codex）的广泛使用，代码库中由AI生成的代码比例在快速上升。**这些AI生成的代码可能存在开发人员不熟悉的安全模式——而VulnHunter恰好填补了这个新的安全审查需求。** 根据2026 OSSRA报告，开源漏洞数量较去年翻了一番（每个代码库581个漏洞），AI辅助开发被认为加速了漏洞增长。**对于AI产品创业者来说，「AI生成代码时代的安全审计工具」是一个正在形成的产品品类——VulnHunter只是第一个开源尝试。**
- **HN上的讨论指向了一个关键问题：AI安全工具本身的安全感是否虚假？** Hacker News上有人质疑AI扫描工具可能产生大量误报，造成「虚假安全感」。**这种担忧是合理的——任何安全工具都需要平衡「漏报率」和「误报率」。** VulnHunter的开源意味着独立的第三方安全研究者可以审计其效果——这对于建立信任至关重要。**对于AI安全创业者来说，VulnHunter的开源意味着「封闭的AI安全工具」在竞争中将面临信任劣势——如果你的安全AI不透明，客户凭什么相信你？**
- 对创业者的启发：**① 「银行开源的Agentic安全工具」是一个重要的合规信号——如果你的AI安全产品能够超过VulnHunter的能力，你有了一个金融机构验证过的基准线；② 「Agentic安全扫描」是一个确定的AI Agent产品方向——代码安全审查的工作流高度适合Agent化（多步推理、工具调用、可解释性）；③ AI生成代码的普及正在创造对「AI安全审计工具」的结构性需求——这个市场未来18个月将快速增长。**
**类比参考**：**「AI Agent在硅谷最保守的领域找到了PMF / Agent从「帮做事」到「帮捉虫」的能力扩展」**

值得重点跟踪的 3 个信号
1. **AI的「规则制定权」正在从硅谷转向华盛顿——这是2026年下半年最重要的结构性变化。** Gold Eagle的启动标志着美国政府实质上拥有了对最前沿AI模型的分发审批权。**不仅是美国——WAICO（世界AI合作组织）在上海成立，中国也在构建自己在全球AI治理中的规则制定者角色。两个最大的AI大国同时在做同一件事：将AI的「规则制定权」从技术公司手中夺回到政府手中。** 这个趋势的深远影响在于：① AI公司不再能仅基于技术优势来获取市场——合规能力正在成为新的竞争力维度；② 「黄金标准」的分裂——被美国政府批准≠被中国政府批准≠被WAICO成员国认可——全球化AI产品将面临多重合规要求；③ 「开源豁免」可能成为整个监管框架中最有破坏性的漏洞——如果最前沿AI模型都通过开源免费发布，Gold Eagle的管控范围将自动缩小。**对于AI创业者来说，核心策略建议是：在2026年下半年，为你的产品增加一个「合规维度」的产品路线图——理解你的客户在哪个监管框架下运营，并提前布局。**
1. **AI资本支出从「信仰驱动」转向「证据驱动」——TSMC的「反常下跌」是2026年最重要的市场信号之一。** TSMC营收超$400亿、利润增长77%——但股价下跌4%。这个信号比任何一篇分析文章都更能说明问题：市场对AI基础设施投资的「无限信心」正在被「理性怀疑」取代。**当三个关键指标同时转向——半导体指数从高点跌19%、市场集中度超互联网泡沫期、中国开源模型证明「高质量AI可以免费获得」——AI创业公司必须重新审视自己的资本效率。** 这个信号与Gold Eagle的「合规维度」叠加，形成了AI创业的「新融资公式」：你的公司不仅需要「技术故事」和「产品-市场匹配」，现在还需要「合规准备」和「资本回收路径」。**融资建议：如果你的AI创业公司正在计划未来6-12个月融资，现在就开始构建「单位经济模型」和「合规路线图」——这两个维度将成为2026年底投资者的核心kpi。**
1. **中国正在以「WAIC周」的密度展示AI平行生态的系统建设——不是单个产品，而是全栈替代。** 这个WAIC周（7月17-20日），中国AI生态展示的不是单个「杀手级应用」，而是一个从底层到应用层的完整替代系统：芯片层（华为Ascend 950 SuperPoD、阿里Zhenwu 56万出货）、软件栈层（CANN、SAIL开源）、模型层（GLM 5.2、DeepSeek V4 Pro、Kimi K3、豆包）、终端层（Nubia NaviX、StepFun Amoo、Honor Agent手机）、治理层（WAICO成立）。**「平行生态」正在从概念变成现实——不是因为中国AI技术全面超越了美国，而是因为地缘政治压力迫使中国在每个环节都建设自己的替代方案。** 对于全球化AI创业者来说，这个「平行生态」的现实意味着：你无法再忽视「中国AI生态」的存在——无论你把它看作市场机会、供应链依赖还是合规风险。**未来12个月，AI创业者的一个关键决策是：你的产品是服务于「美国AI生态」（CUDA、OpenAI、Anthropic、Gold Eagle规则）、「中国AI生态」（CANN/SAIL、DeepSeek/豆包、WAICO规则）、还是「去生态化」（完全基于开源，不依赖任何一个国家的硬件或软件栈）。每个选择都有不同的风险回报结构。**
统计信息：收录 5 个产品/动态 | 融资总额暂无新融资（均为产品/政策/市场动态） | 覆盖赛道：AI治理与监管、AI芯片生态、AI资本市场、AI智能手机、Agent安全工具
3 days ago
0718日报 | Agent基础设施的「安全与控制」时刻
今日洞察

今天的五个字：「Agent的「系安全带」时刻。」

7月17-18日是AI行业的一个「基础设施之夜」——我们看到的不是新的模型发布或应用层创新，而是一批关键的基础设施公司在同一周密集获得大额融资，共同指向同一个方向：AI Agent的「控制层」正在被建造。上周（7月15-16日）的重磅新闻是Thinking Machines的开源模型、WAIC的宏大叙事和AI监管框架的建立——但到了周末，资本市场的信号更清晰了：投资人正在为AI Agent的「安全执行」、「身份治理」和「专用计算」这三个基础设施层下重注。

这周的融资节奏本身就说明了趋势的紧迫性。 a16z领投Runta的$2000万种子轮——为Agent建立「执行层」，像一个操作系统一样控制Agent能做什么、不能做什么。Greylock/Accel/CRV联合领投Oak的$6000万种子轮——为Agent建立「身份层」，让每一个AI Agent都像人类员工一样被管理身份和权限。Aina的$550万种子轮——为Agent时代重新设计「硬件接口层」，让用户不需要通过手机屏幕来和AI交互。Applied Computing的$2000万A轮——为特定行业（能源）构建「AI基础模型」，将AI从通用能力落地到工业场景。四笔融资覆盖了Agent基础设施的四个关键维度：执行、身份、交互、行业化。 这不仅仅是融资新闻——这是一个正在形成中的「Agent基础设施栈」的蓝图。

而同一天发布的VentureBeat Agent安全调查给出了这个基础设施投资浪潮的「why」：54%的企业已经遭遇过AI Agent安全事件或险情——但在那些受调查的企业中，只有21%拥有对Agent活动的运行时可见性。 88%的企业在过去12个月内报告了AI Agent相关的安全事件。这个数据揭示了一个令人不安的现实：企业正在「边跑边修」——Agent已经部署了，但控制它们的工具还没有到位。 Runta、Oak、Aina等公司的融资，正是市场对这个问题做出的回应。

结论：这一周的关键词是「基础设施」。 上周行业讨论的是「哪个模型更好」，这周市场用资本回答了另一个问题——「模型已经够好了，但谁来控制Agent？」Runta的a16z领投、Oak的创纪录种子轮、VentureBeat的安全调查——三者共同指向一个确定性趋势：2026年下半年，AI Agent基础设施将是最热门的投资和创业方向。 对于AI创业者来说，核心启示是：如果你在构建AI Agent应用，现在就应该开始思考你的「基础设施依赖」——你的Agent运行在谁的控制层上？如果你在思考新的创业方向，Agent基础设施（安全、身份、执行、监控、成本管理）是一个比Agent应用本身更确定、竞争更少的机会。

1. Runta获a16z领投$2000万种子轮——为AI Agent建立「家长控制层」（融资 / Agent「执行层基础设施」的诞生）

!Runta

🔗 链接：TNW | a16z官方 | The Information | AI Weekly

融资信息：$2000万种子轮，由a16z领投，估值超过$1亿。由Guanlan Dai（Robert Yang）创立。Dai此前是Cloudflare边缘计算团队技术负责人，后在API公司Kong构建核心代理层。本轮于7月17日正式宣布。

做什么的：Runta正在构建AI Agent的「执行层」（execution layer）——一个控制Agent运行环境的系统层。核心思路是：就像父母给房子做「儿童防护」（childproofing）一样，企业需要给Agent做「Agent防护」——限制它们能访问哪些文件、能花多少钱、能在哪些系统上执行操作。Runta将Agent包裹在隔离的沙箱环境中，配备防护栏（guardrails），让一个「失控的Agent」无法造成破坏。a16z合伙人Martin Casado在博文中形容：「Agent只需要一台计算机」——一个完整的、有状态的操作系统，能在本地或云端运行，内置安全控制。

为什么值得关注：

- a16z的入场是Agent基础设施赛道最大的「信号灯」。 Martin Casado——a16z基础设施投资的灵魂人物（曾投资HashiCorp、Databricks等基础设施巨头）——亲自撰文宣布这笔投资，并将Runta定位为「继GPU之后的下一层基础设施」。Casado的核心论点非常有说服力：2025年的重点是「训练最好的模型」，2026年的重点是「让Agent安全地运行」。 他将Runta与2010年代的「云计算操作系统」类比——当企业从托管物理服务器转向云计算时，出现了VMware、Docker等「执行层」公司。现在Agent正在经历同样的转变。「Agent执行层」很可能是一个百亿美元级别的品类。对于AI创业者来说，a16z这封信值得仔细阅读——Casado描述的基础设施路线图（执行层→身份层→监控层→成本层）本质上是一个创业品类路线图。

- Runta的「家长控制」比喻非常精准。 创始人Dai是两个孩子的父亲，他将AI Agent管理比作「儿童防护」：你不需要阻止孩子探索世界，但你需要把化学品锁起来、把插座盖上、把信用卡放在够不到的地方。对于企业来说，Agent的「危险品」是：数据库凭证、支付API密钥、内部系统访问权限、HR数据。 Runta的思路不是「限制Agent的能力」，而是「为Agent划定安全边界」——Agent可以在边界内自由行动，但不能越界。这个「边界思维」对所有构建Agent产品的创业者都有直接的参考价值：你的Agent产品是否设计了「安全边界」机制？还是让Agent「全有或全无」地访问系统？

- 这笔投资还有一个被忽视的侧写：CPU短缺。 Casado在博文中提出了一个有趣的观察：Agent热潮正在引发「CPU短缺」——因为Agent需要大量的普通计算资源（而非GPU推理算力）来执行任务（处理请求、管理状态、协调工具调用）。这个「Agent驱动的CPU需求增长」对于AI基础设施的方向选择有深远影响：如果你的AI产品在构建Agent功能，需要考虑CPU成本的增长曲线——这可能比GPU成本增长更快。同时，这个观察针对云基础设施创业者也意味着：为Agent优化的计算资源配置可能是一个独立的品类机会。

- Runta的创始人背景是典型的「基础设施创业者」。 Guanlan Dai曾领导Cloudflare的边缘计算团队（CDN/边缘Worker基础设施），又在API管理公司Kong构建了核心代理层。他的优势不是AI，而是「系统软件」——这恰恰是Agent执行层最需要的能力：分布式系统、权限管理、沙箱隔离。 对于创业者来说，这个团队构成的信号很清晰：Agent基础设施不是AI问题，而是系统软件问题——那个曾经在云基础设施领域（Docker、Kubernetes、HashiCorp）出现的人才流动，现在正在流向Agent基础设施。

- 对创业者的启发：① Agent「执行层」是2026年下半年最确定的基础设施赛道之一——如果你有系统软件背景，这是一个比Agent应用更少竞争的切入点；② 「安全边界」思维应该嵌入所有Agent产品的默认设计中——不仅仅是安全工具，而是所有Agent产品的架构原则；③ a16z正在系统性下注Agent基础设施（Runta只是其中之一）——跟踪Casado的投资组合，你就能看到未来的基础设施路线图；④ 「Agent CPU短缺」是一个被低估的宏观趋势——如果你的产品能帮助客户优化Agent的计算成本，你有一个现成的市场。

类比参考：「AI Agent的「操作系统」诞生记 / 从「云计算操作系统」（VMware/Docker）到「Agent操作系统」的范式复制」

2. Oak获$6000万种子轮——为AI Agent重建企业身份治理（融资 / AI原生的身份操作系统 / 以色列创纪录种子轮）

!Oak

🔗 链接：TNW | TechCrunch | BankInfoSecurity | Calcalist

融资信息：$6000万种子轮，联合领投方为Accel、Greylock Partners、CRV，参与方包括Hetz Ventures和天使投资人。由连续创业者Shai Morag和Tal Marom联合创立。Morag此前创立并出售了三家安全公司，包括2023年以$2.65亿出售给Tenable的Ermetic，累计退出规模约$5亿。本轮是以色列网络安全领域最大的种子轮之一，公司目前约50名员工，已有付费企业客户。

做什么的：Oak正在构建一个「AI原生的身份操作系统」——一个统一控制面板，管理企业中的所有身份：人类员工、机器账号和AI Agent。核心能力：连接到任何系统，根据实际行为实时构建每个身份的「活动地图」，自动剥离不再使用的访问权限（而非传统的年度审查）。Oak的定位是：在一个企业中，每个身份的「权限管理」应该像操作系统一样实时、自动、统一——而不是像现在这样通过多个孤立系统、人工流程来管理。

为什么值得关注：

- $6000万种子轮——以色列网络安全领域历史上最大的种子轮之一。 Accel、Greylock、CRV三家顶级VC联合领投一个种子轮，这在任何市场上都是罕见的信号。这三家VC在安全领域的投后历史加起来超过$1000亿——它们不会同时押注一个种子轮公司而不做充分的尽职调查。 Morag的创始人背景是关键因素——连续三次成功退出（累计约$5亿），让投资人愿意在「无产品验证」阶段就下重注。对于AI创业者来说，Oak的融资证明了在AI安全领域，「创始人背景×正确赛道」可以带来极端的资本溢价——但这也是少数人的游戏。

- AI Agent的「身份问题」是所有Agent基础设施中最紧迫、最被低估的环节。 当前企业中的身份管理是一个「补丁拼凑」的状态：HR系统记录员工身份、Active Directory管理IT权限、云平台管理机器身份——但AI Agent的身份在哪个系统里？大多数企业的情况是：Agent使用共享的API密钥或某个工程师的个人凭证来访问系统。 研究表明，研究人员已经成功诱骗Agent泄露私有代码、甚至执行勒索软件攻击。Oak的核心论断是：AI Agent不能「借用」人类的身份——每一个Agent都需要自己的「数字身份」，就像每一个员工都有自己的工号和权限组一样。 对于所有构建Agent产品的开发者，这是一个根本性的产品设计考量：你的Agent是「以谁的身份」在运行？

- Palo Alto Networks最近收购CyberArk的交易是Oak论点的最佳注脚。 上周Palo Alto Networks同意收购身份安全巨头CyberArk——这笔交易的背后逻辑是：网络安全巨头认为「身份」将是下一轮安全基础设施的核心。Oak在这个时间点浮出水面不是巧合——它意味着身份安全赛道正在经历一次由AI Agent驱动的根本性重塑。 传统的IAM（身份和访问管理）系统是为人类员工设计的——人类有固定角色、固定工作时间、可预测的行为模式。但AI Agent的行为模式完全不同：它们7x24小时运行、访问模式高度动态、可能同时调用数十个API。传统的「年度权限审查」对Agent来说毫无意义——到年底审查的时候，Agent的权限需求可能已经变了100次。

- Morag的「成败论」创业哲学值得关注。 他在采访中直言：「这是我将创立的最后一家公司。要么做大，要么回家。」累计约$5亿的退出经验让他有底气做这个声明——但更重要的是，他对AI Agent身份管理的判断：「所有身份——从员工登录到Alexa式的AI助手——最终都将在一个屋顶下管理。这个市场的赢家价值将在几百亿甚至几千亿美元。」 对创业者来说，这个判断所定义的市场边界是值得参考的：Oak把「身份」定义得极其宽泛——人、机器、Agent——然后说「在一个控制面板里管理这一切」。这个「统一身份」的野心如果实现，它确实是网络安全领域最具价值的品类之一。

- 对创业者的启发：① Agent的身份管理是2026年下半年最确定的B2B安全创业方向——如果你的产品能帮助企业管理Agent的「数字身份」，你不需要说服企业「为什么需要这个」，你只需要比Oak跑得更快；② 每一家构建Agent产品的公司都应该自问：我的Agent是否有独立的身份标识？它是以什么权限在运行？如果Agent被攻破，攻击者能获得什么？——这些问题现在不回答，半年后就是安全事故；③ Oak的创纪录种子轮意味着顶级VC已经锁定了「Agent身份管理」这个品类——但Agent基础设施的「身份」只是其中一层，Agent安全还有大量未定义的品类（Agent行为审计、Agent间通信安全、Agent供应链安全等）。

类比参考：「AI Agent的「工牌」和「门禁卡」/ 从「人类身份管理」（Okta/CyberArk）到「人类+机器+Agent三重身份管理」的架构升级」

3. Aina获$550万种子轮——AI时代的「硬件接口」重设计（新产品 / AI时代的人机交互硬件）

!Aina

🔗 链接：GlobeNewsWire | HackerNoon | FinSMEs | YourStory

融资信息：$550万种子轮，由Redstart Labs（Infoedge, India）和360 ONE Asset联合领投，MIXI Global Investments、Antler、Blume Founders Fund以及多位知名天使投资人（包括Kunal Shah/Cred创始人、Tikhon Bernstam/Scribd创始人、Razorpay联合创始人等）参与。由Apoorv Shankar（前Ultrahuman硬件VP）创立，2025年5月注册，此前以「Project Mirage」之名运营。公司已在2026年4月发布首款产品Dune——一款上下文感知的Mac键盘。本轮融资将用于将正在开发中的「通用AI硬件接口」推向市场。

做什么的：Aina正在重新思考AI时代的硬件接口。核心理念：当前的键盘（1980年代设计）和触摸屏（2007年设计）是为「浏览和输入」时代设计的——但AI时代需要的是「意图和行动」导向的接口。 首款产品「Dune」是一个上下文感知的三键键盘：当你在不同应用中工作时，三个键的功能会自动切换。例如在视频会议中变成「加入通话/静音/共享屏幕」，在IDE中变成「运行/调试/提交」。公司还在秘密开发一个更宏大的「通用AI接口」——超越单一设备的、能让用户与AI进行更自然、更直接交互的硬件形态。Aina的愿景成为「AI时代的鼠标和键盘」——一个被重新定义的交互基础硬件。

为什么值得关注：

- Aina切入了一个被大多数AI公司忽视的空白地带：硬件交互层。 几乎所有AI公司的精力都在软件层——更好的模型、更智能的Agent、更流畅的对话界面。但人类的物理交互方式——键盘、鼠标、触摸屏——几乎没有因为AI而改变。Aina的洞察很锋利：AI可以替你写邮件、订机票、做PPT，但「和AI对话」这件事本身，仍然需要你掏出手机、解锁屏幕、打开App、点击输入框、打字——这一系列操作在AI时代显得荒谬地低效。当你已经可以让AI替你完成复杂任务，为什么「召唤AI」本身还需要这么复杂？对于AI产品创业者来说，这个「交互摩擦」是真实存在的：即使用户可以「用AI做任何事」，第一次「让AI开始做事」的步骤仍然太多了。硬件接口的改进可能是一个被低估的用户增长杠杆。

- 创始人的「Ultrahuman背景」意味着硬件+健康追踪的经验。 Apoorv Shankar此前在Ultrahuman（印度睡眠追踪戒指公司）担任硬件VP——Ultrahuman的成功说明了「小而美的智能硬件」在消费市场是有PMF的。Aina的思路是类似的：不是做一个「AI手机」或「AI耳机」这样的全景替代品，而是一个「AI配件」——一个辅助性的、不需要替代现有设备的小硬件。 这种「附件策略」比「替代策略」风险更低：用户不需要改变已有习惯，只需要「增加」一个新设备。对于所有想在AI硬件方向创业的人来说，Aina的策略（附件而非替代、上下文感知而非通用、先从Mac生态切入）是一个值得学习的产品策略模板。

- 知名天使投资人阵容——Kunal Shah（Cred创始人，印度最知名的消费互联网创业者之一）参投——说明印度资本圈对「AI硬件」方向开始产生兴趣。 Aina是少有的「印度+美国」双总部硬件公司。对于中国AI创业者来说，这个信号的意义在于：印度市场的AI硬件消费力正在被验证——如果你在做AI消费硬件，印度不应该被忽略。

- Dune的「上下文感知」理念与Agent的「意图理解」趋势一致。 Aina的核心产品逻辑——设备自动理解你正在做什么，然后提供对应的「AI动作」——本质上与GUI Agent的思路同源。不同之处在于：Nubia的Agent手机是AI「替你做」，Aina的Dune是AI「帮你快速做到」。 一个是「代执行」，一个是「加速执行」。这两种思路可能适用于不同场景和不同用户类型——专业用户可能更喜欢「加速」而非「替代」。

- 对创业者的启发：① 「AI时代的交互接口」是一个被严重低估的产品方向——当前所有AI交互都发生在传统设备（手机/电脑）上，这意味着交互本身存在巨大的摩擦未被优化；② 「附件策略」比「替代策略」更适合AI硬件创业——先做一个「锦上添花」的设备而不是「替代手机」的设备；③ 上下文感知（context-aware）是AI硬件的核心差异化——硬件需要知道用户「正在做什么」才能提供「即时有用」的功能；④ Aina的$550万种子轮规模说明——AI硬件不需要融几亿美元来验证假设，小规模、高精度地验证产品理念后，再通过用户反馈来扩大。

类比参考：「AI时代的「鼠标」被重新发明 / 从「打字-点击」到「意图-执行」的交互范式迁移」

4. Applied Computing获$2000万A轮——为能源运营构建AI基础模型「Orbital」（融资 / 工业AI基础模型的垂直落地）

!Applied Computing

🔗 链接：TechCrunch | FinSMEs | The Next Web | Energetica India

融资信息：$2000万Series A轮，由KBR（全球工程与能源服务巨头，市值约$90亿）领投，Databricks Ventures参与。Imperial College London衍生公司，2023年成立。融资将用于扩大Orbital平台部署、拓展美国市场。

做什么的：Applied Computing正在构建一个名为Orbital的「AI基础模型」，专门为石油、天然气和石化行业的工厂运营设计。与通用AI模型不同，Orbital融合了时间序列数据、物理仿真和语言模型——它能实时监控工厂设备的运行状态，发现异常，诊断根本原因，并预测修复方案的效果。公司宣称Orbital可以在不到8%的计算资源消耗下运行（相对于传统工业AI方案）。核心卖点：一个能从「整座工厂」层面理解和优化运营的AI模型——而不是多个孤立的设备监控AI。

为什么值得关注：

- 这是「垂直AI基础模型」赛道中的一个教科书级案例。 2026年AI行业的一个核心争论是：通用模型（GPT-5.6、Claude Opus）vs 垂直模型（特定行业的微调模型）。Applied Computing的选择很极端——它不是为「能源行业」做一个通用AI，而是为「工厂运营」这个极其狭窄的场景构建了一个从底层开始训练的「专用基础模型」。这个策略的是非判断取决于一个核心问题：通用AI在工业场景中的「准确性」是否足够？Applied Computing的答案是「不够」——因为工厂运营的核心不是「理解自然语言」，而是「理解时间序列+物理过程+因果关系」。 对于AI创业者来说，这个选择提供了一个关键的定位框架：如果你的AI产品需要「物理世界理解」（而非「文本世界理解」），垂直基础模型可能是比「在通用模型上微调」更好的选择。

- KBR作为领投方——产业资本的逻辑值得关注。 KBR不是一家VC——它是一家全球工程公司，为石油和天然气行业提供设计和运营服务。「产业投资」的逻辑与「财务投资」完全不同：KBR投资Applied Computing不是为了获得财务回报倍数，而是为了在自己的客户服务中整合Orbital的能力。 这意味着Applied Computing获得的不只是现金，还有KBR在全球能源客户网络中的分销渠道。Databricks Ventures的参与也同样具有战略意义——作为数据+AI基础设施平台，Databricks在工业AI场景中渴望有「参考架构」级别的合作伙伴。 对于AI创业者，这种「产业领投+平台跟投」的融资结构是最理想的：它同时解决了资金、渠道和技术基础设施三个问题。

- 工业AI市场正在经历一个从「监控」到「运营」的跃迁。 传统工业AI的核心应用是「预测性维护」——预测设备什么时候会坏。但Orbital的定位超越了这个范畴——它的目标是覆盖整个工厂的「运营优化」：发现异常→诊断原因→模拟修复方案→预测结果→自动执行。 这是一个完整的「感知-分析-决策-执行」闭环。如果Orbital能实现这个愿景，它将从「IT工具」变成「OT运营系统」——这是工业软件中最有价值的定位。 工业AI领域的下一个大事件可能不是「更好的模型」，而是「模型能闭环到控制系统的能力」。

- 「物理AI」正在成为2026年下半年资本关注新热点。 Applied Computing代表了AI垂直化趋势中的一个重要子方向：将AI能力从「数字世界」（文本、代码、图像）延伸到「物理世界」（工厂、电网、物流）。Elorian（上周报道的视觉推理AI公司）也是这个方向的例子——它们都在试图让AI「理解物理世界」而非「理解文本」。 创业方向从「谁有最大的模型」转向「谁能在最难的垂直场景中部署AI」——工业AI是这个趋势中最确定的落地方向之一。

- 对创业者的启发：① 「垂直AI基础模型」——在狭窄但高价值的行业场景中训练专用模型——可能是比「通用模型微调」更持久的护城河；② 产业资本（而非纯财务VC）是工业AI创业公司的最佳合作伙伴——它们提供的渠道和技术验证价值远超现金；③ 「感知→分析→决策→执行」的闭环能力是工业AI产品的终极形态——只做「感知和分析」的产品很快会被AI能力商品化浪潮吞噬；④ 能源行业的AI化才刚刚开始——Orbital面对的是一个$万亿级别的存量市场，即使只获取一小部分也足以支撑一家独角兽。

类比参考：「物理世界的「AI操作系统」/ 从「预测性维护」（看设备）到「运营优化」（管工厂）的能力跃迁」

5. VentureBeat调查：54%企业已遭遇AI Agent安全事件，但只有21%具备运行时可见性（行业洞察 / Agent安全的「灰犀牛」数据）

🔗 链接：VentureBeat | VentureBeat: 88%企业AI Agent安全事件 | TechRepublic

动态：VentureBeat Research于7月16日发布AI Agent安全调查报告。调查涵盖了107家企业的AI Agent安全实践，核心发现非常令人不安：

- 54%的企业已经经历了确认的Agent安全事件或险情（18%确认事件，36%接近事件） - 88%的企业在过去12个月内报告了AI Agent相关的安全事件 - 只有21%的企业拥有对Agent活动的运行时可见性 - 只有6%的安全预算目前用于AI Agent风险管理 - 大多数企业仍然让Agent共享API凭证（而不是为每个Agent创建独立的、范围受限的身份）

做什么的：这是一份由VentureBeat Research持续进行的「Agent安全脉搏调查」（Agentic Security Pulse Survey）。调查描绘了一个「先部署后安全」的现实：企业知道Agent安全有问题，但在测试和部署速度的压力下，安全控制仍然滞后。调查将Agent安全威胁分为三个阶段：第一阶段（可视性）、第二阶段（控制与策略）、第三阶段（运行时攻击）。大多数企业已经在经历第二阶段和第三阶段——但安全投资仍然停留在第一阶段。

为什么值得关注：

- 这个数据是所有正在构建或部署AI Agent的人的「必须阅读」——它不是在讲「未来可能发生什么」，而是在讲「现在正在发生什么」。 54%的企业已经遭遇Agent安全事件——这意味着Agent安全不是「明天的问题」，而是「昨天的问题」。对于AI应用创业公司来说，这个数据的直接影响是：你的企业客户（尤其是金融、医疗、合规敏感行业）很快会要求你提供「Agent安全认证」——就像他们要求SaaS公司提供SOC 2一样。如果你现在不开始构建Agent安全能力，你将在18个月后的企业采购流程中被竞争对手淘汰。

- 「运行时可见性」只有21%——这个数字是Agent基础设施市场最大的增长驱动因素。 如果大多数企业没有能力看到自己的Agent在做什么，他们也不可能控制Agent在做什么。「看不见→控制不了」的逻辑链是Runta（执行层）、Oak（身份层）、以及无数其他Agent安全创业公司的商业逻辑基础。 对于一个创业者来说，如果你能回答「企业如何实时看到Agent在做什么」，你就找到了一个确定性需求。

- 6%的安全预算用于Agent风险——这是市场上最明确的「预算迁移信号」。 当企业开始将安全资源从「传统安全工作」（端点保护、网络防火墙）转移到「AI Agent安全」时，一个巨大的市场正在形成。参照云安全的历史：2015年云安全占安全预算不到5%，到2022年超过25%。AI Agent安全的预算增长曲线可能比云安全更陡——因为Agent安全事件的发生速度比云安全事故更快。对于在AI安全领域创业的人来说，这个「6%→25%」的预算迁移就是你未来3-5年的增长曲线。

- Agent共享凭证的问题直接关联到Oak和Runta的价值主张。 当大多数企业让Agent共享API密钥时，一个Agent被攻破就意味着所有Agent的服务都被攻破。Oak的「每个Agent一个独立身份」和Runta的「每个Agent一个隔离沙箱」的核心价值，在这个数据背景下变得极其清晰。 这三条新闻——Runta融资、Oak融资、VB调查——形成了一个完整的叙事闭环：问题（54%安全事件）→解决方案（独立身份+隔离执行层）→资本支持（$20M+$60M种子轮）。

- 对创业者的启发：① 如果你在构建企业AI产品，请将「Agent安全白皮书」列入Q3路线图——你的客户将会在采购前问你要它；② 「运行时可见性」是最直接的创业切入点——如果企业看不见Agent在做什么，他们无法管理Agent安全；③ Agent安全的「预算迁移」是一个结构性的市场机会——它不依赖于AI技术突破，只依赖于企业安全意识的提升和监管压力的增加；④ Runta、Oak等创业公司的融资和VB调查的数据应该被解读为一个整体：Agent安全的「基础设施层」正在被我们眼前建设——而这个建设本身就是一个巨大的市场。

类比参考：「云安全2015年的味道——同样的「先跑后修」剧本 / Agent安全的「灰犀牛」终于被数据确认了」

值得重点跟踪的 3 个信号

1. Agent基础设施的「四层栈」正在形成——执行层、身份层、交互层、行业落地层。 本周的四笔融资（Runta→执行层、Oak→身份层、Aina→交互硬件、Applied Computing→行业落地）共同指向一个清晰的图景：AI Agent的经济正在催生一个全新的基础设施栈。 这个栈与传统云计算基础设施栈（IaaS→PaaS→SaaS）既有相似之处（分层架构、标准化接口），又有根本性的不同（Agent需要「控制和约束」而不仅仅是「提供资源」）。对于AI创业者来说，这个「四层栈」一方面提供了「在每一层找到创业机会」的路线图，另一方面提出了一个问题：你的产品是「填补某层空白」还是「跨层整合」？历史经验表明，跨层整合的公司（如AWS同时提供IaaS和PaaS）往往最终获胜——但初创公司在「单层做到最好」的成功路径也同样清晰（如Datadog在监控层、Snowflake在数据层）。关键启示：无论你选择哪一层，现在就开始构建——这个基础设施栈的建设窗口期可能在12-18个月。

2. 「先部署后安全」的模式正在被终结——Agent安全正在从「可选项」变成「入场券」。 VB调查的数据（54%事件、21%可见性、6%预算）是典型的「灰犀牛」——所有人都知道问题存在，但没有人采取足够行动。但Runta和Oak在同一天获得顶级VC的重注，本身就是一个市场信号：资本正在推动Agent安全从「可选」变成「标配」。 对于AI应用创业公司来说，这意味着你需要在产品路线图中内置Agent安全能力——而不是等客户要求了再去补。一个清晰的决策框架：如果你的产品涉及Agent执行动作、访问外部系统或处理敏感数据，你现在就应该评估是否需要「Agent身份管理」和「Agent执行沙箱」——因为你的客户很快就会问你要。

3. 工业AI正在从「监控」进化到「运营」——「物理AI」成为资本新宠。 Applied Computing不是这个趋势的唯一案例——上周的PixVerse（AI视频→实时交互世界）、Elorian（视觉推理AI）以及正在兴起的「AI+机器人」创业潮都指向同一方向：AI正在从「处理和生成信息」走向「理解和操控物理世界」。 这个转变对AI创业者的意义：① 如果你的AI产品仍然在「纯信息处理」领域（文本、代码、图像），你将面临越来越激烈的竞争和商品化压力；② 「物理世界理解」的能力（时间序列、物理仿真、因果推理）将成为AI产品的新差异化维度；③ 产业资本（而非纯财务VC）正在成为工业AI创业者的关键融资来源——找到愿意与你共建的行业合作伙伴比找到估值最高的VC更重要。

统计信息：收录 5 个产品/动态 | 融资总额 $1.005亿（Runta $2000万 + Oak $6000万 + Aina $550万 + Applied Computing $2000万） | 覆盖赛道：Agent执行层基础设施、Agent身份安全、AI硬件接口、工业AI基础模型、Agent安全市场洞察
4 days ago
0717日报 | AI治理新秩序：上海WAIC登场与全球AI合作组织诞生
0717日报 | AI治理新秩序：上海WAIC登场与全球AI合作组织诞生

今日洞察

今天的五个字：「全球AI的「联合国时刻」。」

7月17日是AI行业一个被标记为「制度性转折点」的日子。上海世博中心，2026世界人工智能大会（WAIC）正式开幕——但让这一天真正载入史册的，不是某家公司的产品发布，而是一个超主权机制的诞生：29个国家正式签署协议，成立世界AI合作组织（WAICO），总部设在上海。习近平首次出席WAIC并发表主旨演讲，系统阐述中国对全球AI治理的立场。

但WAIC 2026不只是地缘政治舞台——它也是中国AI产业能力的一次「全栈展示」。 Nubia与字节跳动豆包合作的全球首款AI Agent智能手机在WAIC首发——这不是一个「AI语音助手」式的渐进升级，而是一个能自主执行多步骤任务（订机票、填信息、付款）的操作系统级Agent。华为展示了Atlas 950 SuperPoD——8192个NPU互联、8 ExaFLOPS FP8算力、对标NVIDIA大规模集群的中国自主AI计算基础设施。300+产品全球首发、1100+企业参展、10万平米展区——WAIC 2026的规模本身就是一种声明：中国AI生态已经完成了从「追赶者」到「平行生态」的转型。

而同一天，TechCrunch发表了一篇关于Elorian AI的深度报道——前DeepMind研究员Andrew Dai在没有任何产品的情况下，以$5500万种子轮、$3亿估值融资。 这条新闻与WAIC的宏大叙事形成了有趣的对照：一边是国家层面的制度构建和产业展示，一边是硅谷顶级人才离开大实验室后的「闪电融资」模式。这两种路径——国家主导的生态建设 vs 顶级人才携资本单飞——正在2026年同时加速，形成AI行业最值得关注的双轨叙事。

结论：这一天的关键词是「制度」。 WAICO的诞生意味着AI超越技术竞争，进入「规则制定」的新阶段——29个国家的签约证明了「全球AI治理需要多边机制」已成为共识。而Nubia的Agent手机和华为Atlas 950 SuperPoD则提醒我们：规则需要能力支撑。对于AI创业者来说，核心启示是：在AI的「制度竞争」时代，单纯的技术优势已经不够——你需要在「中国生态」和「美国生态」之间找到自己的位置，因为这两个生态的治理规则、基础设施和人才流动正在快速分化。 Elorian的案例则展示了另一种可能性：对于拥有顶级研究背景的创始人，市场仍然愿意在「没有产品」的阶段下重注——但这条路只对极少数人开放。

1. WAIC 2026开幕 + 29国签署世界AI合作组织（WAICO）——全球AI治理的制度分水岭（行业洞察 / 全球AI治理新格局）

🔗 链接：CGTN报道 | Reuters | SCMP | NBC News

动态：7月17日，2026世界人工智能大会（WAIC）在上海世博中心开幕，习近平出席开幕式并发表主旨演讲——这是中国国家元首首次在WAIC发表演讲。 同日，29个国家签署了关于建立世界AI合作组织（WAICO）的协议——一个独立的政府间国际组织，总部设在上海。联合国秘书长古特雷斯出席签约仪式。中国外交部长王毅代表中国政府签署协议，哈萨克斯坦、老挝、巴基斯坦、俄罗斯、印度尼西亚等29个国家成为创始成员国。

做什么的：WAICO是首个由中国发起并主导的全球AI治理多边机制。组织宗旨：坚持《联合国宪章》宗旨，以「共商共建共享」为原则，以人为本，促进AI国际合作与全球治理，确保AI有益、安全、公平。同期发表的《全球AI治理合作行动计划》提出了全球AI治理的「中国方案」框架。WAIC 2026的规模同样创纪录：100,000平方米展览面积、1,100+参展企业、3,000+创新展品、300+全球首发产品、140+论坛、1,400+演讲嘉宾。

为什么值得关注：

- 世界AI合作组织是2026年最重要的制度创新。 这不是一个「宣言」或「倡议」——它是一个具有法律框架的政府间组织，总部设在上海。29个国家的签约意味着这个组织不是「只有中国和非洲国家」的象征性机构——包括俄罗斯、印尼、巴基斯坦等重要新兴经济体。 虽然没有美国、欧盟、日本等主要西方经济体的参与，但WAICO的成立标志着全球AI治理从「G7/G20式的小圈子协调」走向「有制度化架构的多边组织」。对于AI创业者来说，这意味着：未来几年，你的产品可能需要在两个并行的合规框架下运行——西方的AI Act体系和WAICO的治理框架——就像互联网公司需要同时遵守GDPR和中国数据安全法一样。

- 习近平的首次WAIC主旨演讲是一个被低估的信号。 中国国家元首出席「行业会议」并不常见——习近平此前从未出席过WAIC。他的出席和演讲意味着北京将AI视为「国家战略优先级」的政治信号已经达到新高度。 演讲中系统阐述的「全球AI治理中国方案」——强调安全、开放、包容的AI发展理念，以及通过多边机制而非单边制裁来管理AI风险——将成为中国在AI外交领域的基本立场。这对于在中国市场运营或与中国企业合作的创业公司来说，意味着「AI合规」正在从「技术问题」变成「地缘政治问题」——你需要理解中国AI监管的逻辑，而不仅仅是遵守规则。

- WAIC 2026的规模本身就是产业信号：中国AI生态的「平行系统」已经成形。 300+全球首发产品、1100+企业、10万平米展区——这些数字背后是一个结构性的变化：中国不再只是一个「AI消费市场」或「AI模型提供者」——中国正在构建一个从芯片（华为Ascend 950DT）到算力集群（Atlas 950 SuperPoD）到AI模型（GLM 5.2、DeepSeek、Kimi）到终端产品（Nubia Agent手机）的完整「并行生态」。对于AI创业者来说，这个「平行生态」意味着两个选择：要么作为中国生态的一部分参与（利用其供应链、市场和政策红利），要么作为美国生态的一部分参与（利用其资本、人才和全球市场）——但两个都参与的成本正在上升。

- 华为Atlas 950 SuperPoD的首次公开演示被低估了。 这个AI计算集群连接8,192个Ascend 950DT NPU，提供8 ExaFLOPS FP8算力——从纯算力规格上看，它是中国对美国AI芯片出口管制的最直接回应。Atlas 950在MWC Barcelona 2026上首次亮相但在WAIC才是首次面向中国公众和产业界的全面展示。 它的存在证明了中国AI基础设施供应链的「去A化」（去NVIDIA化）已经不只是理论——虽然性能和生态成熟度仍待验证，但华为确实在制造可用的替代方案。

- WAIC 2026还有一个被忽视的细节：设立了「一人公司（OPC）专区」。 这是WAIC历史上首次设立单独创业者展区，反映了中国AI创业生态中的一个结构变化——越来越多人选择独立创业而非加入大公司。这个信号与硅谷的「大厂人才密集创业潮」形成了有趣的全球性对照。

- 对创业者的启发：① 全球AI治理正在从「倡议」变成「制度」——如果你的产品涉及跨境AI应用，请从现在开始关注WAICO的治理规则和合规要求；② 中国的「平行AI生态」正在成形——这意味着「在中国做AI」的供应链风险在降低、但「在中美之间做AI」的合规成本在上升；③ 华为Atlas 950的存在说明，AI算力的「两极化」（NVIDIA vs 华为）正在从理论走向现实。

类比参考：「AI的「巴黎气候协定」时刻 / 从「谁的技术更强」到「谁的规则被采纳」」

2. Nubia二代豆包AI Agent手机在WAIC首发——全球首款系统级Agent智能手机（新产品 / AI从「被动问答」到「主动执行」的硬件入口）

🔗 链接：Pandaily | The Silicon Review | Gizmochina | Pandaily - Doubao Gen2

动态：7月17日，在WAIC 2026开幕首日，中兴旗下品牌Nubia正式发布了全球首款系统级AI Agent智能手机——第二代豆包手机。 中兴高级副总裁、终端事业部总裁倪飞确认这是量产旗舰机型，而非工程样机。该手机由Nubia与字节跳动豆包联合开发，搭载Snapdragon 8 Elite处理器，配备专属橙色AI按钮。

做什么的：这是一款超越传统语音助手的AI Agent手机。核心能力不再是「你问我答」（如Siri或小爱同学），而是GUI Agent技术——AI能够「看」懂屏幕上的按钮、文字和图标，模拟手指点击、滑动和操作。这意味着用户可以下达「帮我订一张去北京最便宜的机票」的指令，AI会自动完成：搜索航班、对比价格、填写乘客信息、完成支付——全程无需用户屏幕交互。技术架构为三层：操作系统层的深度系统AI集成、设备端大模型推理（保障隐私和速度）、以及OpenClaw开放架构（允许第三方开发者接入自己的AI能力）。

为什么值得关注：

- 这是「AI Agent」从软件概念到硬件品类的一次跨越。 2024-2026年间，行业一直在争论「AI Phone应该是什么样」。Apple Intelligence、三星Galaxy AI、Google Pixel AI都走了「AI辅助」路线——AI帮你编辑照片、总结通知、建议回复。但Nubia的选择是激进的：AI不再是手机的「辅助功能」，而是手机的操作系统级「执行者」。 当其他厂商还在做「AI增强的系统功能」时，Nubia在做「AI替代用户操作」。对于AI创业者来说，这个产品定义上的差异是最值得关注的：你是让AI「辅助人做得更好」，还是让AI「替人做完」？——前者是渐进式创新，后者是范式转换。

- 从MCP/A2A协议替代INJECT_EVENTS——解决了上一代被微信/支付宝屏蔽的根本问题。 第一代Nubia M153（2025年底的技术预览版）虽然一天卖出3万台，但5天后被微信、支付宝和银行App集体屏蔽——因为它使用了Android的INJECT_EVENTS系统权限模拟用户点击，触发了支付安全警报。第二代的关键技术改进：从「模拟点击」转向MCP（Model Context Protocol）和A2A（Agent-to-Agent）协议，不再需要屏幕识别和模拟点击，从而绕过了上一代的平台封锁问题。这个技术路线切换对整个行业有参考价值：AI Agent的「系统级权限」和「平台安全」之间的矛盾，MCP/A2A协议提供了一种不需要侵入式权限的解决方案。

- 字节跳动豆包的深度参与是一个战略级信号。 作为中国月活3.45亿的AI应用，豆包在7月15日因「AI伴侣法」关闭了个性化AI Agent功能——但7月17日就和Nubia合作推出了AI Agent手机。这意味着：字节跳动对AI能力的投入没有因为监管而放缓，而是从「纯软件AI伴侣」转向了「嵌入式硬件AI Agent」——一个更少监管争议、更多系统级控制权的方向。对于创业者来说，这个转向提供了一条「监管缓冲」的思路：如果你的AI软件产品面临监管压力，考虑与硬件厂商合作将能力嵌入设备端。

- 定位为「量产旗舰」而非「概念机」——AI Agent手机的商业化路径正在清晰。 这不是一个PPT产品——Snapdragon 8 Elite处理器、旗舰级硬件配置、量产确认。当AI Agent从实验室走进消费者口袋，它带来的不仅是技术升级，更是用户行为的根本性变化：从「人类找功能」到「AI主动执行」。 如果这个品类成功，它将重新定义手机操作系统的交互范式——就像2007年iPhone用触屏重新定义了手机交互一样。

- 对创业者的启发：① AI Agent的硬件化是2026年的关键趋势——当软件层的Agent竞争已经红海，在硬件层「把AI做成默认交互方式」可能是一个巨大蓝海；② MCP/A2A协议替代INJECT_EVENTS是一个重要的技术启示——AI Agent系统权限问题的解决方案可能不在「争取更多权限」，而在「改变交互协议」；③ 字节跳动的AI战略转向（从AI伴侣软件到AI Agent硬件）提供了「监管压力下的产品转型范本」。

类比参考：「手机从「触屏时代」到「Agent时代」的iPhone时刻 / AI从「秘书」变成「管家」的底层跨越」

3. Elorian AI：前DeepMind研究员Andrew Dai在无产品情况下拿下$5500万种子轮、$3亿估值（融资 / 视觉推理AI的「顶级团队溢价」）

🔗 链接：TechCrunch报道+播客 | Fast Company | Elorian官网 | Bloomberg | Startup Fortune

动态：前Google DeepMind研究员Andrew Dai创立的Elorian AI宣布完成$5500万种子轮融资，估值$3亿——在没有任何产品的情况下。 本轮由Striker Venture Partners领投，NVIDIA、Menlo Ventures、Jeff Dean（Google DeepMind联合创始人）等参投。TechCrunch于7月16日发表深度报道+播客，详细还原了Andrew Dai离开DeepMind后如何在5个月内完成从团队搭建到融资的全过程。

做什么的：Elorian AI是一家总部位于Palo Alto的「多模态推理研究和产品实验室」。核心研发方向是视觉推理AI——构建能像人类一样原生理解图像而非先将图像转换为文本描述的系统。Andrew Dai在接受TechCrunch采访时阐述的核心理念是：「当前的多模态模型本质上是在做『图片→文字』的翻译——它们描述图像而不是理解图像。Elorian的目标是构建能直接对视觉世界进行推理的模型。」Fast Company的报道将其描述为「一种用图像思考、而不是用文字思考的AI模型」。

为什么值得关注：

- $5500万种子轮 / $3亿估值——AI创业「人才溢价」的极致样本。 在产品未发布、无收入、无客户的情况下，仅凭团队背景就拿到$5500万种子轮，估值$3亿。这个数字打破了AI种子轮的估值天花板——一般的种子轮在$500万-$2000万之间。 值得注意的是，这并非行业孤例：今年4月，前DeepMind研究员David Silver创立的Ineffable Intelligence拿到了$11亿种子轮。Elorian的融资证明了AI行业的一个残酷现实：超级人才（来自DeepMind、OpenAI、Google Brain的核心研究者）正在获得「零产品验证」的超级溢价，而普通创始人需要至少数年的产品验证才能获得同等级别的资本关注。对于AI创业者来说，这个信号的意义不是「羡慕」，而是：如果你的团队背景不足以获得「人才溢价」，你的产品必须在早期就展示出可量化的指标（用户增长、收入、技术壁垒）。

- 视觉推理——一个被低估但正在爆发的基础模型方向。 当前AI主赛道是语言模型（LLM）、编码模型和Agent。视觉推理作为一个独立方向相对被忽视——多数公司认为「多模态模型能看图片就够了」。但Elorian的论点很有说服力：让AI「真正看懂」而不是「描述所见」，是一个根本性的能力跃迁。 自动驾驶、医疗影像、工业质检、机器人操作——这些领域的底层需求不是「AI能描述图片」，而是「AI能根据视觉输入做出决策」。Fast Company的分析指出，Elorian的视觉推理模型可能找到最自然的应用场景在那些需要深度物理理解的领域——医学影像、无人机导航、仓储机器人。 对于AI产品经理来说，视觉推理是一个值得关注的方向：它可能解锁一批当前LLM无法触达的「物理世界理解」应用场景。

- Andrew Dai的背景就是最大的护城河。 他曾是Google DeepMind预训练、数据和多模态方向的负责人之一——这些恰好是构建「视觉推理模型」最需要的能力维度。团队还包括来自Google和Apple的研究人员。NVIDIA的参投尤其值得注意——Elorian的视觉推理模型如果成功，将天然需要大量NVIDIA算力，这是一个典型的「算力供应商押注应用层」的投资逻辑。 同时，Jeff Dean的参与既是对技术方向的背书，也暗示了Elorian与Google DeepMind技术路线的延续性。

- 「5个月从离开到融资」的效率是一个创业范本。 TechCrunch的深度报道披露了一个关键细节：Andrew Dai从离开DeepMind到完成$5500万融资，总共只用了5个月。这个效率对于AI创业者有直接的参考价值：① 顶级研究者离开大厂后，第一代资本窗口期只有3-6个月——市场对「前DeepMind研究员」的关注度会快速衰减；② 没有产品时，展示「技术愿景+团队能力+资本背书」的三角验证比实际产品更重要；③ 在2026年的融资环境中，「团队背景」和「技术方向的新颖性」比「商业模式清晰度」更值钱。

- 对创业者的启发：① 如果你正在AI视觉/多模态方向创业，Elorian的融资意味着这个赛道已经获得顶级资本认可——但同时也意味着竞争门槛在提高；② 「人才溢价」模式不可复制——如果你的团队不是来自DeepMind/OpenAI级别，不要期望拿到同等级别的种子轮估值；③ Elorian的模式（研究实验室→产品）与Thinking Machines的模式（研究实验室→产品）遵循同一路径——2026年的AI融资偏好正在从「有产品的创始团队」转向「有研究背景的创始人在关键方向上」；④ NVIDIA作为LP参与多个AI基础设施/模型公司的投资——意味着NVIDIA正在从「芯片公司」变成「AI生态风险投资公司」。

类比参考：「视觉AI的「人才IPO」/ 从「图片翻译者」到「视觉推理者」的模型范式跃迁」

值得重点跟踪的 3 个信号

1. WAICO vs 西方AI治理体系的「双轨制」正在形成。 29个国家签约WAICO是一个制度创新的起点，但更引人注目的是它的「不包括什么」——美国、欧盟、英国、日本等主要AI强国不在其中。这意味着全球AI治理正在走向一个「双轨制」：西方主导的OECD/G7 AI原则框架 vs 中国主导的WAICO框架。对于AI创业者来说，这个双轨制意味着：如果你的产品服务全球市场，你可能需要满足两套不同的AI治理标准——未来3年内，WAICO的治理规则将逐渐成形，现在就应该关注其政策走向。更重要的是，WAICO的成员国主要是「全球南方」国家——这些国家恰好是AI产品增量市场最大的地区。

2. AI Agent的「硬件入口」竞争正式开启。 Nubia的AI Agent手机证明了AI Agent不再只是云端服务或软件功能——它正在变成一个硬件品类。当你的手机不再是一个「你滑动屏幕然后点击应用」的被动工具，而是一个「你告诉它要什么它就帮你做完」的主动Agent时，用户与硬件的关系被彻底改变了。 Nubia/字节跳动的方案是第一枪，但Apple、Samsung、Google不会坐视不理——预计年底到2026年初，会有大量「系统级AI Agent手机」发布。对于AI创业者来说，这意味着「AI Agent」的基础设施层正在快速标准化（MCP/A2A协议），为上层应用开发者打开了新的机会窗口。

3. 「无产品融资」模式正在成为AI超级人才的标配。 Elorian ($55M seed, $300M valuation, no product) + Ineffable Intelligence ($1.1B seed, no product) + Thinking Machines ($2B seed, pre-product stage) ——这已经不是个例，而是一个「超级人才融资」的品类。 关键共同点：① 创始人来自DeepMind/OpenAI核心团队；② 技术方向是「下一个前沿」（视觉推理、AGI、开放模型）；③ 早期投资者愿意基于「团队×方向」而非「产品×市场」做决策。对于大多数创业者，这个模式的不可复制性是残酷的现实——但它的确在改变整个AI创业的「入场门槛」：最好的团队不再需要「做出来」证明自己，他们只需要「说出来」——而第二梯队的团队仍然需要通过产品验证来赢得信任。

*统计信息：收录 3 个产品/动态 | 融资总额 $0.55 亿(仅含Elorian) | 覆盖赛道：全球AI治理、AI Agent硬件、视觉推理AI*
5 days ago
0716日报 | 开放模型的新玩家与AI部署的现实鸿沟

今日洞察

今天的五个字：「模型在变强，部署在原地。」

7月16日是理性与现实的碰撞日。当Mira Murati的Thinking Machines以9750亿参数的开源模型Inkling正式登台时，AI社区沉浸在「又一位重量级开放模型玩家入场」的兴奋中。但同一天发布的VentureBeat Pulse Research和VB Transform 2026上的两场关键演讲，给出了一个令人清醒的对照——企业AI的部署现实远远落后于模型能力的发展。

最重磅的新闻当然是Thinking Machines Inkling的发布。 这位由前OpenAI CTO Mira Murati创立的、以$20亿种子轮创下硅谷纪录的初创公司，今天正式发布了其第一个自研模型。9750亿参数、Apache 2.0开源协议、原生多模态、可控思考力度——以及最引人注目的卖点「抗审查」（resistance to censorship）。在Inkling-Small仅120亿活跃参数就能在SWE-bench上跑出77.6%的背景下，这不仅是Mira Murati对OpenAI的「I told you so」时刻，更是美国开源模型阵营对来自中国的GLM 5.2、DeepSeek V4 Pro和Kimi K2.6的一次正面回击。

但同一天，VentureBeat发布的企业AI编排Pulse Research揭示了一个令人不安的数字：71%的企业承认，他们部署的「Agent」中，四分之一或更多只是单轮对话的聊天机器人包装器——而不是真正的多步编排工作流。研究还显示，40%的企业选择Anthropic Claude作为主要编排平台，Anthropic以超过两倍于第二名微软的优势领先。但核心信息是：企业正在「提前建设编排层」——基础设施已经在投资，但被编排的Agent组合还没有到位。

而Amazon AGI Autonomy总监Bryan Silverthorn在VB Transform 2026上的演讲，给出了更刺眼的数据：85%的企业在试点AI Agent，但只有5%将其投入生产。 原因不是模型能力不够，而是「可靠性」——一个通过内部评估但在客户面前失败的Agent案例比比皆是。Silverthorn提出了一个有趣的框架：把Agent当「实习生」来管理——强大但有时会犯错，需要管理技巧而非软件技巧。

结论：这一天的关键词是「断层」。** Thinking Machines带来了模型层的新竞争力，但企业AI的部署瓶颈已经不在模型侧——从85%试点到5%生产的差距就是最好的证据。Inkling的发布说明了「开放模型正在成为主流」，但VB Pulse Survey说明「企业在如何用这些模型上还处于非常初级的阶段」。对于AI创业者来说，最大的机会也许不再是「更好的模型」，而是「帮助企业跨越从试点到生产的鸿沟的产品」——从Agent评估、到可靠部署、到实时成本控制。**模型正在变得越来越开放、越来越便宜，但让模型在企业中「可靠地工作」的能力，还没有跟上。

---

1. [Thinking Machines开源发布首款多模态语言模型Inkling——Mira Murati的「开放模型宣言」](https://venturebeat.com/technology/thinking-machines-open-sources-first-multimodal-language-model-inkling-focused-on-low-cost-and-resistance-to-censorship)（新产品 / 美国开源模型阵营的新旗手）

🔗 链接：[VentureBeat](https://venturebeat.com/technology/thinking-machines-open-sources-first-multimodal-language-model-inkling-focused-on-low-cost-and-resistance-to-censorship) | [Thinking Machines官方](https://thinkingmachines.ai/news/introducing-inkling/) | [Hugging Face](https://huggingface.co/blog/thinkingmachines-inkling) | [WSJ](https://www.wsj.com/tech/ai/mira-muratis-ai-startup-releases-first-model-in-bid-to-loosen-ai-giants-grip-e042bb2b)

动态：今天（7月16日），由前OpenAI CTO Mira Murati创立的Thinking Machines Lab正式发布其首款自研模型Inkling。 Inkling是一个9750亿总参数（410亿活跃参数）的Mixture-of-Experts（MoE）多模态模型，以Apache 2.0开源协议发布。同时发布的还有Inkling-Small预览版（2760亿总参数、120亿活跃参数），面向低延迟、低成本场景。模型权重已在Hugging Face和Thinking Machines的Tinker平台上线。API定价：64K上下文窗口$1.87/百万token输入、$4.68/百万token输出，提供50%折扣促销。

做什么的：Inkling是一个支持文本、图像、音频原生推理的多模态基础模型，训练数据规模达45万亿token。核心特性包括：可控思考力度（Controllable Thinking Effort）机制——允许开发者根据任务复杂度动态调整模型推理深度；1M token上下文窗口；在Tinker平台上可直接进行微调定制。独特卖点：Thinking Machines明确表示Inkling被设计为「可以就直接回答那些可能被审查的话题」，提供「抗审查」能力——这对企业客户来说意味着更透明的输出。

为什么值得关注：
**Mira Murati的「I told you so」时刻。** 作为OpenAI前CTO（ChatGPT、GPT-4、DALL-E的核心推手），Murati离开OpenAI后以$20亿种子轮（$120亿估值）创立Thinking Machines的举动曾被质疑为「估值炒作」。**但Inkling的发布证明了这支团队有真正的模型交付能力——9750亿参数、Apache 2.0开源、原生多模态，这不仅仅是「一个创业公司的模型」，这是一个可以与GLM 5.2和DeepSeek V4 Pro正面竞争的选手。** 在SWE-bench Verified上达到77.6%（超过Nemotron 3 Ultra的70.7%），在AIME 2026数学推理上达到97.1%（超过DeepSeek V4 Pro的96.7%），在MCP Atlas agentic工作流上达到74.1%（远超Nemotron的44.7%）。**对于AI创业者来说，Murati的路径是一个重要的创业范本：从大公司核心岗位出走，以创纪录融资建立团队，然后15个月内交付世界级开源模型——这对所有「前大厂AI高管创业」的叙事都是一种验证。**

**「抗审查」是一个被低估的商业差异化。** 在OpenAI、Anthropic、Google都在朝着「更安全/更受限」方向发展的背景下，Thinking Machines选择了一个相反的定位——「我们的模型直接回答问题，不在敏感话题上回避」。**这看起来是一个「价值观声明」，但实际上是一个极其精准的商业定位：企业客户最头疼的问题之一就是模型在关键业务问题上「闭嘴」或「政治正确地回避」——当客户问「我这个产品有什么风险」时，模型给一个「我不能回答这个问题」的回复，这对企业是不可接受的。** 「抗审查」不是指「违禁内容」，而是指「在事实性问题上不被内容策略限制」。**对于构建企业AI产品的创业者来说，这是一个重要的产品设计考量：你的AI是「更安全但更爱说「我不能」」，还是「更透明但需要更好的护栏」？**

**Inkling在benchmark上「足够好但不最好」的定位是一个聪明的市场策略。** 在SWE-bench Verified上77.6%——不如DeepSeek V4 Pro的80.6%和Claude Fable 5的状态-of-the-art，但优于Nemotron和多数开源模型。在AIME 2026上97.1%——略高于DeepSeek但低于GLM 5.2。**Thinking Machines没有试图在benchmark上全面超越中国开源模型，而是在「多模态能力×抗审查×可控思考×Apache 2.0」的组合上建立差异化。** 这个策略对AI产品创业者有直接启发：在2026年的AI市场中，单纯在benchmark上「领先」已经不够了——你需要在一个「组合价值」上建立差异化，而不仅仅是「分数更高」。

**Inkling-Small的2760亿参数（120亿活跃）是最被低估的发布点。** 在模型部署成本成为企业核心关注点的2026年，一个能在单张GPU上运行的、性能足够强的开源模型，可能比Inkling本身更有商业价值。**Cohere刚刚在上周的VB Transform上力推「80%的企业工作流不需要最强模型」的理念，Inkling-Small正是对这一理念的产品级回应——120亿活跃参数的模型就能达到77.6%的SWE-bench成绩，这意味着大多数编码辅助、文档处理、客服响应等场景可以用更小的模型完成。**

**Thinking Machines的「Tinker」平台可能才是真正的商业引擎。** 与Inkling同时发布的Tinker是一个「模型微调即服务」平台——让开发者可以在Thinking Machines的基础模型上进行定制化微调。**Inkling是免费的（开源），但Tinker上的微调计算资源是收费的——这是一个经典的「开源获客+云服务变现」的商业模型（参考Hugging Face、Replicate、Fireworks AI的成功路径）。**

对创业者的启发：**① 「开源模型+云平台」正在成为AI基础模型公司的标准商业模型——Inkling+Tinker的组合（开源获客+微调变现）值得所有模型层创业者参考；② 「抗审查」定位是一个被低估的AI产品差异化维度——在越来越「安全第一」的行业趋势中，「可靠地回答敏感问题」可能是企业客户愿意付费购买的核心价值；③ Inkling-Small的存在说明：2026年AI产品的竞争焦点正在从「谁有最大的模型」转向「谁有最适合特定场景的模型」；④ Thinking Machines的$20亿种子轮和15个月的交付周期创下了「从零到模型发布」的新效率标准——这对整个AI创业生态的融资节奏和交付预期都会产生影响。**

类比参考**：**「OpenAI的「叛逃者」终于拿出了硬货 / 从「OpenAI前CTO的传说」到「975B参数的现实」的质变」

---

2. [VentureBeat Pulse Research：企业AI编排的「雄心与现实」之间的鸿沟](https://venturebeat.com/orchestration/agentic-orchestration-enterprise-ai-organizations-have-a-deployment-problem-not-a-platform-problem-and-most-are-calling-chatbots-agents)（行业洞察 / 101家企业AI编排全景调查）

🔗 链接：[VentureBeat Pulse Survey](https://venturebeat.com/orchestration/agentic-orchestration-enterprise-ai-organizations-have-a-deployment-problem-not-a-platform-problem-and-most-are-calling-chatbots-agents)

动态：7月16日，VentureBeat发布基于101家企业（员工100人以上）的Pulse Research调查，主题为「企业AI Agent编排」。核心发现揭示了企业AI部署的一个结构性悖论：编排平台正在快速建立，但被编排的Agent本身大多还不是真正的Agent。 调查数据来源为2026年6月单次采样，覆盖技术/软件（44%）、金融服务（17%）、医疗（8%）等行业，81%的受访者为AI解决方案的推荐者、影响者或最终决策者。

做什么的：这是一个对企业AI Agent编排市场的全景调查。调查维度包括：企业使用什么编排平台？选择平台的核心驱动因素？如何评估Agent的成功？部署的Agent中真正「多步编排」的比例是多少？控制平面架构是供应商自管还是混合？以及最关键的——Agent的成本控制是否到位？

为什么值得关注：

**Anthropic Claude以40%的份额遥遥领先——「模型引力」决定了编排平台选择。** 调查显示，40%的企业选择Anthropic的Claude平台作为主要Agent编排平台，超过微软（18%）的两倍，是OpenAI（13%）的三倍。**核心驱动因素不是平台功能，而是「模型引力」（Model Gravity）——21%的受访者选择平台的理由是「与最先进的基础模型原生对齐」。** 这意味着：在选择编排平台时，企业首先选择的是底层模型，而不是编排能力。**这对AI创业者是一个关键洞察：如果你的产品依赖于一个编排平台，你的长期竞争壁垒可能取决于该平台的「模型引力」是否可持续。** Anthropic目前占据优势，但如果其模型领先地位被OpenAI或Google超越，当前的编排平台格局可能会迅速翻转。

**71%的企业承认他们的大多数「Agent」只是聊天机器人包装器。** 这是整个调查中最刺眼的数据。当被要求诚实评估自己的Agent组合时，71%的受访者表示他们部署的Agent中「四分之一或更少」是真正的多步编排工作流——大多数只是单轮对话的聊天机器人包装器。只有10%的企业跨越了「一半以上是真正的Agent」的门槛。**这意味着「Agent」这个词在企业中被严重滥用了——企业正在投资Agent编排层，但编排层要管理的大多数「Agent」其实并不是Agent。**

**51%的企业预期2026年底前采用混合控制平面——对供应商锁定的恐惧是核心驱动力。** 调查显示，35%的企业将「供应商锁定」视为将Agent控制权放在模型提供商内部的最大风险。因此，51%的企业预期到2026年底采用「提供商原生+外部编排」的混合控制平面，只有6%的企业愿意完全将控制权交给提供商托管服务。**对于AI编排工具创业公司来说，这意味着市场偏好正在向「开放/混合」方向倾斜——一个能够连接多个模型提供商的独立编排层，比一个封闭的单一提供商编排平台更有长期吸引力。**

**成本控制的缺失是最被忽视的风险。** 超过四分之一（27%）的企业没有实时方式来阻止失控的Agent在账单到达之前失控。考虑到昨天（0715）1Password刚刚发布了AI支出管理产品，这个数据直接验证了1Password的产品假设——企业正在为缺乏Agent成本控制工具而焦虑。

对创业者的启发：**① 「Agent」这个词被严重滥用了——如果你在做Agent创业，你的产品可能面临的竞争不是来自其他Agent产品，而是来自被误称为Agent的聊天机器人；② Anthropic Claude的领先地位说明「模型引力」是当前编排市场的主导力量——如果在Claude之上建编排产品，你需要考虑「如果Anthropic的模型领先地位不再」的风险；③ 混合控制平面是明确的趋势——独立的、模型无关的编排层是一个正在形成的产品品类；④ Agent成本控制工具是27%企业的刚需——如果你在企业AI治理领域找切入点，Agent支出管理是一个有明确需求的子品类。**

类比参考**：**「AI Agent的「皇帝的新衣」 / 从「说自己是Agent」到「真的是Agent」的成熟度跨越」

---

3. [VB Transform 2026 Day 2：Amazon AGI总监×Cohere VP——企业AI从「能力竞赛」到「可靠性竞赛」](https://venturebeat.com/technology/amazon-agi-director-says-ai-agent-reliability-not-capability-is-blocking-enterprise-deployment-at-vb-transform-2026)（行业洞察 / 企业AI部署的两大核心命题）

🔗 链接：[Amazon: VentureBeat](https://venturebeat.com/technology/amazon-agi-director-says-ai-agent-reliability-not-capability-is-blocking-enterprise-deployment-at-vb-transform-2026) | [Cohere: VentureBeat](https://venturebeat.com/technology/cohere-vp-says-enterprise-ai-sovereignty-requires-control-of-the-full-agent-stack)

动态：VB Transform 2026第二天的两场关键演讲给出了企业AI部署的两个核心命题。Amazon AGI Autonomy总监Bryan Silverthorn提出了「可靠性而非能力才是瓶颈」的论点，Cohere产品工程VP Rachad Alao则阐述了「AI主权需要控制完整Agent栈」的立场。 这两场演讲共同构成了7月16日AI行业对企业AI部署最深入的一次诊断。

做什么的：Silverthorn在演讲中分享了他的「四维可靠性框架」（一致性、鲁棒性、可预测性、安全性），以及Amazon AGI实验室内部的「实习生管理哲学」——将Agent视为需要管理的实习生而非完美的自动化工具。Alao则从数据控制、基础设施主权、模型路由和价值定价四个维度，阐述了Cohere对「企业AI主权」的定义。

为什么值得关注：

**Amazon的「实习生框架」可能是2026年最具传播力的AI管理理念。** Silverthorn在演讲中描述了一个真实案例：一个客户部署了Agent进行软件QA——从截图中提取序列号。Agent在前两个月完美运行，然后开始间歇性地读取错误数字。原因：底层的视觉编码器在序列号出现在屏幕不同位置时表现不同，而一个对人类来说不可感知的软件变更触发了失败。**Silverthorn的结论是：Agent管理不是软件工程问题，而是管理问题。** 「你能问实习生，『嘿，你可能会在什么地方出错？你如何减轻负面影响？』」**这个「实习生框架」对企业AI产品设计有一个深远的启示：你的Agent产品应该预设「会犯错」，并在架构中内置「失败后的恢复机制」——而不是假装完美。**

**Amazon AGI的「四维可靠性框架」为所有AI Agent产品提供了一个评估标准。** 一致性（Consistency）：同一个输入在不同时间是否得到相同输出？鲁棒性（Robustness）：当输入环境变化时，Agent是否仍能可靠运行？可预测性（Predictability）：用户是否能在Agent行动前预判它将做什么？安全性（Safety）：Agent的失败是否会带来超出可接受范围的损失？**这四个维度应该成为每个AI Agent产品的「出厂检查清单」。** Silverthorn特别指出：「我见过的几乎所有评估都把这四个维度搅在一起了。」

**Cohere的「主权栈」提法重塑了企业AI采购的决策框架。** Alao在发言中详细拆解了「AI主权」的完整栈：从GPU和私有云基础设施、到治理系统（路由请求的中间层）、到连接器和搜索工具、到Agent框架。**他的核心论点是：如果企业只在「模型层」控制了主权（使用开源模型），但在「编排层」依赖了云提供商的服务，那主权是不完整的。** 这个论点对AI基础设施创业公司是一个重要信号：「主权AI」不仅仅是一个模型的开源/闭源问题，而是一个「全栈控制」的架构问题。

**Cohere不按token收费的定价模式——一个值得关注的商业模式创新。** Alao在采访中透露：「如果你的收费方式是按照token消耗，你就有动机最大化token消耗。我们不这样卖模型。」**Cohere的定价模式是按能力访问而非按消耗量——这是一个反行业惯例的策略。** 在DeepSeek将价格压到$0.435/百万token的今天，按token收费的模式正在面临更大的下行压力。Cohere的「按能力定价」模式如果被验证成功，可能改变AI B2B定价的底层逻辑。

**Silverthorn对「自我改进AI」的坦诚——85%试点到5%生产的差距没有快速解决方案。** 当被问及AI Agent能否自我改进时，Silverthorn坦率地说「自我改进」仍然是一个「loaded term」（有争议的术语）——Amazon确实在用AI改进模型，但完全自主的自我改进还很遥远。**这种坦诚在AI行业高管中不太常见，但恰恰是这种坦诚让听众更信任他的可靠性框架。**

对创业者的启发：**① 「四维可靠性框架」是可移植的——无论你做的是AI Agent产品还是AI Agent评估工具，一致性/鲁棒性/可预测性/安全性这四个维度是最好的产品功能路线图；② 「内部评估通过但客户面前失败」是一个普遍现象——这意味着AI Agent评估工具是明确的创业机会（市场验证：VentureBeat自己的研究显示50%的企业经历过这种情况）；③ Cohere的「全栈主权」思路对做企业AI基建的创业者是直接的产品设计指南——你的产品是覆盖了整个栈的哪一层？是否与其他层可以解耦？④ 「按能力定价」而非「按token定价」可能成为AI B2B的一个新定价范式——如果你的目标客户是大型企业，值得研究Cohere的定价模型；⑤ Amazon的「实习生框架」是一个UX设计的启示——AI Agent产品的用户界面应该预设「Agent会犯错」，并提供「撤销」「重试」「查看思考过程」等功能。**

类比参考**：**「企业AI的「驾照考试」/ 从「这辆车能开到300km/h」到「这辆车在雨天能安全开到60km/h」的评估范式迁移」

---

4. [DeepSeek寻求$740亿估值新一轮融资——中国AI独角兽的IPO前夜](https://www.businesstimes.com.sg/startups-tech/technology/chinas-deepseek-raise-fresh-capital-us74-billion-valuation-ahead-onshore-ipo)（融资 / 中国AI的估值与合规双线叙事）

🔗 链接：[Business Times](https://www.businesstimes.com.sg/startups-tech/technology/chinas-deepseek-raise-fresh-capital-us74-billion-valuation-ahead-onshore-ipo) | [Bloomberg](https://www.bloomberg.com/news/articles/2026-07-15/deepseek-said-to-plan-ipo-as-soon-as-this-year) | [Reuters](https://www.reuters.com/business/retail-consumer/deepseek-slated-draw-7-billion-maiden-fundraising-sources-say-2026-06-03/)

融资信息：约5000亿人民币（$740亿）估值，寻求约500亿人民币（$74亿）的新融资。 DeepSeek于今年6月刚刚完成首轮外部融资（约$74亿，投后估值约$500亿人民币），如今在不到一个月的时间内启动新一轮融资。同时，DeepSeek已开始为在上海科创板（Star Market）上市进行早期筹划，内部目标是在2026年内完成IPO申报。创始人梁文峰的净资产据Bloomberg Billionaires Index已超过$360亿。

做什么的：DeepSeek是总部位于杭州的中国AI公司，以2025年初以远低于美国竞争对手的训练成本发布前沿AI模型而震惊全球。公司正在从纯模型公司向多个方向扩展：自研AI推理芯片（已秘密招聘芯片设计工程师）、扩大数据中心规模、拓展AI Agent业务。此轮融资将用于支持这些大规模资本支出。

为什么值得关注：

**$740亿估值在不到一个月内从$500亿跳升48%——AI公司的估值增速前所未有。** DeepSeek在6月的首轮融资估值约为$500亿人民币（约$500亿），而新一轮以$740亿估值的融资意味着在不到一个月的时间内估值增长了48%。**这个增速即使在2025-2026年的AI泡沫语境下也是令人瞠目的。** 原因可能包括：① DeepSeek V4-Pro的定价战策略正在扩大其市场份额；② 投资者对中国AI领域「唯一冠军」的认知正在强化；③ 自研芯片的叙事为估值提供了新的想象空间。**对于AI创业者来说，DeepSeek的估值曲线提醒你：在这个市场中，估值不仅仅反映当前收入，还反映「在中国AI生态中的战略地位」。**

**中国AI IPO的首个大型测试案例。** 如果DeepSeek成功在2026年内完成科创板上市，它将是中国AI公司中的第一个大型IPO。**考虑到中国AI伴侣法（昨天0715生效）带来的监管不确定性，以及中美科技脱钩的持续演进，DeepSeek的IPO将成为全球投资者观察「中国AI监管环境下如何上市」的窗口。** 这可能导致两种结果：如果DeepSeek成功上市且估值稳定，它将为其他中国AI公司打开一个融资出口；如果IPO受阻或估值严重缩水，中国AI创业生态的资本退出策略将受到重大影响。

**自研芯片+数据中心+Agent——DeepSeek正在从「模型公司」转型为「AI基础设施公司」。** DeepSeek同时推进的三大战略方向（芯片设计、数据中心、AI Agent）指向一个明确的战略意图：**它不想成为另一个需要依赖Nvidia芯片和云基础设施的模型公司，它想成为自己的AI基础设施。** 这种「纵向整合」策略在AI行业中既罕见又昂贵——但它的逻辑是：在无法获得最新Nvidia芯片的中国市场，自有芯片和数据中心是维持模型竞争力的必要条件。**对于全球化AI创业者来说，DeepSeek的策略是一个极端情况下的纵向整合案例——当供应链被政治切断时，你的垂直整合深度决定了你的生存能力。**

**连续融资表明AI模型开发的资本消耗远未放缓。** 在一个月内从$500亿到$740亿的估值跳跃，说明AI前沿模型的开发和部署成本正在以超过投资者预期的速度增长。**这与VentureBeat同期发布的企业AI部署调查中的「85%试点、5%生产」数据形成对比——模型端的资本消耗在加速，但应用端的部署在滞后。这种「供给侧投入」与「需求侧吸收」之间的错配，是2026年AI行业最大的结构性风险。**

对创业者的启发：**① DeepSeek的快速估值跃升说明：在当前AI市场中，「战略位置」有时比「财务数据」更能推动估值——你不需要在收入上证明自己，但需要在行业叙事中占据一个不可替代的位置；② 如果你在中国AI生态中创业，DeepSeek的IPO将是你的「退出的天气风向标」——密切关注其进展和估值变化；③ 自研芯片策略对大多数AI创业公司不适用（资本门槛太高），但「纵向整合」的思路可以迁移到更小的范围——比如自研评估框架、自研特定领域数据集、自研部署优化工具；④ 深Seek的连续融资策略也值得学习：在估值上升期「趁热打铁」的能力——不要等到需要钱的时候才去融资，要在估值最高的时候融资。**

类比参考**：**「中国AI的「国家冠军」养成记 / 从「价格屠夫」到「基建帝国」的估值跃迁」

---

值得重点跟踪的 3 个信号

1. 「开放模型三国杀」正式开打——Thinking Machines vs. GLM vs. DeepSeek，美国开源阵营终于有了新的旗手。 2026年上半年的开源模型竞赛基本是中国实验室的独角戏——GLM 5.2、DeepSeek V4 Pro、Kimi K2.6轮番登上benchmark顶端。今天Thinking Machines的Inkling发布打破了这一格局：美国终于有了一个能与这些中国开源模型正面竞争的开源选手。 但更值得关注的是Inkling的定位差异——它不试图在纯benchmark上超越中国对手，而是在「多模态能力×抗审查×可控思考力度×Apache 2.0」的组合上建立差异化。这意味着2026年下半年的开源模型竞争将从「谁的benchmark更高」转向「谁的定位组合更独特」——对于模型层创业者，这是一个重要的产品定位思考：你不需要在所有维度上最强，但你需要在一个独特的组合维度上足够好。同时，Inkling的发布将加速一个趋势：企业客户在模型选择上有了更多「美国开源」选项，这意味着他们对Anthropic/OpenAI的依赖可能比预期更快地降低。

2. 企业AI的「可靠性鸿沟」正在成为比「能力鸿沟」更紧迫的问题——但大多数AI产品团队还在关注后者。 今天三项数据从三个不同角度指向同一个结论：① VentureBeat Pulse Survey：71%的「Agent」只是聊天机器人包装器；② Amazon AGI总监：85%试点，5%生产；③ 50%的企业经历了「内部评估通过但客户面前失败」的Agent。这三个数据合起来描绘了一个清晰的图景：AI模型的「能力天花板」已经不是企业部署的主要瓶颈——「可靠性天花板」才是。 但大多数AI产品团队仍然在关注「模型能力」——更好的代码生成、更准的问答、更强的推理——而忽略了「模型可靠性」：在变化的环境下是否稳定、在异常输入下是否鲁棒、在失败时是否可恢复。对于AI创业公司来说，这可能是2026年下半年最大的产品机遇：不是做一个「更强的AI」，而是做一个「更可靠的AI」——Agent评估框架、生产环境Agent监控、Agent失败恢复机制，这些都是确定性的产品方向。如果VentureBeat的数据是对的（85%的Agent在生产门口失败），那「帮助Agent进入生产」就是AI行业最值钱的服务之一。

3. AI模型的资本密度还在加速上升——但企业端的吸收能力没有同步增长，这个错配正在创造结构性机会。 DeepSeek在一个月内从$500亿估值跃升到$740亿，Thinking Machines以$20亿种子轮构建了9750亿参数的模型——模型端的资本投入在加速。但企业端的吸收能力呢？71%的「Agent」是聊天机器人、85%的Agent试点没有进入生产。模型越来越强、越来越贵，但企业还不知道如何有效使用它们——这个「供给侧vs需求侧」的错配，正在创造三类创业机会：① Agent评估和测试工具（帮企业判断一个Agent是否「足够可靠」）；② Agent部署和监控平台（帮企业把Agent从「试点」推进到「生产」）；③ AI FinOps工具（帮企业理解和管理不断上升的模型消耗成本）。昨天的1Password AI支出管理产品、今天的VentureBeat Pulse Survey的「27%企业没有Agent成本控制」数据，都在指向同一个方向：企业AI的下一个瓶颈不是「更好的模型」，而是「管理好已有模型的能力」。

---

*统计信息：收录 4 个产品/动态 | 融资总额 $74亿（DeepSeek $74亿新一轮） | 覆盖赛道：开源多模态模型、企业AI Agent编排、Agent可靠性评估、AI主权架构、中国AI资本市场*

*封面图生成失败（API配额不足），请手动生成或使用 toolkit/image_gen.py 生成*

6 days ago

0715日报 | 监管新纪元与生态延伸

## 今日洞察今天的五个字：「**AI的「成人礼」到了。**」 **7月15日是AI行业一个被标注了红圈的日子。不是因为某个产品的发布，而是因为三件事在同一时刻交汇，各自从不同维度证明：AI正在经历一场从「技术实验」到「制度嵌入」的根本性转变。** **最重磅的事件发生在北京——中国的《人工智能伴侣服务管理办法》（AI Companion Law）于今日正式生效。** 字节跳动的豆包（Doubao）和阿里巴巴的通义千问（Qwen）从今天起关闭个性化AI Agent功能。这不是一个「渐进的合规调整」，而是一个直接关闭服务的断崖式执行。**中国3.45亿豆包用户今天早上打开App发现，他们自定义的AI伴侣已经不见了**——超过800万个用户创建的个性化AI角色被删除。这不仅是全球首个专门针对AI伴侣的监管法规落地，更是一个「AI产品边界」的全球性问号：**当AI与人类建立情感连接时，应该受到怎样的约束？** **但今天不只有「禁止」——也有「延伸」。** Canva宣布将Code 2.0向所有2.65亿月活用户开放（含免费用户），让每个人都可以用自然语言构建交互式网站和应用。1Password推出AI消耗与支出管理产品，从密码管理器延伸为AI FinOps平台。**两个产品的共同主题是：「AI的能力正在从工具层向平台层延伸」——Canva把「vibe coding」从专业工具变成了全民能力，1Password把AI治理从「谁在用什么模型」的管理问题变成了「花了多少钱」的财务问题。** **而新加坡的PixVerse以$4.39亿C轮融资（估值超$20亿）证明了一个新趋势：AI视频生成正在向「实时交互世界」转型——从生成视频到构建游戏引擎。** 这可能是今天最有想象力的信号：AI不光可以「看」和「写」，还可以「玩」和「互动」。 **结论：这一天的关键词是「结构化」。** 中国的AI伴侣法让AI行业第一次面对「产品形态被法规直接定义」的现实。Canva Code 2.0和1Password的AI支出管理则展示了一个「跨界延伸」的机会——当AI从一个单独功能变成平台能力，原来做设计工具的公司可以成为编程平台，原来做密码管理的公司可以成为AI FinOps。**对于AI创业者来说，2026年下半年最需要回答的问题是：你的产品在「禁止」和「延伸」之间，站在哪一边？——你是在监管的灰色地带找机会，还是在能力延伸的蓝海里建围墙？** --- ## 1. [中国AI伴侣法正式生效——豆包与通义千问关闭个性化AI Agent](https://www.scmp.com/tech/big-tech/article/3359482/bytedance-and-alibaba-disable-humanlike-ai-custom-agents-new-rules-loom)（行业洞察 / 全球首个AI伴侣专门法规） ![China AI Companion Law](https://raw.githubusercontent.com/Selei1983/ai-daily-news/main/daily/images/0715-china-ai-law.png) 🔗 链接：[SCMP](https://www.scmp.com/tech/big-tech/article/3359482/bytedance-and-alibaba-disable-humanlike-ai-custom-agents-new-rules-loom) | [Bloomberg](https://www.bloomberg.com/news/articles/2026-07-06/bytedance-alibaba-pull-ai-companions-as-beijing-tightens-rules) | [TechTimes](https://www.techtimes.com/articles/319703/20260704/china-ai-companion-law-arrives-july-15-doubao-qwen-agent-data-will-deleted.htm) | [The Next Web](https://thenextweb.com/news/china-humanlike-ai-agent-rules) **动态**：**今天（7月15日），中国的《人工智能伴侣服务管理办法》正式生效。** 字节跳动向其3.45亿豆包用户发送通知：个性化AI Agent功能即日起关闭，用户创建的自定义AI角色（超过800万个）将被删除。阿里巴巴的通义千问同步执行类似调整。用户需在7月15日前导出聊天记录，逾期数据将被删除。该法规由中国国家互联网信息办公室（CAC）发布，被业内称为「全球首个针对AI伴侣的专门立法」。 **做什么的**：AI伴侣服务——那些能与用户建立长期情感关系的AI聊天机器人（类似Character.ai、Replika的模式）——在中国被纳入专门监管框架。法规的核心要求：禁止为未成年人提供AI伴侣服务；禁止AI伴侣进行「诱导性情感互动」；服务提供商必须对AI对话进行内容审核；建立未成年人防沉迷机制。ByteDance和Alibaba选择了「一刀切」式的合规——直接关闭功能而非调整功能，因为「部分合规」的风险高于「完全下线」。 **为什么值得关注**： - **全球AI监管的「中国实验」今天正式开始。** 这不是一部「框架性法律」——它是针对一个具体AI产品类别的**执行性行政规章**。**这意味着：中国监管机构认为AI伴侣不是一个技术功能，而是一个应该被单独监管的「产品类别」。** 这个思路与欧盟的AI Act将AI系统按风险等级分类类似，但在执行层面更加激进——不是「设定安全标准让产品合规运行」，而是「直接关闭不符合法规的产品形态」。**对于全球AI创业者，这是一个范式级的信号：监管机构正在学习如何精准打击特定产品形态，而不仅仅是设定通用安全标准。** 如果你的AI产品涉及情感陪伴、虚拟角色、儿童互动——现在就应该开始看中国的法规文本，因为其他国家的监管机构也会参考。 - **3.45亿用户的产品功能被直接关闭——这是一个「监管价值」vs「用户价值」的终极测试。** 豆包是中国最受欢迎的AI聊天应用，3.45亿月活用户。**当监管要求关闭一个用户使用的功能时，用户怎么反应？** 这将是AI行业第一次大规模观察「用户对AI监管的态度」——如果用户反弹强烈，它会影响其他国家的监管者；如果用户平静接受（或者转移到其他合规产品），它将为其他国家提供「AI情感关系立法是可行的」的证据。**对于聚焦AI伴侣赛道的创业者来说，中国市场的这个实验是你们必须跟踪的实时案例研究。** - **法规生效时机与OpenAI的家庭化战略形成镜像。** 上周OpenAI刚刚招聘家庭产品经理（准备将ChatGPT推向家庭场景），本周中国就禁止了AI伴侣服务中的情感互动。**一个是「AI进入家庭」，一个是「AI离开家庭」——两个世界对同一问题的不同回答。** 这清晰地展示了跨文化AI监管的分歧：中国选择「限制AI的情感连接」，美国选择（至少目前）「通过公司自我监管来管理AI的情感影响」。**对于全球化的AI创业者，这意味着你的产品可能需要「监管多版本」——在中国合规版本、在美国可信任版本、在欧盟安全版本。** - **数据删除条款是所有AI SaaS产品的「合规边界」警示。** 法规要求服务提供商在新规生效后删除用户的AI伴侣数据和聊天记录——除非用户主动导出。**这意味着AI伴侣服务不是「暂停」，而是「删除」——用户与AI建立的情感连接，不仅仅是沟通中断，而是记忆被删除。** 这对所有涉及用户长期数据的AI产品都是一个警示：你的用户数据管理策略需要为「监管导致的删除」做好准备。 - 对创业者的启发： **① 如果你在做AI伴侣/情感陪伴类产品，现在是时候研究中国的法规文本了——它不仅决定了中国市场的规则，也可能被其他国家借鉴；② 「AI伴侣」这个产品品类的合规成本正在急剧上升——创业公司需要评估「做AI伴侣」在2026年下半年的合规可行性；③ 中国3.45亿豆包用户「失去」AI伴侣后去哪里？——如果有一个合规的替代产品出现，将获得巨大的用户迁移红利；④ 这个事件说明：AI监管不再是「未来的问题」，而是「今天的问题」——每个AI创业者都应该在产品规划中纳入「监管情景分析」。** **类比参考**：**「AI行业的「未成年人保护法」时刻 / 从「无监管的野生长跑」到「划好跑道的标准赛」」** --- ## 2. [Canva Code 2.0向所有用户开放——AI网站构建进入「全民时代」](https://venturebeat.com/technology/canva-launches-code-2-0-offering-ai-website-building-to-every-user-including-free-accounts)（新产品 / Canva的「vibe coding」全面进攻） ![Canva Code 2.0](https://raw.githubusercontent.com/Selei1983/ai-daily-news/main/daily/images/canva-code.png) 🔗 链接：[VentureBeat](https://venturebeat.com/technology/canva-launches-code-2-0-offering-ai-website-building-to-every-user-including-free-accounts) | [Canva官方](https://www.canva.com/newsroom/news/Canva-Code/) | [9to5Mac](https://9to5mac.com/2026/07/14/canva-code-2-0-adds-visual-editing-html-imports-and-real-time-collaboration/) **动态**：7月14日，Canva正式发布 **Code 2.0**——AI驱动的网站和应用构建工具的全面升级。**核心变化：Code 2.0向所有2.65亿月活用户开放，包括免费用户。** 新增功能包括：拖拽式可视化编辑、HTML代码导入、生成速度提升75%、超过50个全新交互模板、以及将编码项目直接嵌入到设计项目中的能力。CEO Danny Wu在VentureBeat采访中明确表示：「我们瞄准的是非技术用户——Canva Code不是给开发者用的工具。」 **做什么的**：Canva Code 2.0是一个「一句话生成交互式网站」的工具。用户用自然语言描述需求（如「创建一个活动注册页面，包含时间和地点」），AI即时生成完整的交互式网站，然后用户可以直接在Canva熟悉的拖拽界面上修改文字、替换图片、调整颜色——不需要接触任何代码。竞争对手包括Lovable（年化ARR约$4亿）、Replit（估值$90亿）和Bolt.new。 **为什么值得关注**： - **Canva的入场方式很聪明——不是「更好的代码生成器」，而是「更低的使用门槛」。** 所有竞品（Lovable、Replit、Bolt）的核心卖点是「更智能的代码生成」——更快、更准确的AI编码。但Canva的差异化策略是「生成的输出更好看、更容易编辑」。**Danny Wu在采访中说得非常直白：「大多数vibe coding工具到「功能可用」就停了——但输出看起来千篇一律。」** Canva的核心竞争力在于它的2.65亿用户已经熟悉其编辑界面、拥有1.2亿+的设计模板和素材库。**对于AI创业者，这是一个关于「存量资产的AI化再利用」的案例——你的已有用户基础、设计资产和品牌认知，是你在AI时代转型的最强护城河。** - **将「vibe coding」从$4.7亿市场扩展到全民能力的规模效应。** Canva将Code 2.0免费开放给所有用户，意味着一个2.65亿用户的「AI编程能力」瞬间被激活。**Lovable年化ARR达到$4亿用了两年，Replit达到$10亿估值用了一年半——但Canva有2.65亿「已经活跃在平台上」的用户。** 这不仅仅是「用户基数优势」——Canva拥有的是**已经在平台上创作的用户**，他们已经习惯了用Canva制作PPT、海报、社交图片，现在他们可以「自然地」开始制作网站。**对于AI创业者来说，「上下文扩展」（从你已有的使用场景扩展到AI能力的场景）可能比「从零获取用户」更高效。** - **Canva vs. Microsoft/Google的「创作平台战争」。** Canva的「设计→编码」延伸，和Microsoft的「Copilot→Agent」延伸、Google的「Workspace→Gemini」延伸是同一场竞争。**每一家都在把自己的「用户入口」变成一个「AI能力平台」**——Canva在设计入口上加编码能力，Microsoft在办公入口上加AI Agent能力，Google在搜索入口上加生成式AI能力。**对于AI创业者，这提出了一个尖锐的定位问题：你的产品是「独立能力」（可以被嵌入任何平台），还是「平台能力」（吸引用户进入特定生态）？** - **生成速度提升75%和编辑体验是可量化的产品壁垒。** 大多数vibe coding产品的问题是「第一次生成很快，但修改很慢」——用户需要重新输入prompt来微调。Canva Code 2.0的拖拽编辑模式解决了这个痛点：你可以在生成的网站上直接拖放图片、修改文字、调整颜色。**这个「生成后的编辑体验」可能是比「生成速度」更重要的壁垒——因为用户实际的工作流是「生成→微调→发布→再微调」，而不仅仅是「一次生成就发布」。** - 对创业者的启发： **① Canva Code 2.0证明了一个趋势：AI能力正在从「专业级」向「全民级」扩散——如果你的产品目前只服务技术用户，是时候考虑「非技术用户的一键版本」了；② 「编辑体验」可能比「生成能力」更重要——用户的真实工作流是迭代式的，不是一次性的；③ Canva的策略验证了一个增长飞轮：2.65亿存量用户 + 新AI能力 = 瞬间激活的规模化；④ 如果你在vibe coding赛道竞争，Canva的入场意味着市场从「蓝海」变成了「红海」——差异化必须从「更好的编码」转向「更好的完整体验」。** **类比参考**：**「编程的「Canva化」/ 从「word processor」（打字机）到「page maker」（排版大师）再到「site maker」（建站工具）的范式迁移」** --- ## 3. [1Password推出AI支出管理——从密码管理器到AI FinOps](https://venturebeat.com/security/1password-moves-into-ai-cost-management-betting-that-token-spend-is-the-next-enterprise-budget-crisis)（新产品 / AI消费治理的新品类） ![1Password AI Cost Management](https://raw.githubusercontent.com/Selei1983/ai-daily-news/main/daily/images/1password-ai-cost.png) 🔗 链接：[VentureBeat](https://venturebeat.com/security/1password-moves-into-ai-cost-management-betting-that-token-spend-is-the-next-enterprise-budget-crisis) | [1Password官方](https://1password.com/) **动态**：7月14日，1Password发布了名为 **AI Spend and Consumption Management** 的新产品——面向IT和财务团队的统一仪表盘，实时追踪企业各部门在Anthropic、Cursor、OpenAI等AI服务商的token级消耗和支出。现为公开预览版，秋季正式上量。**现有1Password SaaS Manager客户可直接激活使用，无需额外付费。** 1Password CFO Greg Henry在接受VentureBeat专访时说：「AI的消耗式定价与传统的按座位年度定价完全不同——开发者消耗token的速度，传统的预算管理流程根本跟不上。」 **做什么的**：1Password AI支出管理连接AI供应商API，自动拉取每日token消耗数据，将其标准化到统一仪表盘中，并允许组织按供应商设定消费上限、通过Slack/邮件设置阈值告警、按团队/用户/供应商/模型维度分析支出。核心洞察：AI token消耗的增长速度与2010年代云计算消耗式定价的爆发如出一辙——当时催生了CloudHealth、Spot.io、Apptio等数十亿美元的FinOps公司，现在AI FinOps正在经历同样的爆发前夜。 **为什么值得关注**： - **1Password的「跨界延伸」是一个教科书级别的「存量客户×新需求」策略。** 1Password起家于密码管理器，三年前开始向身份安全和SaaS治理平台转型。**现在它进入AI支出管理——这不是一次「从零开始的创业」，而是「向现有企业客户（已信赖1Password的安全管理）销售AI管理工具」。** 对于AI创业者来说，1Password的策略有三个值得学习的点：① 利用已有客户信任（安全→财务的信任延伸）；② 利用已有平台集成（SaaS Manager客户的零摩擦激活）；③ 切入一个「没有领导者」的新品类（AI FinOps尚无明确的品类巨头）。 **「跨界延伸」不是「多元化」——它必须建立在已有核心能力（SaaS治理、API集成、企业级安全）之上。** - **AI FinOps正在成为一个确定性的SaaS品类。** 高盛预测AI Agent的token消耗将在2030年前增长24倍。**当一家$65亿估值的公司（1Password在2022年融资$1亿时估值约$65亿）决定将AI支出管理作为核心产品线时，这不再是一个实验——它是一个被验证的商业逻辑。** AI FinOps的参照系是云计算FinOps（2010年代）：CloudHealth被VMware以$5亿收购、Apptio以$39亿被收购、Spot.io被NetApp以$4.5亿收购。**AI FinOps市场的规模可能比云FinOps更大——因为AI token的消耗模式比云资源更复杂、更细粒度、更难预测。** - **「供应商限定额度」是这个产品最有趣的功能。** 大多数AI支出管理工具只提供「可视化」——告诉你花了多少钱。1Password的AI支出管理则允许设置「按供应商的消费上限」——超过上限的系统行为是什么？（告警、自动降级模型、还是直接切断API？）**这个「执行层」的功能是1Password相对于纯数据可视化工具的核心差异化——它不是只做「看板」，而是做「管理面板」。** 对于做企业AI治理产品的创业者来说，「从看到管」是产品从「好用的工具」到「必须的工具」的关键一步。 - **CFO的发言揭示了企业AI采购的结构性盲区。** Henry指出：「开发者正在以传统预算无法规划的方式消耗token——IT和财务团队被要求预测和证明AI投资的合理性，但没有清晰的数据支撑。」**这指向了一个更根本的问题：AI的采购模式仍然是「开发者自助式」的，而非「企业治理式」的。** 开发者用公司信用卡注册OpenAI/Cursor账号，月底财务看到一张大额账单才意识到发生了什么。**这个「影子AI」（Shadow AI）问题正在取代2010年代的「影子IT」成为企业IT治理的新挑战。** - 对创业者的启发： **① AI FinOps（AI财务运营）是2026年下半年最确定的SaaS创业方向之一——如果你在考虑B2B AI的切入点，监控、管理、优化AI支出是一个比构建AI Agent本身更不拥挤的赛道（参照云FinOps的历史）；② 「从看到管」的产品演进路径值得学习——先帮客户「知道花了多少钱」，再帮他们「控制花多少钱」；③ 1Password的「供应商连接」模式是AI FinOps的标准架构——每个供应商提供API，通过标准化层统一展示；④ 影子AI（Shadow AI）问题可能催生另一个产品品类：AI支出合规——不仅仅是花了多少钱，而是「谁在什么时候授权了什么AI支出」。** **类比参考**：**「AI的「云计算FinOps」时刻 / 从密码管家到AI账房先生的自然进化」** --- ## 4. [PixVerse $4.39亿C轮融资——AI视频生成向「实时交互世界」转型](https://techcrunch.com/2026/07/13/video-generation-startup-pixverse-raises-439m-valuation-soars-past-2b/)（融资 / AI视频生成到游戏引擎的跃迁） ![PixVerse](https://raw.githubusercontent.com/Selei1983/ai-daily-news/main/daily/images/0715-pixverse.png) 🔗 链接：[TechCrunch](https://techcrunch.com/2026/07/13/video-generation-startup-pixverse-raises-439m-valuation-soars-past-2b/) | [TechNode](https://technode.global/2026/07/14/ai-video-generation-platform-pixverse-raises-439m-series-c-to-build-real-time-interactive-worlds-game-engine/) | [AI Weekly](https://aiweekly.co/alerts/pixverse-closes-439m-series-c-extension-at-2b-valuation) **融资信息**：**$4.39亿 Series C扩展轮**，估值超过 **$20亿**。新增投资者包括阿里巴巴、Lollapalooza Capital、Ivy Capital、Grand Mount Capital、Eastern Bell Capital、Mirae Asset、BlueFocus、CloudAlpha。融资用途：从AI视频生成扩展到**实时交互世界构建和游戏引擎**。公司披露已有1.5亿注册用户、1500万月活用户。 **做什么的**：PixVerse是一家总部位于新加坡的AI视频生成平台，2023年成立。核心产品可将文字和图片转换为视频。**但本轮融资的关键信息是：PixVerse正在从「AI视频生成」向「实时交互世界引擎」转型——用户可以用自然语言创建可以实时交互的3D世界，而不仅仅是生成预渲染的视频片段。** 这实质上是一个「AI原生游戏引擎」的野心——用AI取代Unity/Unreal的手工资产创建和场景构建流程。 **为什么值得关注**： - **「从视频到世界」的跃迁是一个AI产品演化的重要观察案例。** 过去两年，AI视频生成赛道（Sora、Runway、Pika、Kling、PixVerse）的核心逻辑是「生成更好的视频」——更长的时长、更高的分辨率、更准确的物理模拟。但PixVerse的C轮融资表明了这个赛道的一个关键转向：**「视频是中间形态，交互式世界才是终极形态。」** 核心逻辑是：如果你能生成一个视频（动态画面），你离生成一个「可交互的动态世界」（游戏/虚拟空间）并不远。**对于AI创业者来说，这是一个重要的「品类升级」思考：你的产品在当前赛道的「终极形态」是什么——是从「生成内容」进化到「生成体验」吗？** - **$4.39亿在AI视频赛道是多大的赌注？** 根据公开数据，Runway的C轮融资约$1亿（2023年）、Pika的B轮约$8000万（2024年）、Kling的母公司估值未公开。**PixVerse的$4.39亿C轮是AI视频赛道单笔最大的融资之一——而且是在「视频生成」向「游戏引擎」转型的语境下。** 阿里巴巴作为领投方之一，说明阿里的AI投资战略正在从「模型层」（通义千问）向「应用层」（PixVerse）延伸。**对于创业者，这个规模的融资意味着：投资人认为「AI生成交互式世界」的市场比「AI生成视频」的市场大10倍。** - **「AI游戏引擎」的赛道正在形成。** 如果PixVerse成功实现「用自然语言创建交互式3D世界」的愿景，它将直接与Unity和Unreal竞争——但不是在同一维度竞争。Unity和Unreal是「专业工具」，需要编程和3D建模技能；PixVerse是「自然语言界面」，用户只需要描述「我想要一个什么样的世界」。**这是一个「AI原生游戏引擎」品类：不是让开发者更高效地做游戏，而是让非开发者也能做游戏。** 中国另一家公司（昆仑万维的Skywork Game Gen）也在类似方向探索——这个赛道将在2026年底前快速升温。 - **1.5亿注册用户、1500万MAU——不是Sora的「演示奇迹」，而是真实用户增长。** 相比OpenAI的Sora（至今未公开产品化的用户数据），PixVerse用事实证明了AI视频生成存在真实的产品市场契合（PMF）。**1500万月活用户在一个成立不到3年的AI视频平台上——这个数据比大多数AI应用的早期用户增长快得多。** 部分原因可能来自东南亚和中国市场的低使用门槛和社交分享效应。 - 对创业者的启发： **① 「从生成到交互」是AI内容产品的一个重要演进方向——如果你在做AI内容生成（视频、图像、3D），考虑如何让输出「可交互」而不是「只可观看」；② 阿里巴巴领投PixVerse说明：中国的云计算和AI巨头正在通过投资不直接竞争的应用层公司来获取「AI生态位」——这可能是初创公司的一个理想的资本策略（战略投资但不控制）；③ PixVerse的估值在$20亿+，但它的竞争对手（Runway、Pika）估值也在攀升——整个AI视频赛道的估值水位正在系统性上升；④ 「AI游戏引擎」的创业窗口可能只有12个月——在这个赛道需要快速推出产品并获取用户，因为大公司（Google DeepMind、腾讯、网易）也在密切关注这个方向。** **类比参考**：**「AI视频的「Roblox化」/ 从「导演」（生成视频）到「造物主」（创世界）的跃迁」** --- ## 5. [VB Transform 2026闭幕——企业AI的「信任修复」大会交出答卷](https://venturebeat.com/vbtransform2026)（行业洞察 / 企业AI Agent治理的行业共识日） 🔗 链接：[VB Transform Agenda](https://venturebeat.com/vbtransform2026) | [VentureBeat: Enterprise AI evaluation gap](https://venturebeat.com/orchestration/enterprise-ai-is-entering-an-evaluation-gap-agents-are-gaining-autonomy-faster-than-companies-can-verify-them-2/) **动态**：7月14-15日，VentureBeat旗舰企业AI会议 **VB Transform 2026** 在Menlo Park完成两天议程。今天是闭幕日，亮点议程包括：**Intuit AI VP Nhung Ho** 分享「一个界面、四种模式——Intuit的混合编排架构」、**Visa技术总裁Rajat Taneja** 分享「Project Glasswing——AI Agent安全框架」。同期发布的VentureBeat Research报告揭示：一半的企业已经部署了一个「通过内部评估但在客户面前失败」的AI Agent——**而大多数企业正在给Agent更多自主权，而不是更少。** **做什么的**：VB Transform 2026是继昨天（0714日报已报道Day 1）的闭幕日。600+企业AI决策者参加的两天会议聚焦一个核心议题：**Agent自治与控制的平衡**。今天的Intuit演讲展示了混合编排架构的实践细节——将Agent的四种工作模式（全自动化、人工审批、半自主、纯人工）融合到同一个系统中。Visa的Project Glasswing则揭示了支付级AI安全的架构设计原则。 **为什么值得关注**： - **Intuit的「混合编排」架构可能是2026年企业AI的参考架构。** Nhung Ho在今天的演讲中分享的核心洞察：**「企业AI Agent不应该是「全自动」或「全人工」的二选一——同一个Agent应该能在不同任务场景中自动切换工作模式。」** Intuit的做法是：建立一个「编排层」，根据任务的风险等级、数据敏感性、用户意图自动决定Agent是「自主执行」、「需要人工确认」、「半自主推荐」还是「标记给人类处理」。**这个架构思路对所有企业AI产品都有直接参考价值——它不是「Agent能力」的问题，而是「Agent的工作模式编排」的问题。** - **Visa的Project Glasswing——当AI Agent安全由支付网络巨头来定义。** Rajat Taneja的技术总裁级演讲分享了Visa如何将「欺诈检测」和「交易安全」方面的数十年经验映射到AI Agent安全框架中。核心原则：**AI Agent的每一次「行动」都应该像一笔交易一样可审计、可追溯、可撤销。** 这个思路对企业AI Agent产品设计有深远的启示——你的Agent的「思考-行动-反馈」循环，需要「在每一环都有日志」而不是「只在最终结果有日志」。 - **VentureBeat Research的最新发现：「Agent评估鸿沟」正在扩大。** 报告显示：50%的企业已经经历了「Agent在内部测试通过但在客户面前失败」的情况。更令人担忧的是：**大多数企业知道评估不准，但仍然在给Agent更多自主权。** 这个「明知评估不完善却仍在加速部署」的模式，和上周（0714日报）86%企业GPU利用率不足+54%遇到过Agent安全事件的数据完全一致——企业正处于「先跑起来再修安全」的模式。**对于AI治理工具创业公司，这个「评估鸿沟」就是你的产品机会。** - 对创业者的启发： **① Intuit的「混合编排」架构是2026年企业AI Agent产品的设计参考——你的Agent产品是否支持「按任务切换工作模式」？② Visa的「可审计Agent行动」原则应该成为所有AI Agent产品的安全基线——不是「安全功能」，而是「基础设施」；③ 「评估鸿沟」数据再次确认：AI Agent评估和监控工具是2026年下半年最确定的企业采购需求之一；④ VB Transform 2026的两天议程构成了一个完整的企业AI产品路线图参考——从编排、安全、评估到基础设施，每一个维度都有对应的产品机会。** **类比参考**：**「企业AI的「信任修复」大会圆满闭幕 / 从「谁做得最好」到「谁最值得信任」的行业标准运动」** --- ## 6. [FTC发布AI准确性声明 + 伊利诺伊州签署全美最强AI安全法](https://www.ftc.gov/news-events/news/press-releases/2026/07/ftc-seeks-public-comment-policy-statement-addressing-ai-accuracy)（行业洞察 / 美国AI监管的双线并进） ![FTC AI Policy](https://raw.githubusercontent.com/Selei1983/ai-daily-news/main/daily/images/0715-ftc-ai.png) 🔗 链接：[FTC](https://www.ftc.gov/news-events/news/press-releases/2026/07/ftc-seeks-public-comment-policy-statement-addressing-ai-accuracy) | [Crowell & Moring](https://www.crowell.com/en/insights/client-alerts/illinois-imposes-transparency-and-safety-obligations-on-frontier-ai-systems) | [NBC Chicago](https://www.nbcchicago.com/news/local/illinois-new-ai-safety-law-is-the-nations-strongest-advocate-says/3958692/) **动态**：本周两件美国AI监管重要事件：① **FTC于7月7日发布「AI系统准确性政策声明」**，将AI系统的「不准确」视为潜在的欺骗性行为——如果AI系统标榜准确但实际输出错误，可能违反FTC法律。该政策在7月31日前开放公众评议。② **伊利诺伊州长JB Pritzker于7月6日签署SB 315《AI安全措施法案》**——全美首个要求大型AI开发者进行**第三方安全审计**的州级法律，2027年1月正式生效。伊利诺伊也因此成为继纽约、加州之后第三个拥有AI透明度法的州，但在独立审计方面要求最严格。 **做什么的**：FTC的政策声明适用于所有AI系统，核心主张：如果AI公司声称其系统是「准确」的，但实际上系统明知或应该知道有系统性不准确，则可能构成欺骗。伊利诺伊州SB 315则专门针对「前沿AI系统」（定义为训练计算能力超过$1亿的模型），要求：定期第三方安全审计、向州政府提交安全报告、公开透明度框架、对高风险应用进行影响评估。 **为什么值得关注**： - **FTC正在用「消费者保护」框架来管理AI——这是所有AI产品的「合规基线」信号。** FTC不是在创造新的AI法律，而是将已有的联邦消费者保护法（禁止欺骗性行为）应用到AI领域。**核心逻辑：如果你说「我们的AI是准确的」，但实际不准确——那就是欺骗。** 这个逻辑看似简单，但它对AI产品的营销和承诺方式有深远影响——尤其是那些将AI作为「辅助工具」但实际在自动化决策的产品。**对于AI创业者来说，FTC的声明意味着：你的产品页面上的每一次「准确率99%」的声称，都需要有真实的测试数据支撑。** - **伊利诺伊州SB 315——「第三方审计」将可能成为AI行业的ISO认证。** 如果你是做大型AI模型的公司（训练成本超过$1亿——基本上所有主流模型），你需要接受第三方安全审计。**这对AI创业者的合规成本是一个明确的信号：如果你的产品使用大型AI模型（GPT-5.6、Claude Opus 4.8、Gemini 3.5 Pro等），你可能很快需要提供「第三方安全审计报告」来通过客户的合规审查。** 就像SOC 2是SaaS公司的基础认证一样，「AI安全审计」可能很快成为AI公司的入场券。 - **中国AI伴侣法（今天生效）+ FTC AI准确性声明 + 伊利诺伊安全法——三个事件构成了一个完整的「全球AI监管光谱」。** 中国：直接禁止特定AI产品形态。FTC：用消费者保护法约束AI行为。伊利诺伊：为大型AI模型设定安全审计要求。**三种不同的监管哲学：禁止型、行为约束型、审计合规型。** 对于全球化的AI创业者来说，这三种模式都不是「选择题」——如果你做全球市场，你需要在所有三个维度上合规。**这个「三线合规」的现实意味着：AI创业公司的法务合规成本将从「可忽略」上升到「一个重要预算项目」——2026年下半年需要纳入财务规划。** - 对创业者的启发： **① FTC的AI准确性声明对所有AI产品的营销合规都是一个直接约束——不要做无法验证的准确性声称；② 伊利诺伊州的第三方审计要求将产生一个「AI安全审计」的配套产业——如果你在AI治理领域创业，这是一个明确的新服务品类；③ 「三线合规」意味着全球化AI产品的合规成本将大幅上升——要么接受，要么选择单一市场；④ 保持关注7月31日前FTC政策声明的公众评议——你的反馈可能会影响最终政策的措辞和适用范围。** **类比参考**：**「全球AI监管的「三岔路口」/ 从「无政府状态」到「三种文明选择的共存」」** --- ## 值得重点跟踪的 3 个信号 1. **「禁止型监管」的先例已经创造——AI伴侣只是第一个被瞄准的产品类别。** 中国AI伴侣法今天正式生效，3.45亿豆包用户的AI角色功能被关闭。**这不仅仅是中国的故事——它是全球监管机构学习如何「精准关闭特定AI产品类别」的第一个教材。** 下一步可能是：数字人直播、AI心理顾问、AI面试官……**问题是：中国CAC选择了AI伴侣作为第一个靶子，下一个被「产品类别化监管」的是什么？** 对于AI创业者来说，你需要问自己三个问题：① 我的产品形态在中国是否可能被归类为「需要单独监管的类别」？② 如果我的核心功能明天被法规禁止，我的用户去哪里？③ 我是否应该在合规框架内设计产品架构，而不是在灰色地带运营？**这个信号告诉我们：AI创业的产品策略不再只是「市场需求×技术能力」的乘积——现在是「市场需求×技术能力×监管可接受度」的三元方程。** 2. **AI正在从「独立工具」变成「平台能力延伸」——跨界者正在重塑竞争格局。** 今天两个最重要的产品故事（Canva Code 2.0和1Password AI支出管理）都不是来自「AI原生创业公司」——它们来自已有的设计平台和密码管理公司。**这些「跨界者」的共同策略是：利用存量用户基础和品牌信任，在已有产品中「叠加」AI能力，而不是创建一个新品牌。** Canva有2.65亿用户、1Password有数十万企业客户——它们的AI功能不是「获客工具」，而是「客户留存和扩展工具」。**这对AI原生创业公司意味着：① 你的竞争对手可能不是另一家AI公司，而是某个意想不到的大型平台（Adobe、Atlassian、Shopify、Salesforce）推出的AI功能；② 在平台公司的「AI功能」面前，独立AI产品必须有「深度」（垂直领域专业化）来对冲平台的「广度」（通用功能）；③ 也许最佳策略不是做独立AI产品，而是成为某个大型平台的「AI能力补充者」。** 3. **「AI FinOps」正在成为2026年下半年最确定的B2B SaaS品类。** 1Password推出AI支出管理产品不是孤立的——Goldman Sachs预测AI Agent token消耗将在2030年前增长24倍、VC正在大量投资AI成本监控和优化工具、每个CIO和CFO都在问同一个问题：「我们的AI支出合理吗？」**这个品类的确定性来自三个结构性驱动因素：① AI供应商从按座位定价转向消耗式定价（按token），传统预算管理方式失效；② 开发者驱动的「影子AI」正在取代IT驱动的「影子IT」，财务团队完全失去可见性；③ AI模型的成本结构极其复杂（输入/输出、模型等级、缓存命中率等），需要专门的工具而非通用报表。** 对于正在寻找B2B创业方向的创业者：AI FinOps是2026年最像「2013年的云FinOps」的市场——空间大、竞争少、买家付费意愿强。**如果你现在入场，你有6-12个月的时间窗口成为这个品类的定义者。** --- *统计信息：收录 6 个产品/动态 | 融资总额 $4.39亿（PixVerse $4.39亿 C轮） | 覆盖赛道：AI监管合规、AI网站构建、AI成本管理、AI视频生成、企业AI Agent治理、AI安全审计*

7 days ago

0714日报 | 定价战与Agent信任危机

# 0714日报 | 定价战与Agent信任危机

今日洞察

今天的五个字：「当降价不再是好消息。」

经历了一个充满安全争议和法律风暴的周末，7月14日的AI行业迎来了一个更具结构性张力的周一。 这个周一的特殊性在于：三件事在同一个时间点交汇——DeepSeek将V4-Pro的75%折扣永久化、VB Transform 2026在Menlo Park正式开幕、以及 VentureBeat Research一份调查揭示86%企业的GPU利用率不到一半。这三件事看似独立，实则指向同一个核心问题：AI行业的「供给侧」和「需求侧」之间的鸿沟正在扩大。

DeepSeek的永久降价不是一个简单的价格战信号。 当V4-Pro以$0.435/$0.87每百万token的价格水平运行时，它把AI推理的定价基准从「与OpenAI竞争」拉到了「与云计算资源成本竞争」。VentureBeat的分析指出一个反直觉的现象：更便宜的模型并没有自动转化为更健康的企业利润率——因为企业的成本结构并不是由模型定价决定的，而是由「整合成本」和「治理成本」决定的。换句话说，模型变便宜了，但让模型在企业中「安全地工作」的成本没有变。

VB Transform 2026今天在Menlo Park开幕，议程本身就构成了一个「企业AI信任危机」的完整诊断书。 Amazon的Bryan Silverthorn讲「可信AI Agent框架」，Instacart的CTO讲「如何使用Agent消除重复劳动」，GM的VP讲「Agent化如何让PR合并量提升300%」，Intuit的AI VP讲「如何构建混合编排架构」。从这些议程可以看出，企业AI已经跨越了「要不要用Agent」的阶段，进入了「如何让Agent在失控边界内安全运行」的阶段。 VentureBeat同期发布的报告显示，57%的企业已经目睹AI Agent「自信地给出错误答案」——这个数字比任何技术参数都更能说明问题。

而也许最刺眼的信号来自VentureBeat Research的GPU利用率调查：86%的企业GPU利用率不到一半。 当华尔街还在争论AI基建投资是否过多时，企业用实际数据回答：瓶颈不是算力，而是「让算力被有效使用的能力」。

结论：这一天的关键词是「脱节」。DeepSeek的定价下降与企业的实际成本脱节、AI基建投资与利用率脱节、Agent的能力进步与企业的治理能力脱节。对于AI创业者来说，这意味着：在2026年下半年，最大的机会不是让模型更便宜或更强大，而是帮助企业在「买得起」和「用得好」之间架起桥梁。那些能解决「Agent治理」「Agent评估」「GPU利用率优化」等问题的创业公司，将在这轮结构性调整中获取最大的红利。

1. [DeepSeek永久性降低V4-Pro价格75%](https://venturebeat.com/orchestration/deepseek-cut-prices-75-the-100x-problem-remains)（融资/定价 / AI推理定价战进入新阶段）

DeepSeek

🔗 链接：VentureBeat深度分析 | InfoWorld | TrendingTopics

动态：7月12日，VentureBeat深度报道DeepSeek将其旗舰模型 V4-Pro 的75%临时折扣正式转为永久定价。价格从原价$1.74/$3.48降至 $0.435/百万输入 token、$0.87/百万输出 token——这一价格仅为GPT-5.5的1/6、Claude Opus 4.8的1/8。DeepSeek早前通过官方X账号（@deepseek）宣布了这一永久性调价，并明确表示「75%折扣不再是一篇营销文案，而是API政策」。

做什么的：DeepSeek V4-Pro是DeepSeek在华为昇腾芯片上训练的旗舰推理模型，支持100万token上下文窗口和思维链推理模式。基准测试上，V4-Pro在多个推理基准上与GPT-5.5和Claude Opus 4.8相当，但定价仅为它们的零头。VentureBeat的报道指出一个被忽略的关键：更便宜的模型没有自动转化为企业的健康利润率，因为企业的成本结构中「模型使用费」只占很小一部分——整合、治理、安全合规等成本才是真正的开支大头。

为什么值得关注：

- 「DeepSeek的定价策略」不是价格战，而是一场「价值锚定」的重新定义。 当DeepSeek把V4-Pro定价在$0.435/$0.87时，它实际上在说：「前沿模型的基础成本不应该超过$1/百万token。」 这个锚点如果被市场接受，将迫使所有模型提供商重新审视定价体系。对于AI创业者来说，这意味着「模型成本」作为产品经济模型中的一个变量，正在变得越来越不重要——你的产品或服务的价值，应该来自模型之上的「层」，而不是模型本身的选择。如果你还在以「使用GPT-5.6」作为产品卖点，你可能需要重新思考了。

- VentureBeat的分析揭示了一个反直觉的真相：更便宜的模型反而让企业的利润率「修复」变得更难。 原因在于：当模型成本下降，企业往往会部署更多Agent实例、处理更多数据、运行更长时间的任务——最终总体成本可能不降反升。这就像「Jevons悖论」在AI推理上的重现——当煤更便宜时，人们用了更多的煤；当模型更便宜时，企业用了更多的token。 对于AI创业公司的PM来说，这意味着你的定价策略不能简单跟随模型成本的下降——你需要基于「客户获得的商业价值」来定价，而不是「你使用了什么模型」。

- DeepSeek的永久降价时机非常微妙。 就在几周前，中国「AI伴侣法」（Interim AI Companion Law）将于7月15日生效，Doubao被迫为中国3.45亿用户关闭Agent功能。DeepSeek选择在法规生效前夕永久降价，可能是一个「合规威慑」之后的「市场份额收割」策略——当竞争对手（尤其是中国同行）因为合规问题减少服务时，DeepSeek用更低的价格吸引更多开发者。对于关注中国AI生态的创业者来说，这是一个值得学习的「监管红利」战术。

- 定价的「不对称性」正在改变竞争格局。 DeepSeek的训练和推理成本结构（基于华为昇腾芯片和中国的电力成本）与西方公司完全不同。这使得DeepSeek可以持续维持一个西方公司无法匹敌的定价水平。 对于AI创业者来说，这意味着「模型选择」的决策维度正在从单一的性能比较，扩展到地缘政治、合规风险和定价稳定性的综合考量。

对创业者的启发：① 如果你正在构建任何依赖模型API的产品，是时候与至少两个来自不同地区的模型提供商建立合作关系——DeepSeek的低价不可能永远持续，而地缘政治风险可能随时切断供应链；② 不要将你的产品价值锚定在「使用什么模型」上——当模型价格降到接近零时，你的护城河必须来自于数据飞轮、工作流集成、行业知识或用户体验；③ DeepSeek的「永久降价」策略本身值得学习——将促销转化为永久政策，创造了一个不可逆的竞争压力。

类比参考：「AI推理的「沃尔玛时刻」/ 模型的Jevons悖论——更便宜导致更多消费」

2. [VB Transform 2026今日开幕](https://venturebeat.com/vbtransform2026)（行业洞察 / 企业AI Agent的「信任修复大会」）

VB Transform 2026

🔗 链接：VB Transform Agenda | Amazon可信AI Agent框架 | Intuit AI基础设施重构

动态：7月14日，VentureBeat的旗舰企业AI会议 VB Transform 2026 在加州Menlo Park的Hotel Nia正式开幕。为期两天的会议聚焦一个核心问题：「如何在大规模环境中编排AI自治？」 首日重磅议程包括：Amazon AGI Autonomy总监Bryan Silverthorn展示「可信AI Agent的工程框架」、Instacart CTO Anirban Kundu分享「Agent如何消除工程师的繁重工作」、GM自动驾驶VP Rashed Haq讲解「Agent化如何让PR合并量提升300%」。第二天的亮点包括Intuit AI VP Nhung Ho的「混合编排架构」、Visa技术总裁Rajat Taneja的「Project Glasswing」安全框架。

做什么的：VB Transform 2026是2026年企业AI领域最重要的行业会议之一，600+企业AI决策者出席。会议不是讨论「最新模型有多强大」，而是聚焦于Agentic Orchestration（Agent编排）、Agentic Ops & Evals（Agent运维与评估）、Inference & AI Infrastructure（推理与基础设施）、Agentic Security（Agent安全）四大支柱。这标志着企业AI对话已经从「AI能力」转向「AI治理」。

为什么值得关注：

- 会议议程本身就是企业AI行业「信任危机」的风向标。 如果你看过会议议程，会发现一个有趣的现象：没有一个演讲是关于「如何让AI更强大」，几乎所有演讲都是关于「如何让AI更可靠、更可控、更可审计」。Amazon从「工程可信Agent」的角度切入、Intuit从「混合编排」的角度切入、Visa从「Agent安全框架」的角度切入——每家公司都在用自己的方式回答同一个问题：「如何在Agent自治和企业控制之间找到平衡？」对于AI创业者，这传递了一个明确信号：你的企业客户不再关心你的AI有多聪明，他们关心的是「当它犯错时，谁来负责？」

- GM的案例可能是最震撼的——Agent化让PR合并量提升300%。 这不是一个实验数据，而是GM在真实生产环境中验证的结果。当GM重新架构其软件系统以适应AI Agent工作流时，他们发现「让Agent工作」本身就需要重构工程流程——从代码仓库结构、CI/CD管道到代码审查策略。 这个案例对所有企业AI产品都有启示：不要期望Agent能无缝嵌入现有工作流——你需要同时重构「人」的工作方式和「机器」的工作方式。

- Amazon的「可信AI Agent框架」可能会成为一个行业标准参考。 作为全球最大的云服务提供商，Amazon在Agent可信度方面的工程实践对任何构建企业AI Agent的团队都有参考价值。Amazon的方法论核心是「解耦」——将Agent的「能力」（它能做什么）与「控制」（它被允许做什么）分离。 这个架构思路值得每一个做AI Agent产品的团队深入研究。

- Visa的「Project Glasswing+」——AI Agent安全框架由全球最大支付网络定义。 Visa处理着全球数万亿美元的交易，其对AI Agent安全的定义可能会成为金融AI的基准。当Visa技术总裁亲自出来讲AI Agent安全时，说明金融行业已经将AI Agent安全视为系统级别的风险——不是「如果出错怎么办」，而是「当出错时如何不造成系统性影响」。

对创业者的启发：① 如果你在做企业AI Agent产品，VB Transform的议程就是你的产品路线图参考——确保你的产品覆盖了「编排」「评估」「安全」和「基础设施」四个维度；② GM的案例证明，企业Agent化的前置条件是「工程流程的Agent友好性重构」——这可能是一个独立的SaaS品类；③ Amazon的框架思路（能力与控制解耦）可以作为你产品架构设计的起点；④ 关注VB Transform上发布的VentureBeat Research报告——这些数据是企业AI市场最权威的需求侧调研。

类比参考：「企业AI的「安全行驶大会」/ 从「AI能力军备竞赛」到「AI治理世界杯」」

3. [86%企业GPU利用率不到一半](https://venturebeat.com/orchestration/wall-street-is-debating-the-ai-buildout-enterprises-just-answered-86-say-their-gpus-run-at-half-capacity-or-less)（行业洞察 / AI基础设施的「供给过剩」信号）

VentureBeat News

🔗 链接：VentureBeat Research | Beri.net分析 | Welcome.ai

动态：7月10日，VentureBeat Research发布调查报告，对573位企业AI领导者进行深入研究。核心发现：86%的企业表示其GPU运行在「一半容量或以下」。更惊人的是，54%的企业已经遭遇了AI Agent安全事件，而只有44%的企业在严格追踪Agent的运行情况。这份报告在VB Transform 2026首日发布，其数据直接为会议议程提供了背景支撑。

做什么的：这不是一个产品，而是VentureBeat Research对企业AI部署现状的一次「健康检查」。报告发现了一个「双层脱节」的现象：第一层，企业对AI基础设施的巨大投资与实际使用之间存在鸿沟；第二层，企业在明知控制措施不完善的情况下，仍然大规模部署AI Agent。Peter Levine（a16z合伙人）和Dylan Patel（SemiAnalysis首席分析师）关于「AI泡沫」的争论在报告中被引用——但企业用数据给出了一个比他们预期的更微妙的答案。

为什么值得关注：

- 86%的GPU利用率不足——这是一个比「AI泡沫」更复杂的信号。 华尔街的争论一直在两个极端之间摇摆：一边说AI投资过热、泡沫即将破裂；另一边说AI基础设施投资还不够、无法支撑下一代模型。但企业的真实情况比这两个极端都复杂：不是「太多GPU」或「太少GPU」，而是「有GPU但不会用」。 问题是「利用率」，不是「供给量」。这对于AI创业者来说意味着一个明确的创业方向：帮助企业管理、调度和优化GPU利用率——这是一个比卖GPU更大的市场。 类似CoreWeave这样的GPU云提供商虽然在快速增长，但企业的内部GPU集群利用率问题同样值得解决。

- 54%的企业已经遭遇AI Agent安全事件——但69%没有严格追踪。 这是一个让人不安的数据组合。超过一半的企业已经因为Agent出了问题，但这并没有促使他们建立严格的管理体系。 VentureBeat将这种现象归因于「控制差距」——企业意识不足、工具不成熟、人才短缺三方面的问题叠加。对于创业者的启发：AI Agent的安全监控和审计工具市场正在爆发——你需要提供一个「开箱即用」的Agent行为监控平台，而不需要企业自己搭建。 这个品类的一个参照是Datadog之于微服务——Agent监控是下一个「必买」的基础设施层。

- 「明知控制措施不完善，仍然部署Agent」——这是VentureBeat报告的副标题，也是目前企业AI最真实的写照。 573位企业领导者的回答揭示了一个「先上船再补票」的行业心态：竞争压力迫使企业超越自身的治理能力部署AI Agent。这个「先部署再治理」的模式，在科技史上我们见过——云计算早期也是类似。但区别在于：Agent的错误可能是自我延续的、自动执行的，而云服务器配置错误通常不会「自主扩大损害范围」。

对创业者的启发：① GPU利用率优化是一个被严重低估的创业方向——不是做最大化利用率的软件，而是做「让GPU利用率可见、可调度、可管理的平台」；② Agent安全监控是2026年下半年最确定的企业SaaS需求之一——如果你已经在做AI产品，现在就应该加上Agent行为审计功能；③ 「控制差距」意味着你做产品时，应该默认假设企业客户处于「失控状态」——你的产品必须自带安全护栏，而不是假设客户在使用前已经做好了安全配置。

类比参考：「AI基建的「买书不读」现象 / 比算力短缺更严重的是「算力不会用」」

4. [ACRouter开源模型路由](https://venturebeat.com/orchestration/acrouter-picks-the-smartest-ai-model-per-task-beating-opus-only-setups-by-2-6x-on-cost)（新产品 / 用「选模型」代替「选最好的模型」）

🔗 链接：VentureBeat报道 | GitHub

动态：7月13日，VentureBeat报道了一个名为 ACRouter 的开源模型路由系统。ACRouter的核心思想极其简单但效果惊人：根据每个任务的特性自动选择最合适的模型，而不是对所有任务都用同一个「最强模型」。基准测试显示，ACRouter配置比单纯使用Claude Opus 4.8的方案成本降低了2.6倍，同时保持了输出质量。这一结果的启示是：「选模型」比「用最好的模型」更聪明。

做什么的：ACRouter是一个智能模型路由层，位于应用和后端LLM之间。它会分析每个输入请求的复杂度、主题和所需能力，然后将请求路由到最合适的模型——简单任务用便宜的小模型（如Haiku 4.5或GPT-5.6 Luna），复杂任务用最强的模型（如Opus 4.8或GPT-5.6 Sol）。这个思路类似于「CDN路由」——不是所有流量都需要从源站获取，缓存能解决的就不需要回源。

为什么值得关注：

- 模型路由正在成为一个独立的基础设施品类。 随着模型种类从「三五个」扩展到「三五十个」（OpenAI的GPT-5.6系列就有Luna/Terra/Sol三个层级、Anthropic有Opus/Sonnet/Haiku、Google有Gemini系列、DeepSeek/Mistral/Meta等还有大量开源模型），手动为每个任务选择模型已经不可能了。 模型路由正在从「一个可选的优化工具」变成「一个必备的基础设施层」。对于AI创业者的产品架构来说，2026年下半年应该把「模型路由」作为默认架构的一部分——而不是事后优化。 这不仅节省成本，还能提高系统的鲁棒性（某个模型不可用时自动切换到备选）。

- 「2.6倍成本优化」的数据背后，是一个更深刻的洞察：大部分任务根本不需要顶级模型。 ACRouter的分析显示，在企业AI的实际使用场景中，约70-80%的请求是相对简单的（提取、分类、简单问答），只需要小模型就能高质量完成。只有20-30%的请求真正需要顶级模型的推理能力。 但当前大多数企业为了「保险起见」对所有请求使用同样的大模型——这就造成了巨大浪费。对于AI创业者来说，一个有趣的问题：你的产品是否需要重新审视「每个功能点真正需要什么级别的模型能力」？

- ACRouter是开源的，但商业化的模型路由SaaS可能价值更大。 开源项目本身解决了技术可行性的验证，但企业客户需要的是「托管的、带SLA的、可监控的」模型路由服务——这正是OpenRouter、Together AI等平台正在做的。但ACRouter的价值在于它从「学术角度」证明了模型路由的效果，为商业化模型路由SaaS提供了坚实的数据支撑。

对创业者的启发：① 如果你正在构建一个调用多个模型的AI产品，现在就把模型路由集成到产品架构中——不要等成本失控了再优化；② ACRouter的「按任务复杂度动态选择模型」思路可以延伸到产品设计——不同用户、不同场景、不同订阅层级可以用不同的模型，这是一种「AI成本精细化运营」的能力；③ 模型路由作为SaaS品类正处于早期爆发阶段——如果你在寻找创业方向，这是一个值得认真考虑的机会。

类比参考：「AI模型的「CDN时刻」/ 从「用最强的」到「用正好够的」」

值得重点跟踪的 3 个信号

1. 「模型降价≠企业降本」——Jevons悖论正在AI推理领域重演。 DeepSeek的75%永久降价本应是企业AI的好消息，但VentureBeat的分析揭示了一个反直觉的现实：当模型变得更便宜，企业会用更多的token——最终总成本可能不降反升。更重要的是，企业的AI成本结构中「模型使用费」只占很小一部分——整合、治理、安全合规才是大头。这个信号意味着：AI创业公司不能简单用「我们模型更便宜」来获取客户——你需要帮助客户看到「总拥有成本」（包括集成、维护、监控、安全），而不仅仅是每个token的价格。如果你能提供一个「All-in-One」方案，把模型成本、监控成本、治理成本打包到一个预测性定价中，可能会有巨大的市场优势。

2. 「Agent治理」正在成为企业AI最大的「非技术」瓶颈。 VB Transform 2026的议程——从Amazon的可信框架到Visa的安全框架——清楚表明企业AI行业的核心焦虑已经从「如何让Agent更智能」转向了「如何让Agent不出错、不失控、不被滥用」。57%的企业已经目睹Agent自信地犯错，86%的GPU闲置，54%的企业经历过Agent安全事件——这些数据的共同指向是：企业已经部署了Agent，但没有准备好管理Agent。 这意味着「Agent治理」（包括行为监控、安全护栏、成本控制、效果评估）正在成为一个新的、可能比Agent本身更大的SaaS品类。如果你的创业方向在这个领域，建议尽快推出产品——这个窗口期可能只有6-12个月。

3. 「GPU利用率不足」正在为AI基础设施的「二级市场」创造机会。 86%的企业GPU利用率不到一半，这意味着市场上存在大量的「闲置算力」。这不是一个供应过剩的信号，而是一个「算力中间商」的市场信号。那些能聚合闲置GPU、动态调度工作负载、让企业以更低价格获取算力的商业模式，将在2026年下半年获得爆发式增长。同时，这也意味着AI推理的正确计量单位正在从「GPU数量」转向「有效利用的GPU小时」——如果你在构建AI基础设施产品，这个指标应该是你的核心KPI。 类似Aethir这样的去中心化GPU平台已经有了一定的市场验证，但针对企业内部GPU集群的效率优化产品仍然是蓝海。

*统计信息：收录 4 个产品/动态 | 本期以行业洞察为主，融资事件较少（周一数据） | 覆盖赛道：AI模型定价、企业AI治理、AI基础设施优化、模型路由*

1 weeks ago (07-14)

诗歌的“魔力”：为何能绕过安全机制？

这不仅仅是“诗意越狱”，更是AI安全的新警钟！

我们能做些什么？未来的AI安全之路

分享到：

相关推荐

热门文章

快讯

0719日报 | AI「规则制定战」和资本疲劳的周末信号

0719日报 | AI「规则制定战」和资本疲劳的周末信号

今日洞察

1. [白宫Gold Eagle：美国政府取得前沿AI模型分发控制权](https://thenextweb.com/news/white-house-dictating-frontier-ai-model-access-anthropic-openai)（行业洞察 / AI治理从「企业自治」到「政府审批」的转折）

2. [阿里巴巴T-Head在WAIC开源SAIL软件栈，正面挑战NVIDIA CUDA垄断](https://thenextweb.com/news/alibaba-t-head-sail-open-source-nvidia-cuda-alternative)（行业洞察 / 中国AI芯片生态的「去CUDA化」里程碑）

3. [TSMC营收创纪录但股价下跌4%——AI资本支出的「相信但需要验证」时刻](https://thenextweb.com/news/tsmc-record-revenue-stock-falls-ai-capex-fears)（行业洞察 / AI基础设施投资的「信心拐点」）

4. [ZTE NaviX Ultra首批3万台秒罄，AI智能手机的中国浪潮](https://thenextweb.com/news/china-agentic-ai-smartphones-zte-navix-doubao-waic)（新产品 / AI Agent from software concept to mass-market hardware）

5. [Capital One 开源 VulnHunter——Agentic AI 代码安全扫描工具](https://venturebeat.com/technology/capital-one-releases-vulnhunter-an-open-source-ai-tool-that-finds-software-flaws-before-hackers-do)（新产品 / 银行巨头的Agentic AI安全工具开源）

值得重点跟踪的 3 个信号

0718日报 | Agent基础设施的「安全与控制」时刻

今日洞察

1. Runta获a16z领投$2000万种子轮——为AI Agent建立「家长控制层」（融资 / Agent「执行层基础设施」的诞生）

2. Oak获$6000万种子轮——为AI Agent重建企业身份治理（融资 / AI原生的身份操作系统 / 以色列创纪录种子轮）

3. Aina获$550万种子轮——AI时代的「硬件接口」重设计（新产品 / AI时代的人机交互硬件）

4. Applied Computing获$2000万A轮——为能源运营构建AI基础模型「Orbital」（融资 / 工业AI基础模型的垂直落地）

5. VentureBeat调查：54%企业已遭遇AI Agent安全事件，但只有21%具备运行时可见性（行业洞察 / Agent安全的「灰犀牛」数据）

值得重点跟踪的 3 个信号

0717日报 | AI治理新秩序：上海WAIC登场与全球AI合作组织诞生

0717日报 | AI治理新秩序：上海WAIC登场与全球AI合作组织诞生

今日洞察

1. WAIC 2026开幕 + 29国签署世界AI合作组织（WAICO）——全球AI治理的制度分水岭（行业洞察 / 全球AI治理新格局）

2. Nubia二代豆包AI Agent手机在WAIC首发——全球首款系统级Agent智能手机（新产品 / AI从「被动问答」到「主动执行」的硬件入口）

3. Elorian AI：前DeepMind研究员Andrew Dai在无产品情况下拿下$5500万种子轮、$3亿估值（融资 / 视觉推理AI的「顶级团队溢价」）

值得重点跟踪的 3 个信号

0716日报 | 开放模型的新玩家与AI部署的现实鸿沟

今日洞察

4. [DeepSeek寻求$740亿估值新一轮融资——中国AI独角兽的IPO前夜](https://www.businesstimes.com.sg/startups-tech/technology/chinas-deepseek-raise-fresh-capital-us74-billion-valuation-ahead-onshore-ipo)（融资 / 中国AI的估值与合规双线叙事）

值得重点跟踪的 3 个信号

0715日报 | 监管新纪元与生态延伸

0714日报 | 定价战与Agent信任危机

今日洞察

1. [DeepSeek永久性降低V4-Pro价格75%](https://venturebeat.com/orchestration/deepseek-cut-prices-75-the-100x-problem-remains)（融资/定价 / AI推理定价战进入新阶段）

2. [VB Transform 2026今日开幕](https://venturebeat.com/vbtransform2026)（行业洞察 / 企业AI Agent的「信任修复大会」）

3. [86%企业GPU利用率不到一半](https://venturebeat.com/orchestration/wall-street-is-debating-the-ai-buildout-enterprises-just-answered-86-say-their-gpus-run-at-half-capacity-or-less)（行业洞察 / AI基础设施的「供给过剩」信号）

4. [ACRouter开源模型路由](https://venturebeat.com/orchestration/acrouter-picks-the-smartest-ai-model-per-task-beating-opus-only-setups-by-2-6x-on-cost)（新产品 / 用「选模型」代替「选最好的模型」）

值得重点跟踪的 3 个信号

觉得文章有用就打赏一下文章作者

非常感谢你的打赏，我们将继续提供更多优质内容，让我们一起创建更加美好的网络世界！

支付宝扫一扫

微信扫一扫