Zoom的AI“胜利”:智能整合何时会沦为蹭来的功劳?

Zoom的AI“胜利”:智能整合何时会沦为蹭来的功劳?

[翻译机器人故障: 异常 - ResourceExhausted]

引言: Zoom大胆声称其在一项高难度AI基准测试中取得了新的最先进(SOTA)分数,这在正努力应对AI加速发展带来挑战的业界引发了震动。然而,仔细审阅发现,他们的“胜利”与其说是开创性的基础模型,不如说是巧妙地整合运用了他人成果,这引发了一场关于AI创新真正内涵的关键辩论。这究竟是实用型AI的未来,还是仅仅是一种高明的“功劳挪用”?

核心提炼

  • Zoom 的 SOTA 基准得分并非通过训练一个新的大型语言模型实现,而是通过巧妙地结合并精炼来自 Google、OpenAI 和 Anthropic 现有前沿模型的输出而获得的。
  • 这种“联邦式AI方法”突显了一个日益增长的趋势,即应用层公司利用第三方基础模型,将“AI领导力”的定义从原始模型能力转向集成能力。
  • 这一说法有可能误导市场认知,因为它将API接口的精密工程与构建底层智能所需的庞大且耗资巨大的研发混为一谈,这可能会模糊竞争激烈的AI格局中的界线。

深度解读

Zoom的声明由其资深首席技术官黄学东牵头,无论有意无意,都堪称战略定位的典范。通过将其在“人类期末考试”(HLE)中48.1%的分数框定为“最先进”(SOTA)的成就,Zoom迎合了业界对基准测试作为AI进展指标的强烈关注。然而,这一分数背后的机制——一种利用“Z-评分器”和“探索-验证-联邦策略”的“联邦式AI方法”——从根本上改变了“SOTA”所隐含的衡量标准。

本质上,Zoom为互联网上最强大的AI大脑构建了一个先进的流量调度器。查询被路由,由多个外部模型处理,然后一个专有系统选择、组合并优化最佳输出。虽然这在技术上是可靠的,甚至作为一项工程壮举堪称精妙,但它与谷歌、OpenAI和Anthropic投入数亿甚至数十亿美元开发基础大型语言模型本身形成了鲜明对比。这些模型是引擎;而Zoom构建的则是一个精密的传输系统。

支持者们经常援引与Kaggle竞赛的类比,在Kaggle竞赛中,模型集成是标准做法。事实上,结合模型通常会产生卓越的结果。但Kaggle参赛者通常不会声称他们构建了组成其集成的各个算法。在讨论一个新兴行业的研发领导地位和知识产权时,这种区别至关重要。Zoom并非在AI智能的基础层进行创新;它是在应用和编排层进行创新。毫无疑问,这对于提供特定的面向用户的功能是很有价值的。但这使得Zoom能够有效地套利他人的基础投资,在不承担前沿研发全部重担的情况下,获得引人注目的基准分数。这引发了疑问:为单一、整体式模型设计的现有基准测试,是否能充分捕捉多模型、代理式AI未来中创新的真正本质。虽然黄学东构建“更好的模型使用系统”的意图是明确的,但围绕“SOTA分数”的叙事很容易混淆这一细微差别。

对比观点

尽管对将“SOTA”地位归因于Zoom的说法持怀疑态度是可以理解的,但至关重要的是不要忽视Zoom所展现的真正工程价值。有效地编排多个不同的AI模型,筛选它们的输出,并将它们提炼成一个连贯、卓越的响应,这是一个非同小可的技术挑战。正如一些行业观察家所指出的,这种“集成式”方法在竞技数据科学中很常见,并且在许多实际应用中,它是一种实用而强大的策略,可以实现比任何单一模型都更高的性能。Zoom的“Z-scorer”和“探索-验证-联邦策略”是专有创新,解决了单个大型语言模型(LLM)的实际局限性,特别是它们偶尔出现的“幻觉”或有限的范围。从这个角度来看,Zoom不仅仅是“调用API”;他们正在添加一个有价值的智能代理工作流层。这种方法对于那些需要尖端AI能力但又不想承担训练自身基础模型所需的高昂成本和专业知识的企业来说,可能具有高度可扩展性和成本效益。此外,它还为应用特定的AI精炼创造了一个关键市场,而不仅仅是消耗原始模型输出。

前景探讨

AI的未来,特别是在应用层,可能会看到更多公司采纳Zoom的联邦式方法。对于希望利用尖端AI而无需承担开发基础模型所需的巨额研发成本的企业来说,这是一条务实的道路。行业内将出现更清晰的分化:“模型构建者”(OpenAI、谷歌、Anthropic)和“模型编排者”(Zoom、Sierra以及无数其他公司)。这将需要新的基准来评估这些编排层的效力,而不仅仅是底层模型的原始能力。

然而,仍然存在重大障碍。供应商锁定和不断上涨的API成本是编排者的主要风险;他们的盈利能力和稳定性本质上与第三方模型的定价和可靠性息息相关。差异化也将变得更加困难:如果每个人都能“联邦化”模型,那究竟是什么让一个编排者比另一个更出色呢?“Z分数器”和代理策略需要提供持续的、可衡量的价值,而不仅仅是基准分数。最后,结合来自可能不同的模型(每个模型都有其自身的偏见和安全机制)的输出所带来的伦理和治理挑战将变得日益复杂。


原文参考: Zoom says it aced AI’s hardest exam. Critics say it copied off its neighbors. (VentureBeat AI)

Read English Version (阅读英文版)

Comments are closed.