OpenAI 推出 ChatGPT“应用商店”模式,并披露乔尼·艾维重磅AI硬件;谷歌网页代理取得进展,AUI 提升可靠性。

OpenAI 推出 ChatGPT“应用商店”模式,并披露乔尼·艾维重磅AI硬件;谷歌网页代理取得进展,AUI 提升可靠性。

流线型、极简的AI硬件(受乔纳森·艾维启发),显示着OpenAI ChatGPT的“应用商店”界面,象征着先进的AI和网络智能体。

今日看点

  • OpenAI 宣布了一项宏大的战略,旨在将 ChatGPT 发展成为一个成熟的计算平台和“应用商店”,并提供用于交互式应用的新版 SDK 以及用于构建自主代理的强大工具。
  • OpenAI开发者日的一个重大惊喜是,公布了与传奇设计师乔尼·艾维为期三年的合作,共同打造以AI为中心的新硬件,旨在重新定义人机交互。
  • 谷歌 DeepMind 推出了“Gemini 2.5 Pro 电脑使用”,这是一款先进的智能体,能够自主地与网页界面交互、填写表单,并在用户界面交互基准测试中超越竞争对手。
  • 隐形初创公司 AUI 推出了 Apollo-1,这是一个基础模型,它利用“有状态神经符号推理”,为企业级任务导向型 AI 代理实现了前所未有的可靠性(90% 以上的通过率)。

主要动态

OpenAI在旧金山举行的第三届年度DevDay标志着一次重大转变,首席执行官萨姆·奥特曼(Sam Altman)公布了将ChatGPT从聊天机器人转变为综合计算平台和“应用商店”的愿景。通过新的Apps SDK,开发者现在可以直接在ChatGPT内构建交互式应用程序,有望接触到超过8亿的用户群体。OpenAI表示,此举旨在从仅仅向AI提问转变为命令AI执行复杂任务,反映了AI作为“超级助理”超越传统聊天界面的未来。Agent Kit进一步赋能开发者创建自主AI工作者,集成了工作流设计、部署和性能评估工具,直接满足了企业将AI作为生产力引擎的需求。一个突出示例是金融平台Ramp在数小时内构建了一个采购智能体,大幅缩短了任务完成时间。Codex的进步,现由专门的GPT-5驱动,展示了AI从自然语言乃至白板草图自主编写、审查乃至演进代码的能力。

然而,当天最大的启示来自于一场未经直播的炉边谈话:OpenAI与传奇苹果设计师乔尼·艾维(Jony Ive)就一系列以AI为中心的新硬件展开了为期三年的合作。艾维阐明了他渴望重新定义人类与技术关系的愿望,超越“传统产品”,转向专为惊人AI能力设计的物理形态。这一重磅消息凸显了OpenAI将其影响力从云端延伸到有形用户体验的雄心。OpenAI领导层承认,所有这些举措的背后是对“算力永不满足的渴求”,预示着将继续对基础设施进行大规模投资,以满足压倒性的需求。

与此同时,谷歌DeepMind也以“Gemini 2.5 Pro 计算机用途”强势进入了智能体领域。这一经过精调的Gemini 2.5 Pro版本可以使用虚拟浏览器自主上网、点击按钮、检索信息和填写表格。谷歌与Browserbase的合作,以及针对Claude Sonnet和OpenAI智能体模型等竞争对手的显著基准测试表现——包括在测试中成功绕过Google搜索验证码——使其成为界面控制方面强大的竞争者。尽管目前缺乏直接的文件系统访问权限,Gemini 2.5 计算机用途专注于让开发者为界面驱动型任务创建智能体,并以更低的延迟服务于生产用例。

为弥补企业AI中的关键空白,隐形初创公司Augmented Intelligence (AUI) 推出了Apollo-1,一个旨在实现任务导向型对话前所未有可靠性的基础模型。Apollo-1建立在“有状态的神经符号推理”之上,承诺相较于概率性结果,实现“行为确定性”,在TAU-Bench航空公司基准测试中达到了惊人的92.5%通过率,远超竞争对手。AUI的方法旨在提供任务关键型企业任务所需的确定性结果,其中“总是”执行某项操作是要求,而非偏好。该模型已与财富500强公司进行试点,并预计于2025年11月普遍可用,代表着向真正值得信赖的企业智能体迈出的重要一步。

为进一步强调对企业的关注,IBM推出了Project Bob,一个AI优先的集成开发环境(IDE),它协调多个大型语言模型(Claude、Mistral、Llama、Granite 4)以实现应用现代化自动化。Project Bob声称使其内部开发人员的生产力提高了45%,同时维护完整的代码库上下文,处理复杂的升级并整合DevSecOps实践。IBM还推出了AgentOps用于实时智能体治理,并将开源的Langflow可视化智能体构建器集成到watsonx Orchestrate中。这些工具旨在弥合“原型到生产的鸿沟”,提供任务关键型AI智能体部署所需的治理、安全性与可扩展性,从而强化了强大的基础设施对于企业AI的采用至关重要。

分析师视角

今天的公告证实,构建真正自主、面向行动的AI代理的竞争正在加剧。OpenAI雄心勃勃的平台战略,将ChatGPT转变为一个应用和代理的生态系统,再加上与Jony Ive大胆的硬件合作,预示着一个长期愿景,即重新定义超越当前范式的计算界面。这不仅仅是关于更好的聊天机器人;它关乎AI成为一个操作系统和一种物理存在。然而,正如谷歌通过其强大的网络代理所展示的,以及AUI正在推动企业级可靠性,眼前的战场仍然是复杂任务的可靠执行。IBM对治理和现代化的关注,凸显了在企业中大规模部署代理的实际挑战。算力这一根本性限制日益凸显,这表明,尽管普适AI的愿景清晰可见,但实现这一愿景所需的基础设施将继续推动大规模投资和创新。我们正迅速从“AI即工具”转向“AI即行动者”,这使得可靠性、安全性和集成性变得至关重要。


内容来源

Read English Version (阅读英文版)

Comments are closed.