OpenAI 推出 ChatGPT“应用商店”模式，并披露乔尼·艾维重磅AI硬件；谷歌网页代理取得进展，AUI 提升可靠性。

2025-10-08 AIFlare

流线型、极简的AI硬件（受乔纳森·艾维启发），显示着OpenAI ChatGPT的“应用商店”界面，象征着先进的AI和网络智能体。

今日看点

OpenAI 宣布了一项宏大的战略，旨在将 ChatGPT 发展成为一个成熟的计算平台和“应用商店”，并提供用于交互式应用的新版 SDK 以及用于构建自主代理的强大工具。
OpenAI开发者日的一个重大惊喜是，公布了与传奇设计师乔尼·艾维为期三年的合作，共同打造以AI为中心的新硬件，旨在重新定义人机交互。
谷歌 DeepMind 推出了“Gemini 2.5 Pro 电脑使用”，这是一款先进的智能体，能够自主地与网页界面交互、填写表单，并在用户界面交互基准测试中超越竞争对手。
隐形初创公司 AUI 推出了 Apollo-1，这是一个基础模型，它利用“有状态神经符号推理”，为企业级任务导向型 AI 代理实现了前所未有的可靠性（90% 以上的通过率）。

主要动态

OpenAI在旧金山举行的第三届年度DevDay标志着一次重大转变，首席执行官萨姆·奥特曼（Sam Altman）公布了将ChatGPT从聊天机器人转变为综合计算平台和“应用商店”的愿景。通过新的Apps SDK，开发者现在可以直接在ChatGPT内构建交互式应用程序，有望接触到超过8亿的用户群体。OpenAI表示，此举旨在从仅仅向AI提问转变为命令AI执行复杂任务，反映了AI作为“超级助理”超越传统聊天界面的未来。Agent Kit进一步赋能开发者创建自主AI工作者，集成了工作流设计、部署和性能评估工具，直接满足了企业将AI作为生产力引擎的需求。一个突出示例是金融平台Ramp在数小时内构建了一个采购智能体，大幅缩短了任务完成时间。Codex的进步，现由专门的GPT-5驱动，展示了AI从自然语言乃至白板草图自主编写、审查乃至演进代码的能力。

然而，当天最大的启示来自于一场未经直播的炉边谈话：OpenAI与传奇苹果设计师乔尼·艾维（Jony Ive）就一系列以AI为中心的新硬件展开了为期三年的合作。艾维阐明了他渴望重新定义人类与技术关系的愿望，超越“传统产品”，转向专为惊人AI能力设计的物理形态。这一重磅消息凸显了OpenAI将其影响力从云端延伸到有形用户体验的雄心。OpenAI领导层承认，所有这些举措的背后是对“算力永不满足的渴求”，预示着将继续对基础设施进行大规模投资，以满足压倒性的需求。

与此同时，谷歌DeepMind也以“Gemini 2.5 Pro 计算机用途”强势进入了智能体领域。这一经过精调的Gemini 2.5 Pro版本可以使用虚拟浏览器自主上网、点击按钮、检索信息和填写表格。谷歌与Browserbase的合作，以及针对Claude Sonnet和OpenAI智能体模型等竞争对手的显著基准测试表现——包括在测试中成功绕过Google搜索验证码——使其成为界面控制方面强大的竞争者。尽管目前缺乏直接的文件系统访问权限，Gemini 2.5 计算机用途专注于让开发者为界面驱动型任务创建智能体，并以更低的延迟服务于生产用例。

为弥补企业AI中的关键空白，隐形初创公司Augmented Intelligence (AUI) 推出了Apollo-1，一个旨在实现任务导向型对话前所未有可靠性的基础模型。Apollo-1建立在“有状态的神经符号推理”之上，承诺相较于概率性结果，实现“行为确定性”，在TAU-Bench航空公司基准测试中达到了惊人的92.5%通过率，远超竞争对手。AUI的方法旨在提供任务关键型企业任务所需的确定性结果，其中“总是”执行某项操作是要求，而非偏好。该模型已与财富500强公司进行试点，并预计于2025年11月普遍可用，代表着向真正值得信赖的企业智能体迈出的重要一步。

为进一步强调对企业的关注，IBM推出了Project Bob，一个AI优先的集成开发环境(IDE)，它协调多个大型语言模型（Claude、Mistral、Llama、Granite 4）以实现应用现代化自动化。Project Bob声称使其内部开发人员的生产力提高了45%，同时维护完整的代码库上下文，处理复杂的升级并整合DevSecOps实践。IBM还推出了AgentOps用于实时智能体治理，并将开源的Langflow可视化智能体构建器集成到watsonx Orchestrate中。这些工具旨在弥合“原型到生产的鸿沟”，提供任务关键型AI智能体部署所需的治理、安全性与可扩展性，从而强化了强大的基础设施对于企业AI的采用至关重要。

分析师视角

今天的公告证实，构建真正自主、面向行动的AI代理的竞争正在加剧。OpenAI雄心勃勃的平台战略，将ChatGPT转变为一个应用和代理的生态系统，再加上与Jony Ive大胆的硬件合作，预示着一个长期愿景，即重新定义超越当前范式的计算界面。这不仅仅是关于更好的聊天机器人；它关乎AI成为一个操作系统和一种物理存在。然而，正如谷歌通过其强大的网络代理所展示的，以及AUI正在推动企业级可靠性，眼前的战场仍然是复杂任务的可靠执行。IBM对治理和现代化的关注，凸显了在企业中大规模部署代理的实际挑战。算力这一根本性限制日益凸显，这表明，尽管普适AI的愿景清晰可见，但实现这一愿景所需的基础设施将继续推动大规模投资和创新。我们正迅速从“AI即工具”转向“AI即行动者”，这使得可靠性、安全性和集成性变得至关重要。

内容来源

Read English Version (阅读英文版)

AI Flare

抓住下一波人工智能浪潮