OpenAI 携手 Jony Ive 推出硬件雄心,将 ChatGPT 转型为 AI 平台 | 小模型越级表现;Notion 为代理式 AI 重构

今日看点
- OpenAI 宣布与传奇设计师 Jony Ive 达成一项为期多年的合作,共同打造以人工智能为核心的新硬件,这预示着其将大举进军软件以外的领域。
- ChatGPT 正在演变为一个“应用商店”或操作系统,允许开发者直接在聊天界面中构建和分发丰富、交互式的应用程序。
- 新的“微型”开源人工智能模型,例如三星的TRM(700万参数)和AI21的Jamba Reasoning 3B(30亿参数),在特定推理任务上表现优于大型得多的模型,并能高效地在本地设备上运行推理。
- Notion全面革新了其技术栈,以支持企业级智能体AI,从而使自主智能体能够编排工具并在互联环境中执行复杂任务。
主要动态
本周,AI领域巩固了其迈向普适智能的轨迹,这得益于OpenAI雄心勃勃的平台扩张以及高效、专业的“小型”模型这一逆势发展。最引人注目的消息来自OpenAI的DevDay 2025,首席执行官萨姆·奥特曼(Sam Altman)描绘了一个愿景,即从用户“询问任何事情”的系统过渡到“为您做任何事情”的系统,这预示着我们与技术互动方式的深刻转变。
OpenAI战略的核心是将ChatGPT转变为一个动态的交互式平台。借助新的应用开发工具包(Apps SDK),开发者现在可以直接在ChatGPT界面内构建和部署成熟的应用程序,将这款流行的聊天机器人变成了一个有效的操作系统。现场演示展示了Coursera、Canva和Zillow等合作伙伴运行丰富的交互式用户界面(UI),甚至是全屏体验,所有这些都通过自然语言启动和管理。此举为ChatGPT超过8亿周活跃用户创造了直接分发渠道,旨在使其成为进入商业网络的实际入口。除了交互式应用程序,OpenAI还推出了代理工具包(Agent Kit),一套用于构建自主AI工作者的工具。这个集成开发环境允许设计复杂的工作流程,通过可嵌入的聊天工具包(Chat Kit)部署代理,并进行严格的性能评估。一个引人注目的演示展示了一个采购代理自主处理复杂请求,将长达数周的流程缩短到几分钟。此外,OpenAI的AI编程代理Codex,现由专门的GPT-5驱动,可以自主编写、审查代码,创建拉取请求(pull requests),甚至将白板草图转换为功能性移动应用程序。
然而,本周最大的重磅消息是OpenAI与苹果前首席设计官乔尼·艾维(Jony Ive)之间长达三年的合作被揭示。在一次私人炉边谈话中,艾维和奥特曼证实他们正在合作开发一系列新的以AI为中心的硬件。艾维强调,当前的“遗留产品”不足以满足AI“令人惊叹”的能力,并表达了希望通过“精心”设计来减轻用户的“不堪重负和绝望”。这一声明证实了OpenAI的雄心已超越软件,延伸到未来物理接口领域。支撑这些宏大计划的是对算力“永不满足的渴求”,OpenAI坦率地承认在基础设施方面的巨额投资,这呼应了华特·迪士尼(Walt Disney)“赚更多钱拍更多电影”的哲学——在这里,则是更强大的AI模型。
当OpenAI推动规模和平台边界的同时,“小型”模型领域的并行革命正在挑战“规模就是一切”的普遍哲学。三星AI研究员亚历克西娅·若利克尔-马蒂诺(Alexia Jolicoeur-Martineau)推出了微型递归模型(Tiny Recursion Model,TRM),这是一种只有700万参数的神经网络。尽管尺寸微小,TRM在数独极限(Sudoku-Extreme)、迷宫困难(Maze-Hard)和ARC-AGI等挑战性推理基准测试中,与比其大10000倍的模型相媲美甚至超越。若利克尔-马蒂诺强调,“递归推理,而非规模,可能是处理抽象和组合推理问题的关键”,使高性能AI更经济实惠且易于访问。TRM的代码在MIT许可证下开源。
进一步巩固这一趋势的是,AI21 Labs发布了Jamba Reasoning 3B,这是一款“小型”开源模型,旨在笔记本电脑和手机等边缘设备上运行扩展推理和代码生成。凭借25万个token的上下文窗口以及得益于其Mamba-Transformer混合架构而实现的2-4倍推理速度提升,Jamba Reasoning 3B在本地处理复杂任务,减少了对昂贵数据中心GPU集群的依赖。AI21联合首席执行官奥里·戈申(Ori Goshen)强调了这种混合方法的经济和隐私优势,即推理在设备上进行,为企业提供了更大的控制权和可操控性。
与此同时,像Notion这样的公司正在实际部署代理式AI,展示了必要的架构转变。为了发布Notion 3.0,该公司彻底重建了其技术栈,以支持面向目标的推理系统。Notion的新架构不再仅仅执行基于提示的工作流,而是允许代理自主地在Notion、网络以及Slack等其他平台之间选择、编排和执行工具。Notion的AI建模负责人莎拉·萨克斯(Sarah Sachs)强调,这种重新编排使代理能够做出多项决策并同时执行任务。Notion严谨的评估框架和对“情境延迟”(即理解用户何时愿意等待详尽推理,何时要求即时答案)的关注,为负责任的企业AI部署提供了蓝图。
分析师视角
OpenAI的声明无疑是一场范式转变。从模型提供商发展成为成熟平台,如今又与乔尼·艾维(Jony Ive)合作进军硬件领域,这清晰地表明了OpenAI掌控整个AI生态系统的意图。这不仅仅关乎更好的软件;它关乎重新定义人机交互,可能导向一个后屏幕时代、环境AI的未来。然而,这一宏伟抱负仍受制于对算力永不满足的需求,而这正是该行业的一个关键瓶颈。与此同时,TRM和Jamba Reasoning 3B等“微小”而强大的模型的崛起,提供了一个重要的反叙事,证明了独创性在特定领域可以超越蛮力规模。这种高性能AI的民主化可以加速创新,缓解算力限制,并通过实现更多端侧智能来解决隐私问题。AI的下一阶段很可能将是这两种力量之间的动态互动:庞大的、基于云的基础模型驱动平台级体验,以及高度优化、专门化的模型在边缘提供高效的、情境感知的智能。企业,以Notion的大胆重构为例,必须准备好快速重建和迭代,以驾驭真正的智能体AI。
内容来源
- Samsung AI researcher’s new, open reasoning model TRM outperforms models 10,000X larger — on specific problems (VentureBeat AI)
- OpenAI Dev Day 2025: ChatGPT becomes the new app store — and hardware is coming (VentureBeat AI)
- To scale agentic AI, Notion tore down its tech stack and started fresh (VentureBeat AI)
- AI21’s Jamba reasoning 3B redefines what ‘small’ means in LLMs — 250K context on a laptop (VentureBeat AI)
- OpenAI wasn’t expecting Sora’s copyright drama (The Verge AI)