Anthropic的Claude Opus 4.5大幅降价,编程能力超越人类;白宫启动“创世纪任务”;微软推出端侧AI助手

今日看点
- Anthropic发布了Claude Opus 4.5,将价格大幅削减了三分之二,并在软件工程任务中取得了最先进的性能,甚至在内部测试中超越了人类候选者。
- 白宫公布了“创世任务”,一项旨在利用人工智能加速科学发现的新“曼哈顿计划”。该计划将连接国家实验室和超级计算机,并有主要私营部门合作者参与,但其资金来源尚未披露。
- 微软推出了Fara-7B,这是一款紧凑的70亿参数AI代理,旨在设备端电脑上使用,擅长网络导航,并相较于更大、依赖云端的模型,提供了更强的隐私性和更高的效率。
- 一份行业评论警告称,公司采纳“AI优先”的指令可能导致表演性创新,而未能自下而上地培养真正、内生的AI采纳和实验。
主要动态
人工智能领域出现了一系列重大进展,凸显了模型能力在公共和私营部门的快速提升以及新兴的多元化战略。引领潮流的是,Anthropic周一发布了其迄今为止最强大的大型语言模型Claude Opus 4.5。这个新版本不仅在软件工程基准测试中展现了最先进的性能,超越了OpenAI的GPT-5.1-Codex-Max和谷歌的Gemini 3 Pro等竞争对手,而且还取得了显著的里程碑,在Anthropic最严苛的内部工程评估中,得分超过了所有人类求职者。除了原始性能,Anthropic还使Opus 4.5变得极其易用,将其价格大幅削减三分之二,降至每百万输入代币5美元和每百万输出代币25美元。这种激进的定价,加上“无限聊天”和自我改进代理等功能,加剧了前沿AI市场的竞争,并可能显著扩大该技术在开发者和企业中的应用。
与此同时,美国政府通过唐纳德·特朗普总统新的“创世纪任务”预示了对AI驱动科学的巨大投资。这项于周一公布的倡议被誉为AI领域的“曼哈顿计划”,它指示能源部(DOE)建立一个“闭环AI实验平台”。该平台将整合美国17个国家实验室、联邦超级计算机和数十年的科学数据,形成“一个合作研究系统”,优先领域涵盖生物技术、量子科学和半导体。该任务拥有广泛的私营部门合作联盟,包括OpenAI for Government、谷歌、微软、英伟达和Anthropic等主要的AI和计算公司。然而,这项命令对成本估算或明确拨款只字未提,引发了外界猜测,认为它可能悄悄地惠及那些面临计算和数据成本不断上涨的大型AI公司——这是AI社区批评者强调的一个担忧。该任务以国家安全为框架,强调分类规则和出口管制,这表明它倾向于一个受控访问的生态系统,而非开源模式。
与此形成对比的是,微软推出Fara-7B,这是一款新的70亿参数计算机使用代理(CUA),旨在直接在用户PC上执行复杂任务。Fara-7B的突出之处在于它通过像素级的网页视觉感知来操作,模仿人类使用鼠标和键盘进行互动,而不是依赖底层代码。这种方法通过确保敏感数据永不离开设备来增强隐私保护,并且被证明高效,在WebVoyager基准测试中以73.5%的成功率超越了GPT-4o等大型模型。该模型采用合成数据管道开发,还设有“关键点”,在执行不可逆操作前会暂停以待用户批准,从而降低了与自主代理相关的风险。
在这些进步和大规模倡议的背景下,VentureBeat的一篇行业文章讲述了一个关于企业AI采纳的警示故事。文章警告说,要避免成为一个“AI优先”但“实际AI使用为零”的公司的常见陷阱,在这种情况下,自上而下的AI集成指令会导致表演性创新,而非真实、有机的采纳。文章强调,真正的转型往往源于自下而上的好奇心和实验,敦促领导者以身作则,创造学习的许可,而不是强制服从。这一观点为那些常常被大肆宣传的声明提供了一个重要的审视,提醒我们AI的真正影响最终取决于实际用户如何将其整合到日常工作中。
分析师视角
今天的消息浓缩了人工智能行业内部的动态张力:一场追求原始模型能力的竞赛,一项推动国家基础设施建设的战略举措,以及一个在边缘端追求效率和隐私的并行驱动力。Anthropic的Opus 4.5以其激进的定价和性能提升,预示着一个尖端人工智能正迅速商品化的市场,迫使所有参与者通过成本效益和专业化功能持续证明自身价值。创世任务(The Genesis Mission)虽然雄心勃勃,但也同时凸显了前沿人工智能对巨大资本的需求,并在缺乏透明成本细节的情况下,引发了关于公共资金在支持私营部门创新中作用的关键问题。微软的Fara-7B及时提醒我们,人工智能的未来并非仅限于大规模、中心化的模型,还在于那些紧凑、私密、高效且优先考虑用户控制的智能体。企业不仅应关注技术飞跃,还应关注新兴的融资模式和治理框架,因为这些将决定未来大规模人工智能的访问权限、互操作性及实际可行性。一如既往,挑战在于如何区分真正的进步和表面功夫的举措。
内容来源
- What enterprises should know about The White House’s new AI ‘Manhattan Project’ the Genesis Mission (VentureBeat AI)
- Anthropic’s Claude Opus 4.5 is here: Cheaper AI, infinite chats, and coding skills that beat humans (VentureBeat AI)
- Microsoft’s Fara-7B is a computer-use AI agent that rivals GPT-4o and works directly on your PC (VentureBeat AI)
- How to avoid becoming an “AI-first” company with zero real AI usage (VentureBeat AI)
- Large language mistake (The Verge AI)