Browsed by
Month: 2025 年 11 月

大语言模型智能体的强化学习:这真的是“超越数学”的突破,还是仅仅一个更复杂的跑步机?

大语言模型智能体的强化学习:这真的是“超越数学”的突破,还是仅仅一个更复杂的跑步机?

引言: 大型语言模型发展成为真正自主的智能体,能够应对企业任务的复杂现实,这一前景令人憧憬。中国科学技术大学的最新研究提出了Agent-R1,这是一个旨在实现这…

Read More Read More

Karpathy 的“氛围代码”蓝图重新定义了 AI 基础设施;图像生成热度升温,智能体弥补记忆空白

Karpathy 的“氛围代码”蓝图重新定义了 AI 基础设施;图像生成热度升温,智能体弥补记忆空白

今日看点 安德烈·卡帕西的“LLM 委员会”项目为企业级 AI 编排提供了一份鲜明的“氛围准则”蓝图,揭示了原始模型集成与生产级系统之间的关键鸿沟。 黑森林实验…

Read More Read More

特朗普的“创世纪任务”引爆美国AI“曼哈顿计划” | Karpathy的编排蓝图与新图像模型激战巨头

特朗普的“创世纪任务”引爆美国AI“曼哈顿计划” | Karpathy的编排蓝图与新图像模型激战巨头

今日看点 唐纳德·特朗普总统启动了“创世纪任务”,这是一项类似于曼哈顿计划的全国性倡议,指示能源部建立一个“闭环人工智能实验平台”,将国家实验室和超级计算机与主…

Read More Read More

白宫推出人工智能“曼哈顿计划”,携手顶尖科技巨头启动“创世任务” | 图像生成热度升温,智能体自我进化,Karpathy 重新定义编排

白宫推出人工智能“曼哈顿计划”,携手顶尖科技巨头启动“创世任务” | 图像生成热度升温,智能体自我进化,Karpathy 重新定义编排

今日看点 白宫启动了“创世任务”,这是一项雄心勃勃的国家人工智能计划,被比作曼哈顿计划,涉及主要人工智能公司和国家实验室,引发了关于公共资金是否应用于不断上涨的…

Read More Read More

创世纪任务:华盛顿是在打造美国的AI未来,还是仅仅在为科技巨头的算力费用买单?

创世纪任务:华盛顿是在打造美国的AI未来,还是仅仅在为科技巨头的算力费用买单?

引言: 特朗普总统的“创世纪任务”承诺将为美国科学带来革命性飞跃,堪称人工智能领域的“曼哈顿计划”。然而,在宏大的言辞和雄心勃勃的截止日期背后,仔细审视却揭示出…

Read More Read More

Lean4 证明重新定义 AI 信任,在数学奥赛中击败人类;Anthropic 的 Opus 4.5 擅长编码,OpenAI 宣布 GPT-4o API 退役

Lean4 证明重新定义 AI 信任,在数学奥赛中击败人类;Anthropic 的 Opus 4.5 擅长编码,OpenAI 宣布 GPT-4o API 退役

今日看点 Lean4形式化验证正成为构建可信赖AI的关键工具,它使模型能够生成数学上得到保证的、无幻觉的输出,并在国际数学奥林匹克竞赛中取得金牌水平的表现。 A…

Read More Read More

谷歌推出“嵌套学习”范式,旨在彻底变革AI记忆|Grok 4.1发布因“马斯克吹捧”蒙上阴影,OpenAI停用GPT-4o API

谷歌推出“嵌套学习”范式,旨在彻底变革AI记忆|Grok 4.1发布因“马斯克吹捧”蒙上阴影,OpenAI停用GPT-4o API

今日看点 谷歌研究人员推出了一种新的人工智能范式“嵌套学习”以及“Hope”模型,旨在通过多层优化解决大语言模型 (LLMs) 的内存和持续学习局限性。 xAI…

Read More Read More

百度文心ERNIE 5以超越GPT-5的基准测试成绩令人惊叹;Upwork强调人机协同;谷歌提升小模型推理能力

百度文心ERNIE 5以超越GPT-5的基准测试成绩令人惊叹;Upwork强调人机协同;谷歌提升小模型推理能力

今日看点 中国科技巨头百度发布了文心大模型 5.0,这是一款全新的全模态基础模型,声称在文档理解和图表问答等关键的企业级基准测试中超越了 OpenAI 的 GP…

Read More Read More

文心5刷新基准:百度宣称全球AI领先,超越GPT-5.1、Gemini | Upwork揭示人机协同,LinkedIn将AI赋能数十亿用户

文心5刷新基准:百度宣称全球AI领先,超越GPT-5.1、Gemini | Upwork揭示人机协同,LinkedIn将AI赋能数十亿用户

今日看点 百度发布了其自研的文心一言 5.0,声称在文档理解和多模态推理等关键企业任务中,其性能可媲美甚至超越 OpenAI 的 GPT-5.1 和谷歌的 Ge…

Read More Read More

百度文心一言5.0宣称多模态能力超越GPT-5 | Upwork揭示人机协作成功,因果AI飙升,以及微博的强大迷你大模型

百度文心一言5.0宣称多模态能力超越GPT-5 | Upwork揭示人机协作成功,因果AI飙升,以及微博的强大迷你大模型

今日看点 中国科技巨头百度发布了其专有的全模态基础模型ERNIE 5.0,声称在多模态推理、文档理解和基于图表的问答方面,其性能优于OpenAI的GPT-5和谷…

Read More Read More

Meta的多语言认错:全语种自动语音识别(ASR)是真正开放的新起点,还是仅仅是声誉的重新校准?

Meta的多语言认错:全语种自动语音识别(ASR)是真正开放的新起点,还是仅仅是声誉的重新校准?

引言: Meta最新发布的“全能语言ASR”承诺支持前所未有的1600多种语言,有望打破语言障碍,令竞争对手相形见绌。表面上看,这似乎是Meta在开源领域的一次…

Read More Read More

Meta的全语种ASR打破语言障碍,为1,600多种语言开源 | Chronosphere凭借可解释AI与Datadog展开竞争;开发者对AI代码的自主性持怀疑态度

Meta的全语种ASR打破语言障碍,为1,600多种语言开源 | Chronosphere凭借可解释AI与Datadog展开竞争;开发者对AI代码的自主性持怀疑态度

今日看点 Meta 发布了全语种ASR,这是一款开创性的开源(Apache 2.0 许可)语音识别系统,原生支持 1,600 多种语言,并可通过零样本学习扩展到…

Read More Read More

人工智能可观测性的现实审视:Chronosphere 能否真正解释“为什么”,抑或它只是一个更智能的黑匣子?

人工智能可观测性的现实审视:Chronosphere 能否真正解释“为什么”,抑或它只是一个更智能的黑匣子?

引言: 在一个AI加速代码生成速度快于人类调试的时代,一个不仅能检测还能解释软件故障的人工智能的承诺极具诱惑力。Chronosphere新推出的AI引导故障排查…

Read More Read More

纽约大学的“更快、更便宜”人工智能:这是一次进化,还是生成式模型的又一次叉车式升级?

纽约大学的“更快、更便宜”人工智能:这是一次进化,还是生成式模型的又一次叉车式升级?

引言: 纽约大学的研究人员正在宣传一种名为RAE的新型扩散模型架构,该架构有望实现更快、更经济、语义感知能力更强的图像生成。尽管其技术上的精妙之处毋庸置疑,且基…

Read More Read More

注意力机制霸权受挑战:新型“能量保持”模型承诺以远低于Transformer的成本实现同等性能 | AI面临算力紧缺;Gemini深度研究整合个人数据

注意力机制霸权受挑战:新型“能量保持”模型承诺以远低于Transformer的成本实现同等性能 | AI面临算力紧缺;Gemini深度研究整合个人数据

今日看点 Manifest AI 推出了 Brumby-14B-Base,它是 Qwen3-14B-Base 的一个变体,用一种新颖的“Power Retent…

Read More Read More

神经符号AI初创公司AUI以7.5亿美元估值挑战Transformer主导地位;新型确定性CPU出现;谷歌Gemma模型面临生命周期风险

神经符号AI初创公司AUI以7.5亿美元估值挑战Transformer主导地位;新型确定性CPU出现;谷歌Gemma模型面临生命周期风险

今日看点 增强智能公司 (AUI) 融资2000万美元,估值达到7.5亿美元,用于其神经符号基础模型Apollo-1,该模型旨在提供超越传统仅基于Transfo…

Read More Read More

计算领域迎来革命性突破:确定性CPU颠覆数十年固有认知 | Meta破解LLM黑箱,Canva推出创意AI操作系统

计算领域迎来革命性突破:确定性CPU颠覆数十年固有认知 | Meta破解LLM黑箱,Canva推出创意AI操作系统

今日看点 一种新的确定性CPU架构,详述于最新颁布的专利中,将取代推测执行,有望实现对AI和机器学习工作负载至关重要的可预测、能效高的性能。 Meta 研究人员…

Read More Read More

AI推理黑箱开启:Meta开发方法修复LLM逻辑缺陷 | Anthropic揭示内省式AI,Cursor推出极速编程智能体

AI推理黑箱开启:Meta开发方法修复LLM逻辑缺陷 | Anthropic揭示内省式AI,Cursor推出极速编程智能体

今日看点 Meta研究人员推出了一种基于电路的推理验证技术 (CRV),该技术能够深入大型语言模型(LLMs)内部,实时监测并纠正其推理错误,从而显著提升了人工…

Read More Read More