人工智能百亿美元人才机器:精英获报酬自动化自身职业;Grok 因未经同意的编辑引众怒,OpenAI 扶植新创始人

人工智能百亿美元人才机器:精英获报酬自动化自身职业;Grok 因未经同意的编辑引众怒,OpenAI 扶植新创始人

今日看点 Mercor,这家成立三年的初创公司,通过将前精英专业人士(例如高盛、麦肯锡前员工)与AI实验室连接起来训练模型,估值已达100亿美元。 这些专业人士…

Read More Read More

OpenAI 任命新任应对主管,直面人工智能的阴暗面 | Meta 收购 Manus;Instagram 努力应对“无限合成内容”

OpenAI 任命新任应对主管,直面人工智能的阴暗面 | Meta 收购 Manus;Instagram 努力应对“无限合成内容”

今日看点 OpenAI 宣布设立新的准备主管职位,标志着其机构高度重视减轻由飞速发展的AI模型带来的“真正挑战”。 Meta 收购了人工智能初创公司 Manus…

Read More Read More

好莱坞和游戏产业面临AI的清算时刻 | Z80-μLM 将大语言模型缩小至 40KB | 谷歌预告 Gemini 3 Flash

好莱坞和游戏产业面临AI的清算时刻 | Z80-μLM 将大语言模型缩小至 40KB | 谷歌预告 Gemini 3 Flash

今日看点 2025年标志着好莱坞和视频游戏行业人工智能的一个重要转折点,其广泛采用未能带来积极成果,反而滋生了创意工作者和游戏玩家的不满。 一项显著的技术成就,…

Read More Read More

Gemini 3 在谷歌里程碑式的2025年AI评估中占据中心舞台;好莱坞票房惨淡,游戏界因生成式技术爆发轩然大波

Gemini 3 在谷歌里程碑式的2025年AI评估中占据中心舞台;好莱坞票房惨淡,游戏界因生成式技术爆发轩然大波

今日看点 谷歌的年终回顾突出强调了“Gemini 3”是一项重大的研究突破,预示着其AI能力取得了重大进展。 好莱坞于2025年积极采用生成式人工智能,用于“去…

Read More Read More

安德罗匹克 推出“代理技能”作为开放标准,重塑企业人工智能 | 谷歌的 Gemini 3 Flash 加速,Palona 垂直转型

安德罗匹克 推出“代理技能”作为开放标准,重塑企业人工智能 | 谷歌的 Gemini 3 Flash 加速,Palona 垂直转型

今日看点 Anthropic 发布了其“Agent Skills”技术,作为一项开放标准,使AI助手能够通过可复用模块一致地执行专业任务,并已立即获得微软、Op…

Read More Read More

谷歌的 Gemini 3 Flash 重新定义企业人工智能价值 | Anthropic 发布开放代理标准,Palona 进军垂直领域

谷歌的 Gemini 3 Flash 重新定义企业人工智能价值 | Anthropic 发布开放代理标准,Palona 进军垂直领域

今日看点 谷歌发布了Gemini 3 Flash,这是一款经济高效、高速的大语言模型,为企业AI领域的“专业级推理”设定了新基准,并在关键基准测试中超越了竞争对…

Read More Read More

Anthropic 开源“智能体技能”以定义企业级AI | 谷歌经济高效的 Gemini 3 Flash 登场,OpenAI 推出新型编码模型

Anthropic 开源“智能体技能”以定义企业级AI | 谷歌经济高效的 Gemini 3 Flash 登场,OpenAI 推出新型编码模型

今日看点 Anthropic已发布其“Agent Skills”(代理技能)技术作为一项开放标准,旨在促进业界在针对专业AI任务的模块化方法上趋同,微软已采纳该…

Read More Read More

Anthropic为智能体技能制定的开放标准引发行业融合;谷歌首次推出经济高效的Gemini 3 Flash;Palona AI进行垂直转型

Anthropic为智能体技能制定的开放标准引发行业融合;谷歌首次推出经济高效的Gemini 3 Flash;Palona AI进行垂直转型

今日看点 Anthropic 已将其“Agent Skills”技术作为开放标准发布,旨在定义 AI 助手如何学习和执行专业任务,此举已得到 OpenAI 采用…

Read More Read More

韩国初创公司 Motif 揭示了企业级LLM推理的关键,性能超越 GPT-5.1 | OpenAI 的 GPT-5.2 在科学领域表现出色,字节级模型推动多语言AI发展

韩国初创公司 Motif 揭示了企业级LLM推理的关键,性能超越 GPT-5.1 | OpenAI 的 GPT-5.2 在科学领域表现出色,字节级模型推动多语言AI发展

今日看点 韩国初创公司 Motif Technologies 发布了一款拥有127亿参数的开放权重模型,该模型在基准测试中超越了 OpenAI 的 GPT-5….

Read More Read More

OpenAI 发布 GPT-5.2,以“红色警报”回应谷歌,重夺AI性能桂冠 | Nous Research 的开源 Nomos 1 达到近乎人类精英的数学能力

OpenAI 发布 GPT-5.2,以“红色警报”回应谷歌,重夺AI性能桂冠 | Nous Research 的开源 Nomos 1 达到近乎人类精英的数学能力

今日看点 OpenAI 正式推出了其最新的前沿大型语言模型 GPT-5.2,该模型引入了全新的“Thinking”和“Pro”层级,旨在主导专业知识工作、编程以…

Read More Read More

70% 的“事实准确率”门槛:为什么谷歌的 AI 基准测试与其说是欢迎垫,不如说更像是一种警示

70% 的“事实准确率”门槛:为什么谷歌的 AI 基准测试与其说是欢迎垫,不如说更像是一种警示

引言: 又一周,又一个基准测试。然而,谷歌新的FACTS基准测试套件不仅仅是另一个光鲜亮丽的排行榜;它是一面严峻而发人深省的镜子,反映出当今备受吹捧的生成式人工…

Read More Read More

AI一周内设计出功能齐全的Linux电脑,一次启动成功 · 谷歌推出新的事实性基准 · OpenAI揭示6倍生产力差距

AI一周内设计出功能齐全的Linux电脑,一次启动成功 · 谷歌推出新的事实性基准 · OpenAI揭示6倍生产力差距

今日看点 Quilter的人工智能在一周内设计了一台由843个部件组成的Linux电脑,将一个为期三个月的工程任务所需的人工投入时间缩减到38.5小时,这标志着…

Read More Read More

AI 战胜“上下文衰减”:双智能体记忆超越长上下文大模型 | OpenAI 的“吐真剂”与 GPT-5.2 竞速谷歌

AI 战胜“上下文衰减”:双智能体记忆超越长上下文大模型 | OpenAI 的“吐真剂”与 GPT-5.2 竞速谷歌

今日看点 一个名为通用智能体记忆(GAM)的新型双智能体记忆架构,通过维护无损的历史记录并智能地检索精确细节,解决了大型语言模型(LLM)中的“上下文腐烂”问题…

Read More Read More

OpenAI 宣布“红色警报”,GPT-5.2 即将发布以对抗谷歌 | 突破性内存架构解决“上下文腐烂”问题,AWS 释放AI编码能力

OpenAI 宣布“红色警报”,GPT-5.2 即将发布以对抗谷歌 | 突破性内存架构解决“上下文腐烂”问题,AWS 释放AI编码能力

今日看点 OpenAI 正在加紧下周发布 GPT-5.2,作为对谷歌 Gemini 3 的“红色警报”级别竞争性回应,此举加剧了对 LLM 霸主地位的争夺。 研…

Read More Read More

亚马逊推出可连续数天编程的自主“先锋代理” | Gemini 3 获得里程碑式信任评分 | 谷歌简化代理采用

亚马逊推出可连续数天编程的自主“先锋代理” | Gemini 3 获得里程碑式信任评分 | 谷歌简化代理采用

今日看点 亚马逊云计算 (AWS) 推出了“前沿代理”——一类新型的自主人工智能系统(Kiro、安全、DevOps代理),能够持续多日完成复杂的软件开发、安全和…

Read More Read More

自主开发者已至:亚马逊AI智能体无需干预即可连续数日编码;Mistral 3 的开源攻势与诺顿安全AI浏览器相继亮相。

自主开发者已至:亚马逊AI智能体无需干预即可连续数日编码;Mistral 3 的开源攻势与诺顿安全AI浏览器相继亮相。

今日看点 亚马逊网络服务 (AWS) 推出了一类新型的自主人工智能系统——“前沿智能体”,旨在连续数日无需人工干预地执行复杂的软件开发、安全和IT运维任务,这标…

Read More Read More

Anthropic 宣称在智能体长效记忆方面取得突破;《2025 AI 回顾》聚焦 OpenAI 的开放权重与中国开源浪潮

Anthropic 宣称在智能体长效记忆方面取得突破;《2025 AI 回顾》聚焦 OpenAI 的开放权重与中国开源浪潮

今日看点 Anthropic 公司推出了一种两部分解决方案,旨在解决 AI 智能体持久记忆的难题,该方案利用初始化智能体和编码智能体来管理跨离散会话的上下文。 …

Read More Read More

大语言模型智能体的强化学习:这真的是“超越数学”的突破,还是仅仅一个更复杂的跑步机?

大语言模型智能体的强化学习:这真的是“超越数学”的突破,还是仅仅一个更复杂的跑步机?

引言: 大型语言模型发展成为真正自主的智能体,能够应对企业任务的复杂现实,这一前景令人憧憬。中国科学技术大学的最新研究提出了Agent-R1,这是一个旨在实现这…

Read More Read More

Karpathy 的“氛围代码”蓝图重新定义了 AI 基础设施;图像生成热度升温,智能体弥补记忆空白

Karpathy 的“氛围代码”蓝图重新定义了 AI 基础设施;图像生成热度升温,智能体弥补记忆空白

今日看点 安德烈·卡帕西的“LLM 委员会”项目为企业级 AI 编排提供了一份鲜明的“氛围准则”蓝图,揭示了原始模型集成与生产级系统之间的关键鸿沟。 黑森林实验…

Read More Read More

特朗普的“创世纪任务”引爆美国AI“曼哈顿计划” | Karpathy的编排蓝图与新图像模型激战巨头

特朗普的“创世纪任务”引爆美国AI“曼哈顿计划” | Karpathy的编排蓝图与新图像模型激战巨头

今日看点 唐纳德·特朗普总统启动了“创世纪任务”,这是一项类似于曼哈顿计划的全国性倡议,指示能源部建立一个“闭环人工智能实验平台”,将国家实验室和超级计算机与主…

Read More Read More

白宫推出人工智能“曼哈顿计划”,携手顶尖科技巨头启动“创世任务” | 图像生成热度升温,智能体自我进化,Karpathy 重新定义编排

白宫推出人工智能“曼哈顿计划”,携手顶尖科技巨头启动“创世任务” | 图像生成热度升温,智能体自我进化,Karpathy 重新定义编排

今日看点 白宫启动了“创世任务”,这是一项雄心勃勃的国家人工智能计划,被比作曼哈顿计划,涉及主要人工智能公司和国家实验室,引发了关于公共资金是否应用于不断上涨的…

Read More Read More

创世纪任务:华盛顿是在打造美国的AI未来,还是仅仅在为科技巨头的算力费用买单?

创世纪任务:华盛顿是在打造美国的AI未来,还是仅仅在为科技巨头的算力费用买单?

引言: 特朗普总统的“创世纪任务”承诺将为美国科学带来革命性飞跃,堪称人工智能领域的“曼哈顿计划”。然而,在宏大的言辞和雄心勃勃的截止日期背后,仔细审视却揭示出…

Read More Read More

Lean4 证明重新定义 AI 信任,在数学奥赛中击败人类;Anthropic 的 Opus 4.5 擅长编码,OpenAI 宣布 GPT-4o API 退役

Lean4 证明重新定义 AI 信任,在数学奥赛中击败人类;Anthropic 的 Opus 4.5 擅长编码,OpenAI 宣布 GPT-4o API 退役

今日看点 Lean4形式化验证正成为构建可信赖AI的关键工具,它使模型能够生成数学上得到保证的、无幻觉的输出,并在国际数学奥林匹克竞赛中取得金牌水平的表现。 A…

Read More Read More

谷歌推出“嵌套学习”范式,旨在彻底变革AI记忆|Grok 4.1发布因“马斯克吹捧”蒙上阴影,OpenAI停用GPT-4o API

谷歌推出“嵌套学习”范式,旨在彻底变革AI记忆|Grok 4.1发布因“马斯克吹捧”蒙上阴影,OpenAI停用GPT-4o API

今日看点 谷歌研究人员推出了一种新的人工智能范式“嵌套学习”以及“Hope”模型,旨在通过多层优化解决大语言模型 (LLMs) 的内存和持续学习局限性。 xAI…

Read More Read More