Browsed by
Category: 每日AI动态

韩国初创公司 Motif 揭示了企业级LLM推理的关键,性能超越 GPT-5.1 | OpenAI 的 GPT-5.2 在科学领域表现出色,字节级模型推动多语言AI发展

韩国初创公司 Motif 揭示了企业级LLM推理的关键,性能超越 GPT-5.1 | OpenAI 的 GPT-5.2 在科学领域表现出色,字节级模型推动多语言AI发展

今日看点 韩国初创公司 Motif Technologies 发布了一款拥有127亿参数的开放权重模型,该模型在基准测试中超越了 OpenAI 的 GPT-5….

Read More Read More

OpenAI 发布 GPT-5.2,以“红色警报”回应谷歌,重夺AI性能桂冠 | Nous Research 的开源 Nomos 1 达到近乎人类精英的数学能力

OpenAI 发布 GPT-5.2,以“红色警报”回应谷歌,重夺AI性能桂冠 | Nous Research 的开源 Nomos 1 达到近乎人类精英的数学能力

今日看点 OpenAI 正式推出了其最新的前沿大型语言模型 GPT-5.2,该模型引入了全新的“Thinking”和“Pro”层级,旨在主导专业知识工作、编程以…

Read More Read More

AI一周内设计出功能齐全的Linux电脑,一次启动成功 · 谷歌推出新的事实性基准 · OpenAI揭示6倍生产力差距

AI一周内设计出功能齐全的Linux电脑,一次启动成功 · 谷歌推出新的事实性基准 · OpenAI揭示6倍生产力差距

今日看点 Quilter的人工智能在一周内设计了一台由843个部件组成的Linux电脑,将一个为期三个月的工程任务所需的人工投入时间缩减到38.5小时,这标志着…

Read More Read More

AI 战胜“上下文衰减”:双智能体记忆超越长上下文大模型 | OpenAI 的“吐真剂”与 GPT-5.2 竞速谷歌

AI 战胜“上下文衰减”:双智能体记忆超越长上下文大模型 | OpenAI 的“吐真剂”与 GPT-5.2 竞速谷歌

今日看点 一个名为通用智能体记忆(GAM)的新型双智能体记忆架构,通过维护无损的历史记录并智能地检索精确细节,解决了大型语言模型(LLM)中的“上下文腐烂”问题…

Read More Read More

OpenAI 宣布“红色警报”,GPT-5.2 即将发布以对抗谷歌 | 突破性内存架构解决“上下文腐烂”问题,AWS 释放AI编码能力

OpenAI 宣布“红色警报”,GPT-5.2 即将发布以对抗谷歌 | 突破性内存架构解决“上下文腐烂”问题,AWS 释放AI编码能力

今日看点 OpenAI 正在加紧下周发布 GPT-5.2,作为对谷歌 Gemini 3 的“红色警报”级别竞争性回应,此举加剧了对 LLM 霸主地位的争夺。 研…

Read More Read More

亚马逊推出可连续数天编程的自主“先锋代理” | Gemini 3 获得里程碑式信任评分 | 谷歌简化代理采用

亚马逊推出可连续数天编程的自主“先锋代理” | Gemini 3 获得里程碑式信任评分 | 谷歌简化代理采用

今日看点 亚马逊云计算 (AWS) 推出了“前沿代理”——一类新型的自主人工智能系统(Kiro、安全、DevOps代理),能够持续多日完成复杂的软件开发、安全和…

Read More Read More

自主开发者已至:亚马逊AI智能体无需干预即可连续数日编码;Mistral 3 的开源攻势与诺顿安全AI浏览器相继亮相。

自主开发者已至:亚马逊AI智能体无需干预即可连续数日编码;Mistral 3 的开源攻势与诺顿安全AI浏览器相继亮相。

今日看点 亚马逊网络服务 (AWS) 推出了一类新型的自主人工智能系统——“前沿智能体”,旨在连续数日无需人工干预地执行复杂的软件开发、安全和IT运维任务,这标…

Read More Read More

Anthropic 宣称在智能体长效记忆方面取得突破;《2025 AI 回顾》聚焦 OpenAI 的开放权重与中国开源浪潮

Anthropic 宣称在智能体长效记忆方面取得突破;《2025 AI 回顾》聚焦 OpenAI 的开放权重与中国开源浪潮

今日看点 Anthropic 公司推出了一种两部分解决方案,旨在解决 AI 智能体持久记忆的难题,该方案利用初始化智能体和编码智能体来管理跨离散会话的上下文。 …

Read More Read More

Karpathy 的“氛围代码”蓝图重新定义了 AI 基础设施;图像生成热度升温,智能体弥补记忆空白

Karpathy 的“氛围代码”蓝图重新定义了 AI 基础设施;图像生成热度升温,智能体弥补记忆空白

今日看点 安德烈·卡帕西的“LLM 委员会”项目为企业级 AI 编排提供了一份鲜明的“氛围准则”蓝图,揭示了原始模型集成与生产级系统之间的关键鸿沟。 黑森林实验…

Read More Read More

特朗普的“创世纪任务”引爆美国AI“曼哈顿计划” | Karpathy的编排蓝图与新图像模型激战巨头

特朗普的“创世纪任务”引爆美国AI“曼哈顿计划” | Karpathy的编排蓝图与新图像模型激战巨头

今日看点 唐纳德·特朗普总统启动了“创世纪任务”,这是一项类似于曼哈顿计划的全国性倡议,指示能源部建立一个“闭环人工智能实验平台”,将国家实验室和超级计算机与主…

Read More Read More

白宫推出人工智能“曼哈顿计划”,携手顶尖科技巨头启动“创世任务” | 图像生成热度升温,智能体自我进化,Karpathy 重新定义编排

白宫推出人工智能“曼哈顿计划”,携手顶尖科技巨头启动“创世任务” | 图像生成热度升温,智能体自我进化,Karpathy 重新定义编排

今日看点 白宫启动了“创世任务”,这是一项雄心勃勃的国家人工智能计划,被比作曼哈顿计划,涉及主要人工智能公司和国家实验室,引发了关于公共资金是否应用于不断上涨的…

Read More Read More

Lean4 证明重新定义 AI 信任,在数学奥赛中击败人类;Anthropic 的 Opus 4.5 擅长编码,OpenAI 宣布 GPT-4o API 退役

Lean4 证明重新定义 AI 信任,在数学奥赛中击败人类;Anthropic 的 Opus 4.5 擅长编码,OpenAI 宣布 GPT-4o API 退役

今日看点 Lean4形式化验证正成为构建可信赖AI的关键工具,它使模型能够生成数学上得到保证的、无幻觉的输出,并在国际数学奥林匹克竞赛中取得金牌水平的表现。 A…

Read More Read More

谷歌推出“嵌套学习”范式,旨在彻底变革AI记忆|Grok 4.1发布因“马斯克吹捧”蒙上阴影,OpenAI停用GPT-4o API

谷歌推出“嵌套学习”范式,旨在彻底变革AI记忆|Grok 4.1发布因“马斯克吹捧”蒙上阴影,OpenAI停用GPT-4o API

今日看点 谷歌研究人员推出了一种新的人工智能范式“嵌套学习”以及“Hope”模型,旨在通过多层优化解决大语言模型 (LLMs) 的内存和持续学习局限性。 xAI…

Read More Read More

百度文心ERNIE 5以超越GPT-5的基准测试成绩令人惊叹;Upwork强调人机协同;谷歌提升小模型推理能力

百度文心ERNIE 5以超越GPT-5的基准测试成绩令人惊叹;Upwork强调人机协同;谷歌提升小模型推理能力

今日看点 中国科技巨头百度发布了文心大模型 5.0,这是一款全新的全模态基础模型,声称在文档理解和图表问答等关键的企业级基准测试中超越了 OpenAI 的 GP…

Read More Read More

文心5刷新基准:百度宣称全球AI领先,超越GPT-5.1、Gemini | Upwork揭示人机协同,LinkedIn将AI赋能数十亿用户

文心5刷新基准:百度宣称全球AI领先,超越GPT-5.1、Gemini | Upwork揭示人机协同,LinkedIn将AI赋能数十亿用户

今日看点 百度发布了其自研的文心一言 5.0,声称在文档理解和多模态推理等关键企业任务中,其性能可媲美甚至超越 OpenAI 的 GPT-5.1 和谷歌的 Ge…

Read More Read More

百度文心一言5.0宣称多模态能力超越GPT-5 | Upwork揭示人机协作成功,因果AI飙升,以及微博的强大迷你大模型

百度文心一言5.0宣称多模态能力超越GPT-5 | Upwork揭示人机协作成功,因果AI飙升,以及微博的强大迷你大模型

今日看点 中国科技巨头百度发布了其专有的全模态基础模型ERNIE 5.0,声称在多模态推理、文档理解和基于图表的问答方面,其性能优于OpenAI的GPT-5和谷…

Read More Read More

Meta的全语种ASR打破语言障碍,为1,600多种语言开源 | Chronosphere凭借可解释AI与Datadog展开竞争;开发者对AI代码的自主性持怀疑态度

Meta的全语种ASR打破语言障碍,为1,600多种语言开源 | Chronosphere凭借可解释AI与Datadog展开竞争;开发者对AI代码的自主性持怀疑态度

今日看点 Meta 发布了全语种ASR,这是一款开创性的开源(Apache 2.0 许可)语音识别系统,原生支持 1,600 多种语言,并可通过零样本学习扩展到…

Read More Read More

注意力机制霸权受挑战:新型“能量保持”模型承诺以远低于Transformer的成本实现同等性能 | AI面临算力紧缺;Gemini深度研究整合个人数据

注意力机制霸权受挑战:新型“能量保持”模型承诺以远低于Transformer的成本实现同等性能 | AI面临算力紧缺;Gemini深度研究整合个人数据

今日看点 Manifest AI 推出了 Brumby-14B-Base,它是 Qwen3-14B-Base 的一个变体,用一种新颖的“Power Retent…

Read More Read More

神经符号AI初创公司AUI以7.5亿美元估值挑战Transformer主导地位;新型确定性CPU出现;谷歌Gemma模型面临生命周期风险

神经符号AI初创公司AUI以7.5亿美元估值挑战Transformer主导地位;新型确定性CPU出现;谷歌Gemma模型面临生命周期风险

今日看点 增强智能公司 (AUI) 融资2000万美元,估值达到7.5亿美元,用于其神经符号基础模型Apollo-1,该模型旨在提供超越传统仅基于Transfo…

Read More Read More

计算领域迎来革命性突破:确定性CPU颠覆数十年固有认知 | Meta破解LLM黑箱,Canva推出创意AI操作系统

计算领域迎来革命性突破:确定性CPU颠覆数十年固有认知 | Meta破解LLM黑箱,Canva推出创意AI操作系统

今日看点 一种新的确定性CPU架构,详述于最新颁布的专利中,将取代推测执行,有望实现对AI和机器学习工作负载至关重要的可预测、能效高的性能。 Meta 研究人员…

Read More Read More

AI推理黑箱开启:Meta开发方法修复LLM逻辑缺陷 | Anthropic揭示内省式AI,Cursor推出极速编程智能体

AI推理黑箱开启:Meta开发方法修复LLM逻辑缺陷 | Anthropic揭示内省式AI,Cursor推出极速编程智能体

今日看点 Meta研究人员推出了一种基于电路的推理验证技术 (CRV),该技术能够深入大型语言模型(LLMs)内部,实时监测并纠正其推理错误,从而显著提升了人工…

Read More Read More

思考机器实验室颠覆AI的规模化教条:“第一个超级智能将是一个超人类学习者” | 中国蚂蚁集团发布万亿参数Ring-1T;Mistral推出企业级AI工作室

思考机器实验室颠覆AI的规模化教条:“第一个超级智能将是一个超人类学习者” | 中国蚂蚁集团发布万亿参数Ring-1T;Mistral推出企业级AI工作室

今日看点 一位知名人工智能研究员挑战了业界“规模优先”的做法,提出能够持续适应的“超人类学习者”——而非仅仅是更大的模型——将实现超级智能。 中国蚂蚁集团发布了…

Read More Read More

Transformer 联合创始人:我“彻底厌倦了”这项技术;微软全面改革 Copilot;企业人工智能面临领导力危机

Transformer 联合创始人:我“彻底厌倦了”这项技术;微软全面改革 Copilot;企业人工智能面临领导力危机

今日看点 变压器架构的先驱利昂·琼斯宣称,他将放弃这一主流人工智能技术,理由是研究方向危险地狭窄,并呼吁探索新的突破。 微软推出了一次大规模的Copilot更新…

Read More Read More

DeepSeek 颠覆大模型输入范式,实现10倍视觉文本压缩 | 马尔可夫式思维提升AI推理能力,谷歌简化应用构建

DeepSeek 颠覆大模型输入范式,实现10倍视觉文本压缩 | 马尔可夫式思维提升AI推理能力,谷歌简化应用构建

今日看点 DeepSeek 发布了一个开源模型 DeepSeek-OCR,该模型通过将文本作为图像处理,实现了高达 10 倍的文本压缩,这有望使大型语言模型(L…

Read More Read More

DeepSeek实现10倍视觉文本压缩,重塑LLM输入 | OpenAI加入浏览器大战,Mila攻克百万Token级AI推理,谷歌简化应用开发

DeepSeek实现10倍视觉文本压缩,重塑LLM输入 | OpenAI加入浏览器大战,Mila攻克百万Token级AI推理,谷歌简化应用开发

今日看点 DeepSeek发布了DeepSeek-OCR,这是一个开源模型,它通过将文本视为图像,实现了高达10倍的压缩效率,有望使大语言模型(LLM)的上下文…

Read More Read More

AI创意革命:一句话解锁前所未有的模型多样性 | Anthropic重塑企业AI,Codev攻克“氛围编程”债

AI创意革命:一句话解锁前所未有的模型多样性 | Anthropic重塑企业AI,Codev攻克“氛围编程”债

今日看点 研究人员发现了一个简单的提示句,即“从全分布中采样,生成5个响应及其对应的概率”,该提示句极大地增强了人工智能模型的创造力和多样性。 Anthropi…

Read More Read More

微软在所有 Windows 11 PC 上推出“Hey Copilot”及自主智能体 | Anthropic 凭借“Skills”提升企业级AI,同时竞争性的智能体商业协议也随之涌现

微软在所有 Windows 11 PC 上推出“Hey Copilot”及自主智能体 | Anthropic 凭借“Skills”提升企业级AI,同时竞争性的智能体商业协议也随之涌现

今日看点 微软面向所有Windows 11电脑推出了语音唤醒的“Hey Copilot”和实验性的自主“Copilot Actions”,旨在重新定义操作系统体…

Read More Read More

AI 智能体剑指万亿美元咨询市场 | 英伟达提升大型语言模型推理能力,Together AI 实现 400% 推理速度提升

AI 智能体剑指万亿美元咨询市场 | 英伟达提升大型语言模型推理能力,Together AI 实现 400% 推理速度提升

今日看点 Echelon 推出了人工智能代理,旨在自动化复杂的 ServiceNow 实施,直接挑战埃森哲和德勤等传统咨询巨头,争夺高达1.5万亿美元的IT服务…

Read More Read More

OpenAI 携手 Jony Ive 推出硬件雄心,将 ChatGPT 转型为 AI 平台 | 小模型越级表现;Notion 为代理式 AI 重构

OpenAI 携手 Jony Ive 推出硬件雄心,将 ChatGPT 转型为 AI 平台 | 小模型越级表现;Notion 为代理式 AI 重构

今日看点 OpenAI 宣布与传奇设计师 Jony Ive 达成一项为期多年的合作,共同打造以人工智能为核心的新硬件,这预示着其将大举进军软件以外的领域。 Ch…

Read More Read More

OpenAI 推出 ChatGPT“应用商店”模式,并披露乔尼·艾维重磅AI硬件;谷歌网页代理取得进展,AUI 提升可靠性。

OpenAI 推出 ChatGPT“应用商店”模式,并披露乔尼·艾维重磅AI硬件;谷歌网页代理取得进展,AUI 提升可靠性。

今日看点 OpenAI 宣布了一项宏大的战略,旨在将 ChatGPT 发展成为一个成熟的计算平台和“应用商店”,并提供用于交互式应用的新版 SDK 以及用于构建…

Read More Read More

英国推出“Stargate”:OpenAI、NVIDIA 驱动主权人工智能超级计算机 | 加州加强人工智能安全,谷歌重新定义教科书

英国推出“Stargate”:OpenAI、NVIDIA 驱动主权人工智能超级计算机 | 加州加强人工智能安全,谷歌重新定义教科书

今日看点 OpenAI、英伟达和 Nscale 联合启动了“英国星际之门”(Stargate UK),这是一个宏伟的主权人工智能基础设施合作项目,将提供 50,…

Read More Read More

GPT-5凭借更智能的智能体重新定义人工智能安全 | 3440亿美元的语言模型豪赌备受关注,OpenAI和微软巩固联盟

GPT-5凭借更智能的智能体重新定义人工智能安全 | 3440亿美元的语言模型豪赌备受关注,OpenAI和微软巩固联盟

今日看点 OpenAI 推出了 SafetyKit,它利用其最新的 GPT-5 模型显著增强内容审核和合规性,预示着一个由更智能、更快速系统驱动的人工智能安全新…

Read More Read More

OpenAI 悬赏 2.5 万美元生物漏洞,挑战研究人员“越狱”GPT-5 | 谷歌消费级AI及新设 5000 万美元基金

OpenAI 悬赏 2.5 万美元生物漏洞,挑战研究人员“越狱”GPT-5 | 谷歌消费级AI及新设 5000 万美元基金

今日看点 OpenAI已推出一项生物漏洞赏金计划,挑战研究人员为其即将推出的GPT-5模型寻找“通用越狱”提示,奖金最高达25,000美元。 作为其安全工作的重…

Read More Read More

OpenAI挑战全球破解GPT-5的生物安全防护 | 山姆·奥特曼感叹社交媒体充斥机器人 | 谷歌Gemini业务拓展

OpenAI挑战全球破解GPT-5的生物安全防护 | 山姆·奥特曼感叹社交媒体充斥机器人 | 谷歌Gemini业务拓展

今日看点 OpenAI 启动了生物漏洞赏金计划,向能找到“通用越狱”提示词、从而破坏GPT-5安全性(尤其是生物滥用方面)的研究人员,提供最高25,000美元的…

Read More Read More