Browsed by
Month: 2025 年 12 月

好莱坞和游戏产业面临AI的清算时刻 | Z80-μLM 将大语言模型缩小至 40KB | 谷歌预告 Gemini 3 Flash

好莱坞和游戏产业面临AI的清算时刻 | Z80-μLM 将大语言模型缩小至 40KB | 谷歌预告 Gemini 3 Flash

今日看点 2025年标志着好莱坞和视频游戏行业人工智能的一个重要转折点,其广泛采用未能带来积极成果,反而滋生了创意工作者和游戏玩家的不满。 一项显著的技术成就,…

Read More Read More

Gemini 3 在谷歌里程碑式的2025年AI评估中占据中心舞台;好莱坞票房惨淡,游戏界因生成式技术爆发轩然大波

Gemini 3 在谷歌里程碑式的2025年AI评估中占据中心舞台;好莱坞票房惨淡,游戏界因生成式技术爆发轩然大波

今日看点 谷歌的年终回顾突出强调了“Gemini 3”是一项重大的研究突破,预示着其AI能力取得了重大进展。 好莱坞于2025年积极采用生成式人工智能,用于“去…

Read More Read More

安德罗匹克 推出“代理技能”作为开放标准,重塑企业人工智能 | 谷歌的 Gemini 3 Flash 加速,Palona 垂直转型

安德罗匹克 推出“代理技能”作为开放标准,重塑企业人工智能 | 谷歌的 Gemini 3 Flash 加速,Palona 垂直转型

今日看点 Anthropic 发布了其“Agent Skills”技术,作为一项开放标准,使AI助手能够通过可复用模块一致地执行专业任务,并已立即获得微软、Op…

Read More Read More

谷歌的 Gemini 3 Flash 重新定义企业人工智能价值 | Anthropic 发布开放代理标准,Palona 进军垂直领域

谷歌的 Gemini 3 Flash 重新定义企业人工智能价值 | Anthropic 发布开放代理标准,Palona 进军垂直领域

今日看点 谷歌发布了Gemini 3 Flash,这是一款经济高效、高速的大语言模型,为企业AI领域的“专业级推理”设定了新基准,并在关键基准测试中超越了竞争对…

Read More Read More

Anthropic 开源“智能体技能”以定义企业级AI | 谷歌经济高效的 Gemini 3 Flash 登场,OpenAI 推出新型编码模型

Anthropic 开源“智能体技能”以定义企业级AI | 谷歌经济高效的 Gemini 3 Flash 登场,OpenAI 推出新型编码模型

今日看点 Anthropic已发布其“Agent Skills”(代理技能)技术作为一项开放标准,旨在促进业界在针对专业AI任务的模块化方法上趋同,微软已采纳该…

Read More Read More

Anthropic为智能体技能制定的开放标准引发行业融合;谷歌首次推出经济高效的Gemini 3 Flash;Palona AI进行垂直转型

Anthropic为智能体技能制定的开放标准引发行业融合;谷歌首次推出经济高效的Gemini 3 Flash;Palona AI进行垂直转型

今日看点 Anthropic 已将其“Agent Skills”技术作为开放标准发布,旨在定义 AI 助手如何学习和执行专业任务,此举已得到 OpenAI 采用…

Read More Read More

韩国初创公司 Motif 揭示了企业级LLM推理的关键,性能超越 GPT-5.1 | OpenAI 的 GPT-5.2 在科学领域表现出色,字节级模型推动多语言AI发展

韩国初创公司 Motif 揭示了企业级LLM推理的关键,性能超越 GPT-5.1 | OpenAI 的 GPT-5.2 在科学领域表现出色,字节级模型推动多语言AI发展

今日看点 韩国初创公司 Motif Technologies 发布了一款拥有127亿参数的开放权重模型,该模型在基准测试中超越了 OpenAI 的 GPT-5….

Read More Read More

OpenAI 发布 GPT-5.2,以“红色警报”回应谷歌,重夺AI性能桂冠 | Nous Research 的开源 Nomos 1 达到近乎人类精英的数学能力

OpenAI 发布 GPT-5.2,以“红色警报”回应谷歌,重夺AI性能桂冠 | Nous Research 的开源 Nomos 1 达到近乎人类精英的数学能力

今日看点 OpenAI 正式推出了其最新的前沿大型语言模型 GPT-5.2,该模型引入了全新的“Thinking”和“Pro”层级,旨在主导专业知识工作、编程以…

Read More Read More

70% 的“事实准确率”门槛:为什么谷歌的 AI 基准测试与其说是欢迎垫,不如说更像是一种警示

70% 的“事实准确率”门槛:为什么谷歌的 AI 基准测试与其说是欢迎垫,不如说更像是一种警示

引言: 又一周,又一个基准测试。然而,谷歌新的FACTS基准测试套件不仅仅是另一个光鲜亮丽的排行榜;它是一面严峻而发人深省的镜子,反映出当今备受吹捧的生成式人工…

Read More Read More

AI一周内设计出功能齐全的Linux电脑,一次启动成功 · 谷歌推出新的事实性基准 · OpenAI揭示6倍生产力差距

AI一周内设计出功能齐全的Linux电脑,一次启动成功 · 谷歌推出新的事实性基准 · OpenAI揭示6倍生产力差距

今日看点 Quilter的人工智能在一周内设计了一台由843个部件组成的Linux电脑,将一个为期三个月的工程任务所需的人工投入时间缩减到38.5小时,这标志着…

Read More Read More

AI 战胜“上下文衰减”:双智能体记忆超越长上下文大模型 | OpenAI 的“吐真剂”与 GPT-5.2 竞速谷歌

AI 战胜“上下文衰减”:双智能体记忆超越长上下文大模型 | OpenAI 的“吐真剂”与 GPT-5.2 竞速谷歌

今日看点 一个名为通用智能体记忆(GAM)的新型双智能体记忆架构,通过维护无损的历史记录并智能地检索精确细节,解决了大型语言模型(LLM)中的“上下文腐烂”问题…

Read More Read More

OpenAI 宣布“红色警报”,GPT-5.2 即将发布以对抗谷歌 | 突破性内存架构解决“上下文腐烂”问题,AWS 释放AI编码能力

OpenAI 宣布“红色警报”,GPT-5.2 即将发布以对抗谷歌 | 突破性内存架构解决“上下文腐烂”问题,AWS 释放AI编码能力

今日看点 OpenAI 正在加紧下周发布 GPT-5.2,作为对谷歌 Gemini 3 的“红色警报”级别竞争性回应,此举加剧了对 LLM 霸主地位的争夺。 研…

Read More Read More

亚马逊推出可连续数天编程的自主“先锋代理” | Gemini 3 获得里程碑式信任评分 | 谷歌简化代理采用

亚马逊推出可连续数天编程的自主“先锋代理” | Gemini 3 获得里程碑式信任评分 | 谷歌简化代理采用

今日看点 亚马逊云计算 (AWS) 推出了“前沿代理”——一类新型的自主人工智能系统(Kiro、安全、DevOps代理),能够持续多日完成复杂的软件开发、安全和…

Read More Read More

自主开发者已至:亚马逊AI智能体无需干预即可连续数日编码;Mistral 3 的开源攻势与诺顿安全AI浏览器相继亮相。

自主开发者已至:亚马逊AI智能体无需干预即可连续数日编码;Mistral 3 的开源攻势与诺顿安全AI浏览器相继亮相。

今日看点 亚马逊网络服务 (AWS) 推出了一类新型的自主人工智能系统——“前沿智能体”,旨在连续数日无需人工干预地执行复杂的软件开发、安全和IT运维任务,这标…

Read More Read More

Anthropic 宣称在智能体长效记忆方面取得突破;《2025 AI 回顾》聚焦 OpenAI 的开放权重与中国开源浪潮

Anthropic 宣称在智能体长效记忆方面取得突破;《2025 AI 回顾》聚焦 OpenAI 的开放权重与中国开源浪潮

今日看点 Anthropic 公司推出了一种两部分解决方案,旨在解决 AI 智能体持久记忆的难题,该方案利用初始化智能体和编码智能体来管理跨离散会话的上下文。 …

Read More Read More