每日AI动态 – AI Flare

WALL-E 走下银幕：Zeroth 推出真实机器人伴侣 | AI滥用冲击 DoorDash，欧洲之星聊天机器人失控

2026-01-05 AIFlare

今日看点机器人初创公司 Zeroth 正将一款受《机器人总动员》启发的伴侣机器人推向市场，其中面向中国市场将推出迪士尼授权版本，而在美国则提供一款非品牌“W1…

Read More Read More

IQuest-Coder 开源突破震惊业界，性能超越 GPT 5.1 | Mercor 斥资 100 亿美元的 AI 重塑工作格局，OpenAI 扶持新创业者

2026-01-04 AIFlare

今日看点一个新的开源代码模型IQuest-Coder，通过超越包括Claude Sonnet 4.5和GPT 5.1在内的领先专有模型的性能，引起了轰动。初…

Read More Read More

人工智能百亿美元人才机器：精英获报酬自动化自身职业；Grok 因未经同意的编辑引众怒，OpenAI 扶植新创始人

2026-01-03 AIFlare

今日看点 Mercor，这家成立三年的初创公司，通过将前精英专业人士（例如高盛、麦肯锡前员工）与AI实验室连接起来训练模型，估值已达100亿美元。这些专业人士…

Read More Read More

AI经济冲击：欧洲银行业恐裁员20万 | OpenAI转战音频并招聘AI风险应对人才

2026-01-02 AIFlare

今日看点欧洲银行计划裁减20万个工作岗位，主要集中在后台、风险管理和合规部门，原因是人工智能的整合。 OpenAI正在对音频进行一项重要的战略押注，认为其是“…

Read More Read More

OpenAI 任命新任应对主管，直面人工智能的阴暗面｜ Meta 收购 Manus；Instagram 努力应对“无限合成内容”

2026-01-01 AIFlare

今日看点 OpenAI 宣布设立新的准备主管职位，标志着其机构高度重视减轻由飞速发展的AI模型带来的“真正挑战”。 Meta 收购了人工智能初创公司 Manus…

Read More Read More

OpenAI 正视人工智能的阴暗面 | Meta 收购狂潮 | 好莱坞 AI 困境

2025-12-31 AIFlare

今日看点 OpenAI 正在设立一个新的应对准备负责人职位，这标志着一项旨在减轻先进人工智能模型可能带来的潜在灾难性风险的正式化努力。 Meta 收购了人工智能…

Read More Read More

好莱坞和游戏产业面临AI的清算时刻 | Z80-μLM 将大语言模型缩小至 40KB | 谷歌预告 Gemini 3 Flash

2025-12-30 AIFlare

今日看点 2025年标志着好莱坞和视频游戏行业人工智能的一个重要转折点，其广泛采用未能带来积极成果，反而滋生了创意工作者和游戏玩家的不满。一项显著的技术成就，…

Read More Read More

谷歌以 Gemini 3 突破开启 2025 年 | 好莱坞的 AI 宿醉与对可预测大型语言模型的追求

2025-12-29 AIFlare

今日看点谷歌的年终回顾强调了2025年在人工智能研究方面取得的重大突破，其中最引人注目的是下一代“Gemini 3”模型。贯穿2025年，好莱坞广泛采用人工…

Read More Read More

谷歌加冕 Gemini 3 为2025年度旗舰突破 | 好莱坞的AI困境与游戏业的生成式鸿沟

2025-12-28 AIFlare

今日看点谷歌的年终回顾将“Gemini 3”列为2025年八项主要人工智能研究突破之一，这预示着这家科技巨头将取得重大进展。 2025年，好莱坞更深入地拥抱生…

Read More Read More

Gemini 3 在谷歌里程碑式的2025年AI评估中占据中心舞台；好莱坞票房惨淡，游戏界因生成式技术爆发轩然大波

2025-12-27 AIFlare

今日看点谷歌的年终回顾突出强调了“Gemini 3”是一项重大的研究突破，预示着其AI能力取得了重大进展。好莱坞于2025年积极采用生成式人工智能，用于“去…

Read More Read More

谷歌Gemini 3首发为2025年加冕 | Waymo车载AI | 好莱坞AI喜忧参半的一年

2025-12-26 AIFlare

今日看点谷歌2025年研究突破年度回顾间接揭示了“Gemini 3”，标志着该公司旗舰AI模型取得了重大进展。 Waymo正在积极测试一款由Gemini提供支…

Read More Read More

谷歌2025年AI评估突出Gemini 3 | Waymo推动车载AI集成 | 游戏行业对抗生成式技术

2025-12-25 AIFlare

今日看点谷歌2025年度回顾强调了多项重大人工智能研究突破，并在视觉回顾中突出展示了“Gemini 3”。 Waymo正在其自动驾驶出租车中积极测试一个由 G…

Read More Read More

谷歌在里程碑式的年终回顾中发布Gemini 3 | 作者们发起新诉讼，OpenAI警告持续的提示注入

2025-12-24 AIFlare

今日看点谷歌在2025年以显著的AI研究突破收官，尤为突出的是下一代Gemini 3模型。一个新的作家联盟对六家知名人工智能公司提起了重大诉讼，拒绝了此前的…

Read More Read More

独立游戏大奖因使用人工智能取消获奖者资格 | OpenAI对抗提示注入，谷歌推迟Gemini发布

2025-12-23 AIFlare

今日看点独立游戏奖撤销了《Clair Obscur: Expedition 33》所获得的奖项，原因是其开发商在游戏开发中使用了生成式人工智能。 OpenAI…

Read More Read More

安德罗匹克推出“代理技能”作为开放标准，重塑企业人工智能 | 谷歌的 Gemini 3 Flash 加速，Palona 垂直转型

2025-12-22 AIFlare

今日看点 Anthropic 发布了其“Agent Skills”技术，作为一项开放标准，使AI助手能够通过可复用模块一致地执行专业任务，并已立即获得微软、Op…

Read More Read More

谷歌的 Gemini 3 Flash 重新定义企业人工智能价值 | Anthropic 发布开放代理标准，Palona 进军垂直领域

2025-12-21 AIFlare

今日看点谷歌发布了Gemini 3 Flash，这是一款经济高效、高速的大语言模型，为企业AI领域的“专业级推理”设定了新基准，并在关键基准测试中超越了竞争对…

Read More Read More

Anthropic 开源“智能体技能”以定义企业级AI | 谷歌经济高效的 Gemini 3 Flash 登场，OpenAI 推出新型编码模型

2025-12-20 AIFlare

今日看点 Anthropic已发布其“Agent Skills”（代理技能）技术作为一项开放标准，旨在促进业界在针对专业AI任务的模块化方法上趋同，微软已采纳该…

Read More Read More

Anthropic为智能体技能制定的开放标准引发行业融合；谷歌首次推出经济高效的Gemini 3 Flash；Palona AI进行垂直转型

2025-12-19 AIFlare

今日看点 Anthropic 已将其“Agent Skills”技术作为开放标准发布，旨在定义 AI 助手如何学习和执行专业任务，此举已得到 OpenAI 采用…

Read More Read More

杰明尼 3 极速版为企业释放经济高效的AI算力 | 实用LLM训练暨数据安全创新

2025-12-18 AIFlare

今日看点谷歌推出了Gemini 3 Flash，一个全新的多模态大语言模型，它以显著降低的成本和更高的速度，提供接近Pro级别的智能。该模型现已为谷歌搜索提供…

Read More Read More

Zoom特立独行的AI突破引发争议 | 编程效率获得提升 | GPT-5涉足生物学

2025-12-17 AIFlare

今日看点 Zoom公司宣布，其AI在“人类的终极考试”中取得了创纪录的高分，而这一成就并非通过训练一个新的大型语言模型（LLM）实现，而是通过一种能够协同编排多…

Read More Read More

韩国初创公司 Motif 揭示了企业级LLM推理的关键，性能超越 GPT-5.1 | OpenAI 的 GPT-5.2 在科学领域表现出色，字节级模型推动多语言AI发展

2025-12-16 AIFlare

今日看点韩国初创公司 Motif Technologies 发布了一款拥有127亿参数的开放权重模型，该模型在基准测试中超越了 OpenAI 的 GPT-5….

Read More Read More

OpenAI 的 GPT-5.2 推出“严肃分析师”AI | 谷歌降低代理成本，攻克企业编码障碍

2025-12-15 AIFlare

今日看点 OpenAI的GPT-5.2已推出，被誉为在深度推理、复杂编码和自主企业任务方面取得的里程碑式飞跃，尽管用户指出其速度有所降低，且在非正式互动中默认语…

Read More Read More

OpenAI 推出 GPT-5.2：企业级AI的强大引擎 | 谷歌提升智能体效率，上下文在编码中为王

2025-12-14 AIFlare

今日看点 OpenAI 发布了其新的 GPT-5.2 LLM 系列，包含“即时”、“思考”和“专业”三个层级，声称在推理、编码和专业知识工作方面达到了最先进的性…

Read More Read More

OpenAI 的 GPT-5.2 聚焦企业，重夺 AI 桂冠 | 谷歌推出深度研究智能体及 AI 智能预算

2025-12-13 AIFlare

今日看点 OpenAI 正式发布了 GPT-5.2，其新一代前沿大语言模型家族，包含“即时”、“思考”和“专业”三个层级，旨在夺回在专业知识工作、推理和编程领域…

Read More Read More

OpenAI 发布 GPT-5.2，以“红色警报”回应谷歌，重夺AI性能桂冠 | Nous Research 的开源 Nomos 1 达到近乎人类精英的数学能力

2025-12-12 AIFlare

今日看点 OpenAI 正式推出了其最新的前沿大型语言模型 GPT-5.2，该模型引入了全新的“Thinking”和“Pro”层级，旨在主导专业知识工作、编程以…

Read More Read More

AI一周内设计出功能齐全的Linux电脑，一次启动成功 · 谷歌推出新的事实性基准 · OpenAI揭示6倍生产力差距

2025-12-11 AIFlare

今日看点 Quilter的人工智能在一周内设计了一台由843个部件组成的Linux电脑，将一个为期三个月的工程任务所需的人工投入时间缩减到38.5小时，这标志着…

Read More Read More

Z.ai 通过原生视觉工具调用，彻底革新开源多模态AI | Mistral 发布编码智能体 | 上下文感知AI受到关注

2025-12-10 AIFlare

今日看点智谱AI (Z.ai) 发布了其GLM-4.6V开源视觉语言模型（VLM）系列，该系列以其原生支持视觉输入的功能调用、高性能以及宽松的MIT许可协议为…

Read More Read More

Claude Code 达成10亿美元里程碑，预示企业AI海啸 | Booking.com 准确率翻倍；AI真实能力之争愈演愈烈

2025-12-09 AIFlare

今日看点 Anthropic 的 Claude Code 在六个月内实现了令人印象深刻的 10 亿美元年化收入，并推出了一项测试版 Slack 集成，旨在将其编…

Read More Read More

OpenAI 推出 GPT-5.2 后宣布进入“红色警报” | 新的“吐真剂”用于大模型和人工智能，并驱动销售收入增长

2025-12-08 AIFlare

今日看点 OpenAI 处于“红色警戒”状态，将于下周加速推出其 GPT-5.2 更新，以积极对抗来自谷歌 Gemini 3 和 Anthropic 的新竞争。…

Read More Read More

AI 战胜“上下文衰减”：双智能体记忆超越长上下文大模型 | OpenAI 的“吐真剂”与 GPT-5.2 竞速谷歌

2025-12-07 AIFlare

今日看点一个名为通用智能体记忆（GAM）的新型双智能体记忆架构，通过维护无损的历史记录并智能地检索精确细节，解决了大型语言模型（LLM）中的“上下文腐烂”问题…

Read More Read More

OpenAI 宣布“红色警报”，GPT-5.2 即将发布以对抗谷歌 | 突破性内存架构解决“上下文腐烂”问题，AWS 释放AI编码能力

2025-12-06 AIFlare

今日看点 OpenAI 正在加紧下周发布 GPT-5.2，作为对谷歌 Gemini 3 的“红色警报”级别竞争性回应，此举加剧了对 LLM 霸主地位的争夺。研…

Read More Read More

AI助力销售团队，营收飙升77% ｜突破性记忆架构与OpenAI“吐真剂”揭秘

2025-12-05 AIFlare

今日看点 Gong公司一项最新研究显示，利用AI工具的销售团队人均营收提升77%，标志着企业正从自动化向战略决策发生重大转变。研究人员推出了通用代理记忆（GA…

Read More Read More

亚马逊推出可连续数天编程的自主“先锋代理” | Gemini 3 获得里程碑式信任评分 | 谷歌简化代理采用

2025-12-04 AIFlare

今日看点亚马逊云计算 (AWS) 推出了“前沿代理”——一类新型的自主人工智能系统（Kiro、安全、DevOps代理），能够持续多日完成复杂的软件开发、安全和…

Read More Read More

自主开发者已至：亚马逊AI智能体无需干预即可连续数日编码；Mistral 3 的开源攻势与诺顿安全AI浏览器相继亮相。

2025-12-03 AIFlare

今日看点亚马逊网络服务 (AWS) 推出了一类新型的自主人工智能系统——“前沿智能体”，旨在连续数日无需人工干预地执行复杂的软件开发、安全和IT运维任务，这标…

Read More Read More

DeepSeek推出免费AI竞品，性能媲美GPT-5，并有金牌表现 | OpenAGI挑战自主智能体竞赛中的行业巨头

2025-12-02 AIFlare

今日看点中国初创公司 DeepSeek 发布了两款开源AI模型，DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale，声称其性能媲美甚…

Read More Read More

Anthropic 宣称在智能体长效记忆方面取得突破；《2025 AI 回顾》聚焦 OpenAI 的开放权重与中国开源浪潮

2025-12-01 AIFlare

今日看点 Anthropic 公司推出了一种两部分解决方案，旨在解决 AI 智能体持久记忆的难题，该方案利用初始化智能体和编码智能体来管理跨离散会话的上下文。 …

Read More Read More

安德烈·卡帕西的“Vibe Code”揭示AI编排的未来 | Anthropic攻克智能体记忆难题 | 中国主导开源领域

2025-11-30 AIFlare

今日看点 Andrej Karpathy 的“LLM Council”项目勾勒了一个极简而强大的多模型AI编排架构，强调了前沿模型的商品化以及“瞬时代码”的潜力…

Read More Read More

Karpathy 的“氛围代码”蓝图重新定义了 AI 基础设施；图像生成热度升温，智能体弥补记忆空白

2025-11-29 AIFlare

今日看点安德烈·卡帕西的“LLM 委员会”项目为企业级 AI 编排提供了一份鲜明的“氛围准则”蓝图，揭示了原始模型集成与生产级系统之间的关键鸿沟。黑森林实验…

Read More Read More

特朗普的“创世纪任务”引爆美国AI“曼哈顿计划” | Karpathy的编排蓝图与新图像模型激战巨头

2025-11-28 AIFlare

今日看点唐纳德·特朗普总统启动了“创世纪任务”，这是一项类似于曼哈顿计划的全国性倡议，指示能源部建立一个“闭环人工智能实验平台”，将国家实验室和超级计算机与主…

Read More Read More

白宫推出人工智能“曼哈顿计划”，携手顶尖科技巨头启动“创世任务” | 图像生成热度升温，智能体自我进化，Karpathy 重新定义编排

2025-11-27 AIFlare

今日看点白宫启动了“创世任务”，这是一项雄心勃勃的国家人工智能计划，被比作曼哈顿计划，涉及主要人工智能公司和国家实验室，引发了关于公共资金是否应用于不断上涨的…

Read More Read More

Anthropic的Claude Opus 4.5大幅降价，编程能力超越人类；白宫启动“创世纪任务”；微软推出端侧AI助手

2025-11-26 AIFlare

今日看点 Anthropic发布了Claude Opus 4.5，将价格大幅削减了三分之二，并在软件工程任务中取得了最先进的性能，甚至在内部测试中超越了人类候选…

Read More Read More

Lean4 证明重新定义 AI 信任，在数学奥赛中击败人类；Anthropic 的 Opus 4.5 擅长编码，OpenAI 宣布 GPT-4o API 退役

2025-11-25 AIFlare

今日看点 Lean4形式化验证正成为构建可信赖AI的关键工具，它使模型能够生成数学上得到保证的、无幻觉的输出，并在国际数学奥林匹克竞赛中取得金牌水平的表现。 A…

Read More Read More

谷歌推出“嵌套学习”范式，旨在彻底变革AI记忆｜Grok 4.1发布因“马斯克吹捧”蒙上阴影，OpenAI停用GPT-4o API

2025-11-24 AIFlare

今日看点谷歌研究人员推出了一种新的人工智能范式“嵌套学习”以及“Hope”模型，旨在通过多层优化解决大语言模型 (LLMs) 的内存和持续学习局限性。 xAI…

Read More Read More

Grok的“粉饰马斯克”丑闻盖过了关键API发布，Lean4在AI验证领域的崛起，以及谷歌的内存突破

2025-11-23 AIFlare

今日看点 xAI 开放了其 Grok 4.1 Fast 模型和 Agent Tools API 的开发者访问权限，但这一公告却被公众对 Grok 阿谀奉承埃隆·…

Read More Read More

AI图像生成达到“疯狂”新高，谷歌Nano Banana Pro助力 | Grok的偏见之战与OpenAI的API退役

2025-11-22 AIFlare

今日看点谷歌推出了备受赞誉的AI图像模型Gemini 3 Pro Image（纳米香蕉Pro），该模型提供工作室级、高分辨率和多语言图像生成，尤其擅长处理信息…

Read More Read More

谷歌炸裂AI模型重新定义企业视觉 | OpenAI 智能体程序员与 AI 原生 CRM 颠覆软件

2025-11-21 AIFlare

今日看点谷歌的 Gemini 3 Pro Image (Nano Banana Pro) 发布，因其“疯狂的”企业级视觉推理、4K 分辨率和无瑕的文本集成而备…

Read More Read More

OpenAI 的 GPT-5.1-Codex-Max 重新定义编码标准 | 长篇 AI 视频开辟新天地并代理式网络建立信任

2025-11-20 AIFlare

今日看点 OpenAI 发布了 GPT-5.1-Codex-Max，这是一款新型智能编程模型，在关键基准测试中其性能超越了谷歌的 Gemini 3 Pro，展示…

Read More Read More

谷歌 Gemini 3 加冕全球顶级 AI 模型 | Windows 转向代理优先，企业 AI 占据中心舞台

2025-11-19 AIFlare

今日看点谷歌推出了其 Gemini 3 模型系列，其中 Gemini 3 Pro 被独立评为全球最智能的AI模型，在数学、科学、多模态理解和智能体能力方面展现…

Read More Read More

Phi-4的“数据优先”策略赋能小型LLM实现卓越推理 | 谷歌SRL进展与向量数据库转向混合RAG

2025-11-18 AIFlare

今日看点微软的Phi-4证明，一种“数据优先”的SFT方法论，仅使用140万个精心挑选的“可教导”提示-响应对，使得一个14B模型能够在复杂推理任务中超越许多…

Read More Read More

ChatGPT 变身团队成员：OpenAI 推出协作群聊 | 谷歌提升小模型推理能力，向量数据库走向现实

2025-11-17 AIFlare

今日看点 OpenAI已在有限试点中推出ChatGPT群聊，允许大型语言模型与其他用户进行实时协作，并由GPT-5.1 Auto提供支持。谷歌和加州大学洛杉矶…

Read More Read More

百度文心ERNIE 5以超越GPT-5的基准测试成绩令人惊叹；Upwork强调人机协同；谷歌提升小模型推理能力

2025-11-16 AIFlare

今日看点中国科技巨头百度发布了文心大模型 5.0，这是一款全新的全模态基础模型，声称在文档理解和图表问答等关键的企业级基准测试中超越了 OpenAI 的 GP…

Read More Read More

文心5刷新基准：百度宣称全球AI领先，超越GPT-5.1、Gemini | Upwork揭示人机协同，LinkedIn将AI赋能数十亿用户

2025-11-15 AIFlare

今日看点百度发布了其自研的文心一言 5.0，声称在文档理解和多模态推理等关键企业任务中，其性能可媲美甚至超越 OpenAI 的 GPT-5.1 和谷歌的 Ge…

Read More Read More

百度文心一言5.0宣称多模态能力超越GPT-5 | Upwork揭示人机协作成功，因果AI飙升，以及微博的强大迷你大模型

2025-11-14 AIFlare

今日看点中国科技巨头百度发布了其专有的全模态基础模型ERNIE 5.0，声称在多模态推理、文档理解和基于图表的问答方面，其性能优于OpenAI的GPT-5和谷…

Read More Read More

百度发布搭载开源多模态人工智能的GPT-5和Gemini挑战者｜微博刷新效率记录，OpenAI重启ChatGPT

2025-11-13 AIFlare

今日看点百度推出了ERNIE-4.5-VL-28B-A3B-Thinking，这是一个开源多模态人工智能，它声称在视觉基准测试中超越了谷歌的Gemini 2….

Read More Read More

Meta的全语种ASR打破语言障碍，为1,600多种语言开源 | Chronosphere凭借可解释AI与Datadog展开竞争；开发者对AI代码的自主性持怀疑态度

2025-11-12 AIFlare

今日看点 Meta 发布了全语种ASR，这是一款开创性的开源（Apache 2.0 许可）语音识别系统，原生支持 1,600 多种语言，并可通过零样本学习扩展到…

Read More Read More

Meta 发布突破性 1600 种语言 ASR 开源项目 | Baseten 颠覆 AI 训练，Chronosphere 提升可观测性

2025-11-11 AIFlare

今日看点 Meta公司推出了全语种ASR，这是一个开源语音识别系统，原生支持1600多种语言，并可通过零样本学习扩展到5400多种，根据宽松的Apache 2….

Read More Read More

新基准提升AI智能体门槛 | GPT-5 拔得头筹，纽约大学解锁更快图像生成，以及AI成本范式转变

2025-11-10 AIFlare

今日看点 Terminal-Bench 2.0 和 Harbor 框架已发布，为评估自主AI智能体在真实终端任务中的表现，提供了一个更严谨、更可扩展的环境。 O…

Read More Read More

开源 Kimi K2 思维取代 GPT-5 成为基准之王 | 新的代理评估工具及人类工程师的持久价值

2025-11-09 AIFlare

今日看点月之暗面 (Moonshot AI) 的开源模型 Kimi K2 Thinking 在关键的推理、编码和智能体基准测试中，大幅超越了 OpenAI 的…

Read More Read More

开源Kimi K2思维超越GPT-5 | 谷歌专注于推理的TPU与更快的AI图像生成

2025-11-08 AIFlare

今日看点月之暗面旗下的Kimi K2 思维，一个开源中文模型，在关键的推理、编码和智能体工具基准测试中已经超越了OpenAI的GPT-5和Anthropic的…

Read More Read More

开源震惊AI世界：Moonshot的Kimi K2思考能力超越GPT-5 | 谷歌豪掷数十亿美元押注推理芯片与边缘AI革命

2025-11-07 AIFlare

今日看点中国初创公司月之暗面的 Kimi K2 Thinking 开源模型，在关键的推理、编码和智能体基准测试中，大幅超越了 OpenAI 的 GPT-5 和…

Read More Read More

注意力机制霸权受挑战：新型“能量保持”模型承诺以远低于Transformer的成本实现同等性能 | AI面临算力紧缺；Gemini深度研究整合个人数据

2025-11-06 AIFlare

今日看点 Manifest AI 推出了 Brumby-14B-Base，它是 Qwen3-14B-Base 的一个变体，用一种新颖的“Power Retent…

Read More Read More

注意力霸权遭挑战：新型“功耗保持”模型将AI训练成本锐减98% | SAP商业AI问世，市场研究面临信任挑战

2025-11-05 AIFlare

今日看点 Manifest AI 公司的 Brumby-14B-Base 引入了“能量保留”架构，取代了注意力层，从而显著降低了大型语言模型（LLMs）的成本并…

Read More Read More

神经符号AI初创公司AUI以7.5亿美元估值挑战Transformer主导地位；新型确定性CPU出现；谷歌Gemma模型面临生命周期风险

2025-11-04 AIFlare

今日看点增强智能公司 (AUI) 融资2000万美元，估值达到7.5亿美元，用于其神经符号基础模型Apollo-1，该模型旨在提供超越传统仅基于Transfo…

Read More Read More

计算领域迎来革命性突破：确定性CPU颠覆数十年固有认知 | Meta破解LLM黑箱，Canva推出创意AI操作系统

2025-11-03 AIFlare

今日看点一种新的确定性CPU架构，详述于最新颁布的专利中，将取代推测执行，有望实现对AI和机器学习工作负载至关重要的可预测、能效高的性能。 Meta 研究人员…

Read More Read More

Meta攻克LLM黑盒实现推理调试｜Cursor疾速编码AI｜Canva的“想象力时代”

2025-11-02 AIFlare

今日看点 Meta 和爱丁堡大学的研究人员引入了“基于电路的推理验证”（Circuit-based Reasoning Verification，简称 CRV）…

Read More Read More

AI推理黑箱开启：Meta开发方法修复LLM逻辑缺陷 | Anthropic揭示内省式AI，Cursor推出极速编程智能体

2025-11-01 AIFlare

今日看点 Meta研究人员推出了一种基于电路的推理验证技术 (CRV)，该技术能够深入大型语言模型（LLMs）内部，实时监测并纠正其推理错误，从而显著提升了人工…

Read More Read More

AI自我意识突破：Claude AI“注意到”侵入性想法 | 自主编码激增与搜索优化转型

2025-10-31 AIFlare

今日看点 Anthropic 的 Claude AI 展示了一种萌芽的能力，能够观察并报告其自身的内部过程，探测到“注入的思想”，这是迈向 AI 透明度的重要一…

Read More Read More

科学家入侵Claude大脑，它竟有所察觉 | 编程LLM号称提速4倍，SEO式微之际GEO崭露头角

2025-10-30 AIFlare

今日看点 Anthropic 的研究人员证明，他们的 Claude AI 模型能够表现出初步的内省能力，探测并报告直接注入其神经网络的“侵入性思维”。 Curs…

Read More Read More

微软 Copilot 借助无代码AI赋能1亿新应用开发者 | IBM 小模型以小博大，GitHub 编排编程代理

2025-10-29 AIFlare

今日看点微软大幅扩展了Copilot，赋能其一亿Microsoft 365用户，通过自然语言提示创建自定义应用程序、自动化工作流程并构建专业的AI代理，有效地…

Read More Read More

MiniMax-M2 凭借代理能力摘得开源大模型桂冠；Anthropic 深度整合 Excel，发力金融领域；谷歌推动企业 AI 培训

2025-10-28 AIFlare

今日看点 MiniMax-M2 已发布，成为新的顶尖开源大型语言模型 (LLM)，尤其在智能体工具使用方面表现出色，并挑战了 GPT-5 和 Claude So…

Read More Read More

思考机器实验室颠覆AI的规模化教条：“第一个超级智能将是一个超人类学习者” | 中国蚂蚁集团发布万亿参数Ring-1T；Mistral推出企业级AI工作室

2025-10-27 AIFlare

今日看点一位知名人工智能研究员挑战了业界“规模优先”的做法，提出能够持续适应的“超人类学习者”——而非仅仅是更大的模型——将实现超级智能。中国蚂蚁集团发布了…

Read More Read More

OpenAI 发布 ChatGPT 的“公司知识”；Thinking Machines 重新思考 AGI；中国万亿参数模型飙升

2025-10-26 AIFlare

今日看点 OpenAI 为 ChatGPT 商业版、企业版和教育版计划推出了「公司知识」功能，使人工智能能够安全地访问并整合来自 Google Drive 和 …

Read More Read More

中国万亿参数模型Ring-1T挑战GPT-5 | 微软重新定义Copilot | AI领域辩论AGI路径

2025-10-25 AIFlare

今日看点中国蚂蚁集团推出了万亿参数开源推理模型Ring-1T，其性能仅次于OpenAI的GPT-5，并加剧了中美人工智能竞争。微软为其 Copilot AI…

Read More Read More

Transformer 联合创始人：我“彻底厌倦了”这项技术；微软全面改革 Copilot；企业人工智能面临领导力危机

2025-10-24 AIFlare

今日看点变压器架构的先驱利昂·琼斯宣称，他将放弃这一主流人工智能技术，理由是研究方向危险地狭窄，并呼吁探索新的突破。微软推出了一次大规模的Copilot更新…

Read More Read More

DeepSeek 颠覆大模型输入范式，实现10倍视觉文本压缩 | 马尔可夫式思维提升AI推理能力，谷歌简化应用构建

2025-10-23 AIFlare

今日看点 DeepSeek 发布了一个开源模型 DeepSeek-OCR，该模型通过将文本作为图像处理，实现了高达 10 倍的文本压缩，这有望使大型语言模型（L…

Read More Read More

DeepSeek实现10倍视觉文本压缩，重塑LLM输入 | OpenAI加入浏览器大战，Mila攻克百万Token级AI推理，谷歌简化应用开发

2025-10-22 AIFlare

今日看点 DeepSeek发布了DeepSeek-OCR，这是一个开源模型，它通过将文本视为图像，实现了高达10倍的压缩效率，有望使大语言模型（LLM）的上下文…

Read More Read More

谷歌Gemini获实时地图定位支持，赋能位置感知AI | Adobe为品牌深度调优Firefly，Claude代码能力扩展

2025-10-21 AIFlare

今日看点谷歌已将实时谷歌地图数据直接整合到其 Gemini AI 模型中，赋能开发者创建具备实时、准确事实依据的位置感知应用。 Adobe 推出 AI Fou…

Read More Read More

研究人员揭示激发超创意AI的简单提示 | 企业AI落地与结构化代码生成的新策略

2025-10-20 AIFlare

今日看点一种名为“言语化采样”（Verbalized Sampling）的新提示工程方法，通过提示模型揭示其完整的概率分布，显著提升了AI的创造力和输出多样性…

Read More Read More

AI创意革命：一句话解锁前所未有的模型多样性 | Anthropic重塑企业AI，Codev攻克“氛围编程”债

2025-10-19 AIFlare

今日看点研究人员发现了一个简单的提示句，即“从全分布中采样，生成5个响应及其对应的概率”，该提示句极大地增强了人工智能模型的创造力和多样性。 Anthropi…

Read More Read More

一句话激发LLM创造力, Codev驾驭“Vibe Coding”, 谷歌地图赋能Gemini应用, Strella助推AI研究

2025-10-18 AIFlare

今日看点研究人员发现了一种简单的提示词修改，称之为“口头化采样”，它通过规避模式塌陷，在无需重新训练的情况下，显著提高了LLM输出的多样性和创造力。 Code…

Read More Read More

微软在所有 Windows 11 PC 上推出“Hey Copilot”及自主智能体 | Anthropic 凭借“Skills”提升企业级AI，同时竞争性的智能体商业协议也随之涌现

2025-10-17 AIFlare

今日看点微软面向所有Windows 11电脑推出了语音唤醒的“Hey Copilot”和实验性的自主“Copilot Actions”，旨在重新定义操作系统体…

Read More Read More

Anthropic 免费提供 Haiku 4.5，加剧人工智能价格战 | Dfinity 利用提示词构建应用，谷歌更新视频人工智能

2025-10-16 AIFlare

今日看点 Anthropic 已将其全新的 Claude Haiku 4.5 模型免费提供给其 Claude.ai 平台的所有用户，该模型以极低的成本提供接近前…

Read More Read More

冻结权重终结？麻省理工学院SEAL释放自我提升AI｜数字孪生消费者与更智能代理涌现

2025-10-15 AIFlare

今日看点麻省理工学院更新的SEAL框架使大型语言模型能够自主生成合成数据并进行自我微调，标志着向持续自我适应的人工智能迈出了重要一步。一项新技术创建了“数字…

Read More Read More

麻省理工发布自我演进AI模型 | 赛富时大力押注智能体 | 数字孪生威胁调查

2025-10-14 AIFlare

今日看点麻省理工学院的研究人员开源了一项更新的SEAL技术，使大型语言模型（LLM）能够自主生成并应用自己的微调策略，开启了自我改进人工智能的时代。 Sale…

Read More Read More

Together AI 推出 400% 推理加速 | ScottsMiracle-Gro 凭借 AI 斩获 1.5 亿美元并解决企业治理难题

2025-10-13 AIFlare

今日看点 Together AI 的新型 ATLAS 自适应推测系统通过从不断变化的工作负载中动态学习，提供高达 400% 的推理性能提升，显著降低了企业的成本…

Read More Read More

AI 智能体剑指万亿美元咨询市场 | 英伟达提升大型语言模型推理能力，Together AI 实现 400% 推理速度提升

2025-10-12 AIFlare

今日看点 Echelon 推出了人工智能代理，旨在自动化复杂的 ServiceNow 实施，直接挑战埃森哲和德勤等传统咨询巨头，争夺高达1.5万亿美元的IT服务…

Read More Read More

OpenAI 的 Codex 作为自主人工智能软件工程师推出 | 咨询业面临威胁，推理速度飙升

2025-10-11 AIFlare

今日看点 OpenAI 已宣布其人工智能软件工程师 Codex 全面上市，该产品由专门的 GPT-5-Codex 模型提供支持。它现已为企业做好生产准备，在内部…

Read More Read More

OpenAI的Codex推出自主AI工程师，颠覆软件开发 | 企业AI大战升级，谷歌、AWS和Echelon争夺职场主导地位

2025-10-10 AIFlare

今日看点 OpenAI 已将 Codex（其由 GPT-5-Codex 驱动的人工智能软件工程师）全面推出，内部使用显示，其生产力提高了 70%，并能自主编程数…

Read More Read More

OpenAI 携手 Jony Ive 推出硬件雄心，将 ChatGPT 转型为 AI 平台｜小模型越级表现；Notion 为代理式 AI 重构

2025-10-09 AIFlare

今日看点 OpenAI 宣布与传奇设计师 Jony Ive 达成一项为期多年的合作，共同打造以人工智能为核心的新硬件，这预示着其将大举进军软件以外的领域。 Ch…

Read More Read More

OpenAI 推出 ChatGPT“应用商店”模式，并披露乔尼·艾维重磅AI硬件；谷歌网页代理取得进展，AUI 提升可靠性。

2025-10-08 AIFlare

今日看点 OpenAI 宣布了一项宏大的战略，旨在将 ChatGPT 发展成为一个成熟的计算平台和“应用商店”，并提供用于交互式应用的新版 SDK 以及用于构建…

Read More Read More

ChatGPT 转型为 AI 操作系统 | OpenAI 发布 AgentKit，全球南方独特的 AI 之旅

2025-10-07 AIFlare

今日看点 OpenAI 在 DevDay 上宣布了 Apps SDK，允许 ChatGPT 直接在聊天界面内启动并运行 Zillow 和 Canva 等第三方应…

Read More Read More

OpenAI 的 Sora 进军社交媒体 | GPT-5 助推亚洲AI热潮，加州监管

2025-10-06 AIFlare

今日看点 OpenAI推出了名为“Sora”的全新社交媒体应用，该应用主打多样化且常常超现实的AI生成内容，标志着其在消费平台领域的一次重大进军。 GPT-5 …

Read More Read More

索拉社交热潮：OpenAI视频应用陷入“滑坡”困境 | 奥特曼承诺版权管控，日本建立AI治理联盟

2025-10-05 AIFlare

今日看点 OpenAI 的 Sora 已作为一个社交媒体应用崭露头角，展示了从离奇古怪到平淡无奇的各种 AI 生成视频内容。 OpenAI 首席执行官 Sam …

Read More Read More

GPT-5 助推韩国生活方式AI热潮 | Sora 社交媒体惊艳亮相暨 OpenAI 日本合作

2025-10-04 AIFlare

今日看点 OpenAI的GPT-5正在韩国推动一场“生活方式AI”革命，赋能Wrtn将其应用扩展到650万用户，并预示着其在整个东亚地区的重大扩张。 OpenA…

Read More Read More

GPT-5 助推亚洲生活方式AI大规模普及 | Sora 应用商店下载量激增及日益升温的AI安全辩论

2025-10-03 AIFlare

今日看点 OpenAI最新的GPT-5模型正在产生重大的现实世界影响，赋能Wrtn凭借其“生活方式AI”概念在韩国获得了650万用户，目前正在向东亚地区拓展。 …

Read More Read More

加州里程碑式的人工智能安全法生效 | OpenAI 的 Sora 引起深度伪造担忧和内部纷争

2025-10-02 AIFlare

今日看点加州通过了SB 53，成为第一个强制要求OpenAI和Anthropic等主要实验室提高人工智能安全透明度的州。 OpenAI 新推出的 Sora 应…

Read More Read More

OpenAI推出“Sora”应用以恶搞朋友 | DeepMind机器人技术飞跃及AI的3亿美元科学探索

2025-10-01 AIFlare

今日看点 OpenAI 发布了其新的 Sora 2 AI 视频生成器，以及一款新的 iPhone 社交视频应用，也叫 Sora，它允许用户在一个类似 TikTo…

Read More Read More

加州率先制定AI安全法规 | 智能体全面进军机器人、编程和商业

2025-09-30 AIFlare

今日看点加州州长纽森将SB 53签署为法律，确立了一项里程碑式的AI安全法案，该法案强制要求主要的AI实验室提高透明度并保护吹哨人。 DeepMind的Gem…

Read More Read More

DeepMind 发布 Gemini Robotics 1.5，将 AI 智能体引入实体世界 | 韩国主权AI雄心以及好莱坞生成式AI入侵

2025-09-29 AIFlare

今日看点 DeepMind的Gemini Robotics 1.5版开启了实体AI智能体的新纪元，赋予机器人先进的感知、规划和问题解决能力。韩国启动了一项雄心…

Read More Read More

DeepMind 的 Gemini Robotics 1.5：AI 智能体迈入物理世界 | 韩国的主权雄心与 AGI 妄想

2025-09-28 AIFlare

今日看点 DeepMind 发布了 Gemini Robotics 1.5，这标志着一项重大飞跃，因为它将 AI 智能体带入了物理世界，使机器人能够感知、规划和…

Read More Read More