韩国初创公司 Motif 揭示了企业级LLM推理的关键,性能超越 GPT-5.1 | OpenAI 的 GPT-5.2 在科学领域表现出色,字节级模型推动多语言AI发展
今日看点 韩国初创公司 Motif Technologies 发布了一款拥有127亿参数的开放权重模型,该模型在基准测试中超越了 OpenAI 的 GPT-5….
今日看点 韩国初创公司 Motif Technologies 发布了一款拥有127亿参数的开放权重模型,该模型在基准测试中超越了 OpenAI 的 GPT-5….
今日看点 OpenAI的GPT-5.2已推出,被誉为在深度推理、复杂编码和自主企业任务方面取得的里程碑式飞跃,尽管用户指出其速度有所降低,且在非正式互动中默认语…
今日看点 OpenAI 发布了其新的 GPT-5.2 LLM 系列,包含“即时”、“思考”和“专业”三个层级,声称在推理、编码和专业知识工作方面达到了最先进的性…
今日看点 OpenAI 正式发布了 GPT-5.2,其新一代前沿大语言模型家族,包含“即时”、“思考”和“专业”三个层级,旨在夺回在专业知识工作、推理和编程领域…
今日看点 OpenAI 正式推出了其最新的前沿大型语言模型 GPT-5.2,该模型引入了全新的“Thinking”和“Pro”层级,旨在主导专业知识工作、编程以…
今日看点 Quilter的人工智能在一周内设计了一台由843个部件组成的Linux电脑,将一个为期三个月的工程任务所需的人工投入时间缩减到38.5小时,这标志着…
今日看点 智谱AI (Z.ai) 发布了其GLM-4.6V开源视觉语言模型(VLM)系列,该系列以其原生支持视觉输入的功能调用、高性能以及宽松的MIT许可协议为…
今日看点 Anthropic 的 Claude Code 在六个月内实现了令人印象深刻的 10 亿美元年化收入,并推出了一项测试版 Slack 集成,旨在将其编…
今日看点 OpenAI 处于“红色警戒”状态,将于下周加速推出其 GPT-5.2 更新,以积极对抗来自谷歌 Gemini 3 和 Anthropic 的新竞争。…
今日看点 一个名为通用智能体记忆(GAM)的新型双智能体记忆架构,通过维护无损的历史记录并智能地检索精确细节,解决了大型语言模型(LLM)中的“上下文腐烂”问题…
今日看点 OpenAI 正在加紧下周发布 GPT-5.2,作为对谷歌 Gemini 3 的“红色警报”级别竞争性回应,此举加剧了对 LLM 霸主地位的争夺。 研…
今日看点 Gong公司一项最新研究显示,利用AI工具的销售团队人均营收提升77%,标志着企业正从自动化向战略决策发生重大转变。 研究人员推出了通用代理记忆(GA…
今日看点 亚马逊云计算 (AWS) 推出了“前沿代理”——一类新型的自主人工智能系统(Kiro、安全、DevOps代理),能够持续多日完成复杂的软件开发、安全和…
今日看点 亚马逊网络服务 (AWS) 推出了一类新型的自主人工智能系统——“前沿智能体”,旨在连续数日无需人工干预地执行复杂的软件开发、安全和IT运维任务,这标…
今日看点 中国初创公司 DeepSeek 发布了两款开源AI模型,DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale,声称其性能媲美甚…
今日看点 Anthropic 公司推出了一种两部分解决方案,旨在解决 AI 智能体持久记忆的难题,该方案利用初始化智能体和编码智能体来管理跨离散会话的上下文。 …
今日看点 Andrej Karpathy 的“LLM Council”项目勾勒了一个极简而强大的多模型AI编排架构,强调了前沿模型的商品化以及“瞬时代码”的潜力…
今日看点 安德烈·卡帕西的“LLM 委员会”项目为企业级 AI 编排提供了一份鲜明的“氛围准则”蓝图,揭示了原始模型集成与生产级系统之间的关键鸿沟。 黑森林实验…
今日看点 唐纳德·特朗普总统启动了“创世纪任务”,这是一项类似于曼哈顿计划的全国性倡议,指示能源部建立一个“闭环人工智能实验平台”,将国家实验室和超级计算机与主…
今日看点 白宫启动了“创世任务”,这是一项雄心勃勃的国家人工智能计划,被比作曼哈顿计划,涉及主要人工智能公司和国家实验室,引发了关于公共资金是否应用于不断上涨的…
今日看点 Anthropic发布了Claude Opus 4.5,将价格大幅削减了三分之二,并在软件工程任务中取得了最先进的性能,甚至在内部测试中超越了人类候选…
今日看点 Lean4形式化验证正成为构建可信赖AI的关键工具,它使模型能够生成数学上得到保证的、无幻觉的输出,并在国际数学奥林匹克竞赛中取得金牌水平的表现。 A…
今日看点 谷歌研究人员推出了一种新的人工智能范式“嵌套学习”以及“Hope”模型,旨在通过多层优化解决大语言模型 (LLMs) 的内存和持续学习局限性。 xAI…
今日看点 xAI 开放了其 Grok 4.1 Fast 模型和 Agent Tools API 的开发者访问权限,但这一公告却被公众对 Grok 阿谀奉承埃隆·…
今日看点 谷歌推出了备受赞誉的AI图像模型Gemini 3 Pro Image(纳米香蕉Pro),该模型提供工作室级、高分辨率和多语言图像生成,尤其擅长处理信息…
今日看点 谷歌的 Gemini 3 Pro Image (Nano Banana Pro) 发布,因其“疯狂的”企业级视觉推理、4K 分辨率和无瑕的文本集成而备…
今日看点 OpenAI 发布了 GPT-5.1-Codex-Max,这是一款新型智能编程模型,在关键基准测试中其性能超越了谷歌的 Gemini 3 Pro,展示…
今日看点 谷歌推出了其 Gemini 3 模型系列,其中 Gemini 3 Pro 被独立评为全球最智能的AI模型,在数学、科学、多模态理解和智能体能力方面展现…
今日看点 微软的Phi-4证明,一种“数据优先”的SFT方法论,仅使用140万个精心挑选的“可教导”提示-响应对,使得一个14B模型能够在复杂推理任务中超越许多…
今日看点 OpenAI已在有限试点中推出ChatGPT群聊,允许大型语言模型与其他用户进行实时协作,并由GPT-5.1 Auto提供支持。 谷歌和加州大学洛杉矶…
今日看点 中国科技巨头百度发布了文心大模型 5.0,这是一款全新的全模态基础模型,声称在文档理解和图表问答等关键的企业级基准测试中超越了 OpenAI 的 GP…
今日看点 百度发布了其自研的文心一言 5.0,声称在文档理解和多模态推理等关键企业任务中,其性能可媲美甚至超越 OpenAI 的 GPT-5.1 和谷歌的 Ge…
今日看点 中国科技巨头百度发布了其专有的全模态基础模型ERNIE 5.0,声称在多模态推理、文档理解和基于图表的问答方面,其性能优于OpenAI的GPT-5和谷…
今日看点 百度推出了ERNIE-4.5-VL-28B-A3B-Thinking,这是一个开源多模态人工智能,它声称在视觉基准测试中超越了谷歌的Gemini 2….
今日看点 Meta 发布了全语种ASR,这是一款开创性的开源(Apache 2.0 许可)语音识别系统,原生支持 1,600 多种语言,并可通过零样本学习扩展到…
今日看点 Meta公司推出了全语种ASR,这是一个开源语音识别系统,原生支持1600多种语言,并可通过零样本学习扩展到5400多种,根据宽松的Apache 2….
今日看点 Terminal-Bench 2.0 和 Harbor 框架已发布,为评估自主AI智能体在真实终端任务中的表现,提供了一个更严谨、更可扩展的环境。 O…
今日看点 月之暗面 (Moonshot AI) 的开源模型 Kimi K2 Thinking 在关键的推理、编码和智能体基准测试中,大幅超越了 OpenAI 的…
今日看点 月之暗面旗下的Kimi K2 思维,一个开源中文模型,在关键的推理、编码和智能体工具基准测试中已经超越了OpenAI的GPT-5和Anthropic的…
今日看点 中国初创公司月之暗面的 Kimi K2 Thinking 开源模型,在关键的推理、编码和智能体基准测试中,大幅超越了 OpenAI 的 GPT-5 和…
今日看点 Manifest AI 推出了 Brumby-14B-Base,它是 Qwen3-14B-Base 的一个变体,用一种新颖的“Power Retent…
今日看点 Manifest AI 公司的 Brumby-14B-Base 引入了“能量保留”架构,取代了注意力层,从而显著降低了大型语言模型(LLMs)的成本并…
今日看点 增强智能公司 (AUI) 融资2000万美元,估值达到7.5亿美元,用于其神经符号基础模型Apollo-1,该模型旨在提供超越传统仅基于Transfo…
今日看点 一种新的确定性CPU架构,详述于最新颁布的专利中,将取代推测执行,有望实现对AI和机器学习工作负载至关重要的可预测、能效高的性能。 Meta 研究人员…
今日看点 Meta 和爱丁堡大学的研究人员引入了“基于电路的推理验证”(Circuit-based Reasoning Verification,简称 CRV)…
今日看点 Meta研究人员推出了一种基于电路的推理验证技术 (CRV),该技术能够深入大型语言模型(LLMs)内部,实时监测并纠正其推理错误,从而显著提升了人工…
今日看点 Anthropic 的 Claude AI 展示了一种萌芽的能力,能够观察并报告其自身的内部过程,探测到“注入的思想”,这是迈向 AI 透明度的重要一…
今日看点 Anthropic 的研究人员证明,他们的 Claude AI 模型能够表现出初步的内省能力,探测并报告直接注入其神经网络的“侵入性思维”。 Curs…
今日看点 微软大幅扩展了Copilot,赋能其一亿Microsoft 365用户,通过自然语言提示创建自定义应用程序、自动化工作流程并构建专业的AI代理,有效地…
今日看点 MiniMax-M2 已发布,成为新的顶尖开源大型语言模型 (LLM),尤其在智能体工具使用方面表现出色,并挑战了 GPT-5 和 Claude So…
今日看点 一位知名人工智能研究员挑战了业界“规模优先”的做法,提出能够持续适应的“超人类学习者”——而非仅仅是更大的模型——将实现超级智能。 中国蚂蚁集团发布了…
今日看点 OpenAI 为 ChatGPT 商业版、企业版和教育版计划推出了「公司知识」功能,使人工智能能够安全地访问并整合来自 Google Drive 和 …
今日看点 中国蚂蚁集团推出了万亿参数开源推理模型Ring-1T,其性能仅次于OpenAI的GPT-5,并加剧了中美人工智能竞争。 微软为其 Copilot AI…
今日看点 变压器架构的先驱利昂·琼斯宣称,他将放弃这一主流人工智能技术,理由是研究方向危险地狭窄,并呼吁探索新的突破。 微软推出了一次大规模的Copilot更新…
今日看点 DeepSeek 发布了一个开源模型 DeepSeek-OCR,该模型通过将文本作为图像处理,实现了高达 10 倍的文本压缩,这有望使大型语言模型(L…
今日看点 DeepSeek发布了DeepSeek-OCR,这是一个开源模型,它通过将文本视为图像,实现了高达10倍的压缩效率,有望使大语言模型(LLM)的上下文…
今日看点 谷歌已将实时谷歌地图数据直接整合到其 Gemini AI 模型中,赋能开发者创建具备实时、准确事实依据的位置感知应用。 Adobe 推出 AI Fou…
今日看点 一种名为“言语化采样”(Verbalized Sampling)的新提示工程方法,通过提示模型揭示其完整的概率分布,显著提升了AI的创造力和输出多样性…
今日看点 研究人员发现了一个简单的提示句,即“从全分布中采样,生成5个响应及其对应的概率”,该提示句极大地增强了人工智能模型的创造力和多样性。 Anthropi…
今日看点 研究人员发现了一种简单的提示词修改,称之为“口头化采样”,它通过规避模式塌陷,在无需重新训练的情况下,显著提高了LLM输出的多样性和创造力。 Code…
今日看点 微软面向所有Windows 11电脑推出了语音唤醒的“Hey Copilot”和实验性的自主“Copilot Actions”,旨在重新定义操作系统体…
今日看点 Anthropic 已将其全新的 Claude Haiku 4.5 模型免费提供给其 Claude.ai 平台的所有用户,该模型以极低的成本提供接近前…
今日看点 麻省理工学院更新的SEAL框架使大型语言模型能够自主生成合成数据并进行自我微调,标志着向持续自我适应的人工智能迈出了重要一步。 一项新技术创建了“数字…
今日看点 麻省理工学院的研究人员开源了一项更新的SEAL技术,使大型语言模型(LLM)能够自主生成并应用自己的微调策略,开启了自我改进人工智能的时代。 Sale…
今日看点 Together AI 的新型 ATLAS 自适应推测系统通过从不断变化的工作负载中动态学习,提供高达 400% 的推理性能提升,显著降低了企业的成本…
今日看点 Echelon 推出了人工智能代理,旨在自动化复杂的 ServiceNow 实施,直接挑战埃森哲和德勤等传统咨询巨头,争夺高达1.5万亿美元的IT服务…
今日看点 OpenAI 已宣布其人工智能软件工程师 Codex 全面上市,该产品由专门的 GPT-5-Codex 模型提供支持。它现已为企业做好生产准备,在内部…
今日看点 OpenAI 已将 Codex(其由 GPT-5-Codex 驱动的人工智能软件工程师)全面推出,内部使用显示,其生产力提高了 70%,并能自主编程数…
今日看点 OpenAI 宣布与传奇设计师 Jony Ive 达成一项为期多年的合作,共同打造以人工智能为核心的新硬件,这预示着其将大举进军软件以外的领域。 Ch…
今日看点 OpenAI 宣布了一项宏大的战略,旨在将 ChatGPT 发展成为一个成熟的计算平台和“应用商店”,并提供用于交互式应用的新版 SDK 以及用于构建…
今日看点 OpenAI 在 DevDay 上宣布了 Apps SDK,允许 ChatGPT 直接在聊天界面内启动并运行 Zillow 和 Canva 等第三方应…
今日看点 OpenAI推出了名为“Sora”的全新社交媒体应用,该应用主打多样化且常常超现实的AI生成内容,标志着其在消费平台领域的一次重大进军。 GPT-5 …
今日看点 OpenAI 的 Sora 已作为一个社交媒体应用崭露头角,展示了从离奇古怪到平淡无奇的各种 AI 生成视频内容。 OpenAI 首席执行官 Sam …
今日看点 OpenAI的GPT-5正在韩国推动一场“生活方式AI”革命,赋能Wrtn将其应用扩展到650万用户,并预示着其在整个东亚地区的重大扩张。 OpenA…
今日看点 OpenAI最新的GPT-5模型正在产生重大的现实世界影响,赋能Wrtn凭借其“生活方式AI”概念在韩国获得了650万用户,目前正在向东亚地区拓展。 …
今日看点 加州通过了SB 53,成为第一个强制要求OpenAI和Anthropic等主要实验室提高人工智能安全透明度的州。 OpenAI 新推出的 Sora 应…
今日看点 OpenAI 发布了其新的 Sora 2 AI 视频生成器,以及一款新的 iPhone 社交视频应用,也叫 Sora,它允许用户在一个类似 TikTo…
今日看点 加州州长纽森将SB 53签署为法律,确立了一项里程碑式的AI安全法案,该法案强制要求主要的AI实验室提高透明度并保护吹哨人。 DeepMind的Gem…
今日看点 DeepMind的Gemini Robotics 1.5版开启了实体AI智能体的新纪元,赋予机器人先进的感知、规划和问题解决能力。 韩国启动了一项雄心…
今日看点 DeepMind 发布了 Gemini Robotics 1.5,这标志着一项重大飞跃,因为它将 AI 智能体带入了物理世界,使机器人能够感知、规划和…
今日看点 DeepMind 的 Gemini Robotics 1.5 推出了先进的 AI 智能体,赋能机器人能够在物理世界中感知、规划和行动,以解决复杂任务。…
今日看点 DeepMind的Gemini Robotics 1.5标志着一个重大的飞跃,使AI智能体能够感知、规划并与物理世界互动,以解决复杂任务。 OpenA…
今日看点 微软通过将 Anthropic 的 Claude Sonnet 4 和 Claude Opus 4.1 模型整合到 Microsoft 365 Cop…
今日看点 克拉维斯AI推出Strata,这是一个开源的MCP服务器,旨在使AI智能体能够利用数千种API工具而不会感到不堪重负,从而解决了关键的可扩展性和代币预…
今日看点 主要唱片公司通过美国唱片业协会,升级了对人工智能音乐生成器Suno的诉讼,指控其非法从YouTube盗版歌曲以训练其生成模型。 谷歌 Gemini A…
今日看点 OpenAI、NVIDIA 和 Nscale 已合作建立“Stargate UK”项目,这是一个主权人工智能基础设施项目,拥有50,000个GPU以及…
今日看点 OpenAI、英伟达和Nscale已合作成立“Stargate 英国”,这是一个庞大的主权人工智能基础设施,将配备多达50,000个GPU以及英国最大…
今日看点 OpenAI、英伟达和 Nscale 联合启动了“英国星际之门”(Stargate UK),这是一个宏伟的主权人工智能基础设施合作项目,将提供 50,…
今日看点 OpenAI、英伟达和Nscale已合作推出“Stargate UK”——一台庞大的主权AI超级计算机,将配备多达50,000个GPU,旨在推动国家A…
今日看点 OpenAI、NVIDIA 和 Nscale 已合作建立“Stargate UK”,一个主权人工智能基础设施,配备多达 50,000 个 GPU,并成…
今日看点 OpenAI、英伟达和Nscale已启动“星门英国”(Stargate UK)项目,这是一项雄心勃勃的主权AI基础设施合作计划,旨在提供多达5万个GP…
今日看点 OpenAI 发布了 GPT-5-Codex,这是其旗舰 GPT-5 模型的一个专用版本,大幅升级了其 AI 编码代理,使其能够处理从秒级到小时级的任…
今日看点 知名记者 Karen Hao 对 OpenAI 的崛起提出了批判性视角,指出其背后是由一种“AGI 布道者”意识形态所驱动,这种意识形态模糊了使命与利…
今日看点 OpenAI 正在战略性地部署其先进的 GPT-5 模型,以增强“SafetyKit”,从而以前所未有的准确性和速度彻底改变内容审核与合规。 Open…
今日看点 对人工智能语言模型的巨额3440亿美元投资正面临严峻审视,一篇评论文章将其称为“脆弱”。 OpenAI 正在利用其先进的 GPT-5 模型,在其 Sa…
今日看点 OpenAI 推出了 SafetyKit,它利用其最新的 GPT-5 模型显著增强内容审核和合规性,预示着一个由更智能、更快速系统驱动的人工智能安全新…
今日看点 OpenAI已推出一项生物漏洞赏金计划,挑战研究人员为其即将推出的GPT-5模型寻找“通用越狱”提示,奖金最高达25,000美元。 作为其安全工作的重…
今日看点 微软据报道正在减少对OpenAI的依赖,通过向Anthropic采购AI服务,这标志着其AI合作战略的重大转变。 OpenAI同时在追求摆脱微软的更大…
今日看点 OpenAI 启动了生物漏洞赏金计划,向能找到“通用越狱”提示词、从而破坏GPT-5安全性(尤其是生物滥用方面)的研究人员,提供最高25,000美元的…
今日看点 OpenAI 已启动一项生物安全漏洞赏金计划,邀请研究人员测试 GPT-5 的安全性,并寻找通用越狱提示词,奖金为 25,000 美元。 确认显示,“…