DeepSeek推出免费AI竞品,性能媲美GPT-5,并有金牌表现 | OpenAGI挑战自主智能体竞赛中的行业巨头

今日看点
- 中国初创公司 DeepSeek 发布了两款开源AI模型,DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale,声称其性能媲美甚至超越 OpenAI 的 GPT-5 和谷歌的 Gemini-3.0-Pro,其中 Speciale 版本在顶级的国际竞赛中斩获金牌。
- DeepSeek新颖的“稀疏注意力”机制显著降低了长上下文的推理成本,使得强大、开源的人工智能在经济上更易于获取。
- OpenAGI,一家由麻省理工学院创办的初创公司,携AI代理Lux浮出水面。Lux声称在严苛的Online-Mind2Web基准测试中取得了83.6%的成功率,其表现超越了OpenAI和Anthropic的代理,同时还能以仅为一小部分的成本控制桌面应用程序。
- 麻省理工学院衍生公司Liquid AI发布了一份详细蓝图,旨在训练企业级、小型、高效的端侧AI模型(LFM2),该蓝图侧重于实际部署和混合的本地-云架构。
- AWS 和 Visa 宣布建立合作关系,旨在提供基础蓝图和基础设施,以简化安全、协同的多代理商务系统的开发。
主要动态
人工智能领域今天发生了一场巨变,一系列创新挑战了老牌巨头,重新定义了性能指标,并为人工智能未来的部署提供了新蓝图。当天新闻的焦点是中国初创公司DeepSeek令人震惊的发布,该公司发布了两款“极其强大”的人工智能模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale,声称与OpenAI的GPT-5和谷歌的Gemini-3.0-Pro性能相当,甚至更优。值得注意的是,这些具备前沿能力的模型以完全免费的MIT开源许可证发布,极大地改变了行业的竞争格局。
DeepSeek的V3.2-Speciale版本尤其在四项精英国际竞赛中取得了金牌表现,包括2025年国际数学奥林匹克竞赛,展示了人工智能推理能力的新高峰。这一突破得益于“DeepSeek稀疏注意力”(DSA),这项架构创新将长文档的推理成本估计降低了70%,使高上下文人工智能更高效、更经济。尽管与专有模型相比,DeepSeek在“世界知识”方面存在一些局限性,但DeepSeek的开源策略,尽管面临美国和欧洲日益增多的监管壁垒,仍对硅谷人工智能领导者盛行的商业模式构成了严峻挑战。
与此同时,在自主代理这一关键领域,一个新的竞争者OpenAGI悄然浮出水面,并提出了同样大胆的主张。其新的基础模型Lux据说在严苛的Online-Mind2Web基准测试中,以83.6%的成功率控制计算机,显著优于OpenAI的Operator(61.3%)和Anthropic的Claude Computer Use(56.3%)。Lux的优势来源于“代理主动预训练”(Agentic Active Pre-training),这种方法通过计算机截图和动作序列来训练模型,使其能够“产生行动”而不仅仅是文本。此外,Lux的独特之处在于它能够控制Slack和Excel等桌面应用程序,而不仅仅是网络浏览器,并且其运行成本大约是竞争性前沿模型的十分之一。该公司还在与英特尔合作,优化Lux以适应边缘设备,解决隐私和延迟问题。
除了前沿模型霸权的竞争,麻省理工学院衍生公司Liquid AI为企业采用提供了关键的架构指引。它发布了一份详细的51页技术报告,本质上是训练企业级小型高效“流动基础模型”(Liquid Foundation Models, LFM2)的蓝图。这些模型专为设备端部署而设计,优先考虑延迟和内存等现实世界约束,而非原始参数数量。Liquid AI的方法侧重于操作可靠性、指令遵循和工具使用,使其成为混合本地-云代理工作流的“控制平面”的理想选择,为成本控制、隐私和弹性提供了解决方案。
最后,蓬勃发展的代理商务领域获得了AWS和Visa的显著推动。这两家巨头宣布合作,将Visa的Intelligence Commerce平台在AWS Marketplace上架,并发布代理商务的基础蓝图。这一举措旨在解决商务系统中的碎片化问题,为开发者提供标准化基础设施,以实现安全、协调的多代理交易,涵盖旅游、零售和B2B支付,使该行业更接近人工智能代理处理复杂采购工作流程的未来。
分析师视角
今日新闻预示着人工智能行业正在发生深刻变革,挑战了长期以来人们普遍持有的观念,即尖端AI需要巨额资本和专有壁垒。DeepSeek开源、具成本效益且高性能的模型,再加上OpenAGI在基准测试中表现卓越的智能体,共同证明了创新并非硅谷巨头或其封闭生态系统所独有。这可能会使强大的AI变得更普及,加剧竞争,并迫使现有企业重新审视其定价和开源策略。Liquid AI对设备端高效AI的关注,以及AWS和Visa的代理式商业蓝图,都预示着未来AI将不再仅仅是云端大型通用模型,而是一种为特定企业需求量身定制并无缝融入日常交易的联邦式混合架构。未来几个月将考验这些开放高效的方法能否将实验室的优势转化为实际世界的可靠性和广泛应用,尤其是在地缘政治紧张局势的阴影下。
内容来源
- OpenAGI emerges from stealth with an AI agent that it claims crushes OpenAI and Anthropic (VentureBeat AI)
- DeepSeek just dropped two insanely powerful AI models that rival GPT-5 and they’re totally free (VentureBeat AI)
- MIT offshoot Liquid AI releases blueprint for enterprise-grade small-model training (VentureBeat AI)
- Agent coordination is the missing piece in AI commerce — new AWS and Visa blueprints target the gap (VentureBeat AI)
- OpenAI and NORAD team up to bring new magic to “NORAD Tracks Santa” (OpenAI Blog)