百度发布搭载开源多模态人工智能的GPT-5和Gemini挑战者 | 微博刷新效率记录,OpenAI重启ChatGPT

今日看点
- 百度推出了ERNIE-4.5-VL-28B-A3B-Thinking,这是一个开源多模态人工智能,它声称在视觉基准测试中超越了谷歌的Gemini 2.5 Pro和OpenAI的GPT-5,同时仅使用了极少量的计算资源。
- 中国社交媒体巨头微博发布了VibeThinker-1.5B,一个15亿参数的大语言模型,该模型在数学和编程任务上展现出卓越的推理能力,足以与大得多的模型相媲美,而其后训练预算仅为7800美元。
- OpenAI 升级了其旗舰聊天机器人,引入了 GPT-5.1 Instant 和 GPT-5.1 Thinking,旨在提供更快、更具对话性、更个性化的 ChatGPT 体验,此前 GPT-5 的首次推出收到了褒贬不一的评价。
主要动态
全球人工智能领域今天动作频频,主要体现在中国科技巨头积极挑战老牌西方厂商,以及OpenAI对其旗舰级消费者产品进行了战略性重启。目前的主流趋势是:效率、专业化推理以及通过开源发布实现高级人工智能的民主化正在重塑竞争格局。
中国最大的搜索引擎百度公司,发布了开源多模态人工智能模型ERNIE-4.5-VL-28B-A3B-Thinking,成为业界焦点。百度声称,该模型在多个视觉相关基准测试中,特别是在文档理解、图表分析和视觉推理方面,不仅媲美甚至超越了谷歌的Gemini 2.5 Pro和OpenAI的GPT-5-High的性能。ERNIE-4.5-VL-28B-A3B-Thinking 尤为引人注目的是其效率:它采用了专家混合(MoE)架构,在运行时仅激活总共280亿参数中的30亿。这使得它能够在单张80GB GPU上运行,极大地降低了企业部署的门槛,并凭借其宽松的Apache 2.0许可证脱颖而出。“图像思考”(通过动态放大图像细节来模仿人类的视觉问题解决)和增强的“视觉基础”能力等关键特性,标志着其在机器人技术、质量控制和自动化文档处理应用方面的飞跃。
在强调高效、高性能AI的背景下,微博人工智能部门推出了VibeThinker-1.5B,一个紧凑型15亿参数语言模型。尽管其体量微小,VibeThinker-1.5B在数学和代码的正式推理基准测试中,表现优于大数百倍的模型,包括中国竞争对手DeepSeek的6710亿参数R1,令业界为之惊叹。这项卓越成就伴随着同样惊人的、仅7800美元的后期训练预算,挑战了行业长期以来关于卓越推理能力需要大量参数和巨大计算投资的假设。VibeThinker-1.5B的成功归因于其“频谱到信号原理”(Spectrum-to-Signal Principle)训练框架,该框架将监督微调和强化学习分离开来,以在放大最正确路径之前最大化潜在解决方案的多样性。这一突破使VibeThinker-1.5B成为经济高效的边缘设备部署的理想选择。
为应对竞争激烈的市场以及对其首次GPT-5发布褒贬不一的评价,OpenAI发布了GPT-5.1 Instant和GPT-5.1 Thinking,升级了ChatGPT体验。作为默认模型,GPT-5.1 Instant承诺“更亲切、更智能、更擅长遵循指令”,直接解决了此前被认为是弱点的问题,即百度文心等竞争对手曾在此展现出优势。GPT-5.1 Thinking提供高级推理能力,根据查询的复杂性动态调整其处理能力,从而在简单任务上提供更快响应,并在复杂任务上投入更持久的精力,同时减少了专业术语。这些更新还引入了增强的个性化功能,允许用户从“友好”、“专业”甚至“风趣”等各种对话语气中进行选择,这显然是为了使人工智能更具用户友好性并适应多样化的需求。
除了基础模型,人工智能在企业工作流程中的实际应用也取得了重大进展,Deductive AI从隐身状态浮出水面。这家初创公司已筹集750万美元,用于商业化旨在自动化软件调试的“AI SRE代理”。通过应用强化学习分析生产故障,Deductive AI构建知识图谱并部署多智能体调查,在数分钟内识别根本原因,而这项任务传统上会占用工程师多达一半的时间。早期成果令人印象深刻:DoorDash报告节省了1000多工程小时和数百万美元收入,而Foursquare将Spark作业故障的诊断时间减少了90%。该解决方案解决了软件开发中日益增长的危机,这一危机因人工智能助手快速生成的“氛围代码”(vibe coding)而加剧,这些代码通常会引入人类难以追踪的复杂性。
分析师视角
今天的公告标志着人工智能行业的一个关键转折点,强调了从单一追求规模转向更加多元化的方法,侧重于效率、专业推理和实际部署。百度和微博的开源发布,尤其是它们声称以显著更少的资源超越了更大的西方模型,预示着全球竞争的加剧,并挑战了只有少数资源充足的参与者才能引领的说法。OpenAI快速迭代到GPT-5.1,表明在面对这种竞争时,持续改进和以用户为中心设计的必要性。对于企业而言,这意味着有能力、成本效益高且日益专业化的AI模型选择正在迅速扩大。未来AI的胜利将不仅仅取决于单纯的参数量,而是巧妙的架构、新颖的训练方法以及将这些智能代理无缝集成到实际操作工作流程中的能力,正如Deductive AI在调试方面的影响所例证。请关注效率和领域特定AI解决方案的持续创新,尤其来自利用开源战略的亚洲科技巨头。
内容来源
- Baidu just dropped an open-source multimodal AI that it claims beats GPT-5 and Gemini (VentureBeat AI)
- Weibo’s new open source AI model VibeThinker-1.5B outperforms DeepSeek-R1 on $7,800 post-training budget (VentureBeat AI)
- OpenAI reboots ChatGPT experience with GPT-5.1 after mixed reviews of GPT-5 (VentureBeat AI)
- How Deductive AI saved DoorDash 1,000 engineering hours by automating software debugging (VentureBeat AI)
- Meta’s SPICE framework lets AI systems teach themselves to reason (VentureBeat AI)