Llama 3 邂逅 MoE:开创低成本高性能 AI
Transformer 对自然语言处理 (NLP) 和计算机视觉 (CV) 的变革性影响是不可否认的。它们的扩展性和有效性推动了这些领域的进步,但这些模型日益增…
Transformer 对自然语言处理 (NLP) 和计算机视觉 (CV) 的变革性影响是不可否认的。它们的扩展性和有效性推动了这些领域的进步,但这些模型日益增…
近期诺贝尔奖表彰了蛋白质发现领域的突破性进展,突显了基础模型 (FM) 在探索巨大组合空间中的变革潜力。这些模型有望彻底改变众多科学学科,然而,人工生命 (AL…
图形处理巨头英伟达计划通过预计于2025年上半年推出的Jetson Thor紧凑型计算平台,进一步进军机器人领域。这款专为人形机器人设计的平台,最初由《金融时报…
Meta AI在2024年末推出的两项突破性研究计划正在挑战支撑大多数当前大型语言模型 (LLM) 的基本下一个token预测范式。字节级Transformer…
在AI视频生成领域引发最初热潮仅仅一年后,竞争格局据报道正在发生重大转变。焦点正从单纯实现视频生成能力转向证明盈利能力的重大挑战。这种演变似乎正在削弱OpenA…
大型语言模型领域的重要参与者DeepSeek AI最近发表了一篇研究论文,详细介绍了一种旨在增强通用奖励模型 (GRM) 在推理阶段可扩展性的新技术。同时,该公…
中国北京 – 2025年4月15日 – 为凸显其技术实力和全球雄心,并为未来潜在的IPO铺平道路,中国人工智能公司智谱AI宣布全面开源其下一代通用语言模型 (G…
OpenAI的o1系列和DeepSeek-R1的显著成功,已无可辩驳地证明了大规模强化学习(RL)在引出复杂的推理行为和显著增强大型语言模型(LLM)能力方面的…
DeepSeek AI宣布发布DeepSeek-Prover-V2,这是一个突破性的开源大型语言模型,专门为Lean 4环境中的形式化定理证明而设计。最新版本在…
HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能…