AI每日摘要:2025年5月30日:空间推理、可靠的大型语言模型以及AI生成引用带来的风险

AI每日摘要:2025年5月30日:空间推理、可靠的大型语言模型以及AI生成引用带来的风险

AI领域持续快速发展,多模态模型的进步、创新的评估技术以及对AI生成内容失控潜在风险的警示,共同构成了今天的亮点,展现了该领域的令人兴奋的进展和严峻挑战。 对多…

Read More Read More

推出HealthBench

推出HealthBench

HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能…

Read More Read More