推出HealthBench 推出HealthBench 2025-05-26 AIFlare HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能和安全提供一个共享标准。 原文链接: https://openai.com/index/healthbench