Browsed by
Author: AIFlare

推出HealthBench

推出HealthBench

HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能…

Read More Read More

生成分布嵌入

生成分布嵌入

许多现实世界的问题需要跨多个尺度进行推理,这需要模型不仅作用于单个数据点,而且作用于整个分布。我们引入了生成分布嵌入(GDE),这是一个将自动编码器提升到分布空…

Read More Read More