原文:Nvidia Releases Its Best Open AI Model Yet—But Still Lags Behind China

将 Decrypt 添加为您的首选来源,以便在 Google 上查看我们的更多故事。

简而言之,NVIDIA 于 6 月 1 日在 Computex 上推出了 Nemotron 3 Ultra,这是一个 5500 亿参数的开放权重模型。

该模型在预发布的 DeepInfra 端点上每秒交付超过 300 个代币,运行速度比中国竞争对手快三到六倍

但来自 Moonshot AI 的 Kimi K2.6 仍然在开放权重智能排名中领先。

周日,黄仁勋穿着皮夹克走上台北电脑展的舞台,并推出了 Nemotron 3 Ultra——Nvidia 有史以来最大的开放式人工智能模型,至少目前是美国制造的最智能的开放式重量模型。很好。只是还不足以击败中国。

该模型包含大约 5500 亿个总参数,但在任何给定时刻仅在 550 亿个活跃参数上运行,采用了一种称为专家混合的设计。参数决定了人工智能模型的知识广度,参数越大通常意味着功能越强大。

要了解专家混合模式的工作原理,请将其想象为一家拥有数百名专家的医院:当患者进来时,只有相关医生真正出现,而不是所有工作人员。这种方法使运行模型的成本远低于其标题参数计数所建议的成本,这正是 Nvidia 声称推理速度比同类开放权重替代方案快 5 倍且成本低 30% 的原因。

与 Nvidia 合作进行预发布评估的独立评估机构 Artificial Analysis,将 Nemotron 3 Ultra 的智能指数评为 48 分。智能指数是一项综合基准,汇总了涵盖推理、编码、一般知识和代理性能的 10 项评估,得分按数字等级排列,越高意味着越聪明。

这使其成为美国顶级开放重量型号,遥遥领先。其次最接近的美国选项是 Google 的 Gemma 4 31B(排名 39)、Nemotron 3 Super(排名 36)和 OpenAI 的 gpt-oss-120b(排名 33)。

NVIDIA 刚刚宣布在黄仁勋的电脑中发布 Nemotron 3 Ultra

阅读原文 →