Nvidia 发布了迄今为止最好的开放 AI 模型，但仍落后于中国

原文：Nvidia Releases Its Best Open AI Model Yet—But Still Lags Behind China

将 Decrypt 添加为您的首选来源，以便在 Google 上查看我们的更多故事。

简而言之，NVIDIA 于 6 月 1 日在 Computex 上推出了 Nemotron 3 Ultra，这是一个 5500 亿参数的开放权重模型。

该模型在预发布的 DeepInfra 端点上每秒交付超过 300 个代币，运行速度比中国竞争对手快三到六倍

但来自 Moonshot AI 的 Kimi K2.6 仍然在开放权重智能排名中领先。

周日，黄仁勋穿着皮夹克走上台北电脑展的舞台，并推出了 Nemotron 3 Ultra——Nvidia 有史以来最大的开放式人工智能模型，至少目前是美国制造的最智能的开放式重量模型。很好。只是还不足以击败中国。

该模型包含大约 5500 亿个总参数，但在任何给定时刻仅在 550 亿个活跃参数上运行，采用了一种称为专家混合的设计。参数决定了人工智能模型的知识广度，参数越大通常意味着功能越强大。

要了解专家混合模式的工作原理，请将其想象为一家拥有数百名专家的医院：当患者进来时，只有相关医生真正出现，而不是所有工作人员。这种方法使运行模型的成本远低于其标题参数计数所建议的成本，这正是 Nvidia 声称推理速度比同类开放权重替代方案快 5 倍且成本低 30% 的原因。

与 Nvidia 合作进行预发布评估的独立评估机构 Artificial Analysis，将 Nemotron 3 Ultra 的智能指数评为 48 分。智能指数是一项综合基准，汇总了涵盖推理、编码、一般知识和代理性能的 10 项评估，得分按数字等级排列，越高意味着越聪明。

这使其成为美国顶级开放重量型号，遥遥领先。其次最接近的美国选项是 Google 的 Gemma 4 31B（排名 39）、Nemotron 3 Super（排名 36）和 OpenAI 的 gpt-oss-120b（排名 33）。

NVIDIA 刚刚宣布在黄仁勋的电脑中发布 Nemotron 3 Ultra