mlperf发布了第三批用于培训AI网络的意见书

今天，行业标准AI基准测试小组mlperf发布了第三批用于培训AI网络的意见书，就像前两个版本一样，NVIDIA在商用硬件和软件领域占据了稀疏的竞争领域。Mlperf由全球80多家公司和大学组成，创建了基准，为培训和推理处理提供了从苹果到苹果的比较。但是，由于潜在的AI竞争者仍未露面，竞争苹果仍然很少。在“研究”类别中，有一些提交物看起来很有希望，无论何时以及何时上市。让我们看一下基准，并探索英特尔，谷歌和Graphcore等竞争对手的发展方向。与过去一样，请原谅NVIDIA图像的广泛使用;

NVIDIA赢得所有16个基准测试

自创建市场以来，NVIDIA一直主导着AI加速器业务，并将其发展到明年NVIDIA AI收入可能超过游戏领域的地步。在技术上很少有一家公司拥有数十亿美元的市场空间而又不吸引竞争的，并且现在有数十家初创公司以及像英特尔和高通这样的成熟公司正在开发具有竞争力的产品。但是经过3年在Powerpoint中具有挑战性的承诺以及一些显着的失败之后，NVIDIA仍然独立存在于一个市场中，一个项目在10年内每年将超过$ 28B。

为了刷新您的记忆，mlperf提供了跨多个AI基准的三类基准系统(可用，预览和研究)。这些基准测试可衡量最大规模系统(例如NVIDIA Selene，这是世界上第七快的超级计算机)和单个服务器(例如8GPU DGX A100)的培训时间。新的V0.7结果仅用于培训;新的推理基准可能会在未来几个月内发布。结果?在商用类别中，NVIDIA以可观的优势赢得了所有16个基准测试。未公布的Google TPU V4看起来很有希望，但在八分之三的基准测试中，目前仅略胜于NVIDIA A100。

有趣的是，在商用服务器上提交结果的唯一竞争者是Google和华为，甚至这些公司也只提交了用于图像分类(Resnet-50)和自然语言处理(BERT)的结果。尽管NVIDIA的“大规模”成果令人难以置信，显示了其在系统设计，Mellanox网络和AI软件方面的卓越能力，但我倾向于更多地关注按系统划分的结果和按芯片进行归一化的分析。毕竟，很少有公司能负担得起大规模运行基准测试所需的超级计算机和工程工作。

对于商用系统，NVIDIA轻松击败华为超过2倍，并击败了Google TPU V3 25-75%。但是，为什么华为和谷歌没有运行其他6或7个基准测试呢?嗯，谷歌可能做到了，但是意识到新的A100会粉碎其使用了3年的芯片。相反，它明智地将精力集中在即将推出的V4芯片上，该芯片已在研究类别中提交。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时候联系我们修改或删除，多谢