来源:宁推网

NVIDIA利用AI来设计和开发GPU 最新Hopper已拥有1.3万个电路实例

2022-07-12 11:06:44

中介网(zhongjie.com):专注互联网虚拟资产中介交易平台

  在过去几年时间里,NVIDIA 深耕 AI 领域,他们的 GPU 不仅成为 HPC 的首选,也成为包括 AI和深度学习生态系统在内的数据中心的首选。在最新公布的开发者博文中,NVIDIA宣布正利用 AI 来设计和开发 GPU,其最新的 Hopper GPU 拥有将近 13000 个电路实例,而这些实例完全由 AI创建。

  在 NVIDIA Develope 上发布的新博客中,该公司重申了其优势以及它自己如何利用其 AI 功能来设计其迄今为止最强大的GPU--Hopper H100。 NVIDIA GPU 主要是使用最先进的 EDA(电子设计自动化)工具设计的,但在利用 PrefixRL 方法的 AI的帮助下,使用深度强化学习优化并行前缀电路,公司可以设计更小、更快、更节能的芯片,同时提供更好的性能。

  计算机芯片中的算术电路是使用逻辑门网络(如 NAND、NOR 和 XOR)和电线构成的。理想的电路应具有以下特点:

  ● 小:较小的区域,以便更多电路可以安装在芯片上。

  ● 快速:降低延迟以提高芯片的性能。

  ● 消耗更少的功率:芯片的功耗更低。

  NVIDIA 使用这种方法设计了近 13000 个 AI 辅助电路,与同样快速且功能相同的 EDA 工具相比,它们的面积减少了 25%。但是PrefixRL 被提到是一项计算要求非常高的任务,并且对于每个 GPU 的物理模拟,它需要 256 个 CPU 和超过 32,000 个 GPU小时。为了消除这个瓶颈,NVIDIA 开发了 Raptor,这是一个内部分布式强化学习平台,它特别利用 NVIDIA 硬件进行这种工业强化学习。

  Raptor 具有多项可提高可扩展性和训练速度的功能,例如作业调度、自定义网络和 GPU 感知数据结构。在 PrefixRL 的上下文中,Raptor使得跨 CPU、GPU 和 Spot 实例的混合分配工作成为可能。

  这个强化学习应用程序中的网络是多种多样的,并且受益于以下几点。

  ● Raptor 在 NCCL 之间切换以进行点对点传输以将模型参数直接从学习器 GPU 传输到推理 GPU 的能力。

  ● Redis 用于异步和较小的消息,例如奖励或统计信息。

  ● 一种 JIT 编译的 RPC,用于处理大容量和低延迟的请求,例如上传体验数据。

  NVIDIA 得出结论,将 AI 应用于现实世界的电路设计问题可以在未来带来更好的 GPU设计。完整的论文在此处,您也可以在此处访问开发人员博客以获取更多信息。

  1. 宁推网原创文章未经授权转载必究,如需转载请联系授权;
  2. 转载时须在文章头部明确注明出处、保留作者和原文链接,如:转自宁推网字样;
  3. 宁推网报道中所涉及的所有内容均由用户提供,仅供参考!
  4. 4、声明:该文观点仅代表作者本人,宁推网系信息发布平台,宁推网仅提供信息存储空间服务。