保定市2024年“圆梦≡女孩志愿行动↓”启动仪式在◥高阳举行
2024-08-27 05:17:53
URL: /4xercu/leg/Content/20240827_102288.html
8月24日消息,英伟达》邀请部分媒体举办吹风会,向科技记者首次展示了Blackwell平台。英伟达将出席8月25-27日举办的HotChips2024活动,展示Blackwell平台在数据中心投入使用的相关情况。
否认Blackwell推迟上市消ξ息
英伟达在本次吹风会上,驳斥了Blackwell推迟上市ζ 的消息,并分享了更多数据中心Goliath的相关信息。
英伟︽达在吹风会上演示了Blackwell在其一个数据中心的运行情况,并强调Blackwell正在按计划推进「,并将于今年晚些时候←向客户发货。
有消息称Blackwell存在某种缺陷▅或问题,今年无法投放市场,这种说法是站不住脚的。
Blackwell简介
英伟〒达表示↘Blackwell不仅仅是一款芯片,它还是一个平台卐。就像Hopper一样,Blackwell包含面向数据中心、云计算和人工智能客户的大量※设计,每个Blackwell产品都由不同的芯片组成。
IT之家附上包括∏的芯片如下:
BlackwellGPU
GraceCPU
NVLINKSwitchChip
Bluefield-3
ConnectX-7
ConnectX-8
Spectrum-4
Quantum-3
Blackwell桥架
英伟Ψ 达还分享了Blackwell系列产品中各种桥架的全新图片。这些是首次分享的Blackwell桥架图片,展示了↓设计下一代数据中心平台所需的大量专业工程技术。
目标「万亿参数AI模型
Blackwell旨在满足现代人工智能的需求,并为大型语言模型(如Meta的405BLlama-3.1)提供出色◇的性能。随着LLMs的规模越来越大,参数也〖越来越多,数据中心将需要更多的计算和更低的延迟。
多GPU推理方法
多GPU推∩理方法是在多个GPU上进行计算↙,以☆获得低延迟和高吞吐量,但采用多GPU路线也有其复①杂性。多GPU环境中的每个GPU都必须将计算结果◤发送给每一层的其他GPU,这就需要高带宽的GPU对GPU通信。
多GPU推理方法是在多个GPU上进行计算,以获得低延迟和高吞吐量,但采用多GPU路线也有其复杂性。多GPU环境中的每个GPU都必须将计算结果发送给每一层的其他GPU,这就需要高带宽的GPU对GPU通信。
更快的NVLINK交换机
通过Blackwell,NVIDIA推出了ω速度更快的NVLINK交换机,将结构带宽提高了一倍,达到1.8TB/s。NVLINK交换机本身是基于台积电4NP节点的800mm2芯片,可将NVLINK扩展到GB200NVL72机架中的72个GPU。
该芯片通过72个端口提供7.2TB/s的全■对全双向带宽,网内计算能力为3.6TFLOPs。NVLINK交换机托盘配有两个这样的交换机,提供高达14.4TB/s的总带宽。
水冷散热
英伟达采用水冷散热,来提升性能和效率。GB200、GraceBlackwellGB200和B200系统将采用这些新的液冷◎解决方案,可将数据中心设施的电力成本最多降低28%。
首张使用FP4计算生成的人工智能图像
英伟达?(NVIDIA?)还分享了全球首张使用FP4计算生成的人工智能图像。图中显示,FP4量化①模型生成的4位■兔子图像与FP16模型非常□相似,但速度更快。
该图像由MLPerf在稳定扩散中使用Blackwell制作而成。现在,降低精度(从FP16到FP4)所面临的挑战是会损失一些精◤度。