字节跳动与台积电合作生产自有AI GPU,减少对英伟达的依赖,降低成本,且不受出口限制

据《The Information》报道,字节跳动正在开发两款AI GPU,预计将在2026年进入量产阶段,这两款产品将由台积电制造,博通负责设计。此前,博通也已为谷歌制造过AI芯片。

报道还提到,如果这个来非官方信息是对的,字节跳动将减少对英伟达的依赖。更重要的是,这种做法其实是不违反美国的出口管制法规的。

字节跳动的AI GPU系列目前正处于设计阶段,预计在一年后或更晚进入量产。该系列包括一款用于AI训练,另一款用于AI推理。

据说,这些GPU将采用台积电的N4/N5工艺技术生产,与台积电给英伟达Blackwell系列AI和HPC GPU使用的4NP节点类似。字节跳动的GPU预计在2026年进入量产,预计将在2026年开始部署。

报道称,字节跳动今年已经下单了超过20万块H20,花费超20亿美元,算下来,每块约1万美元。目前,而许多GPU还没有实际交付。如此规模的投资凸显了字节跳动对于AI的重视。

根据报道,英伟达GPU的短缺,以及高昂的价格是字节跳动决定开发自有AI硬件的原因之一。为了应对美国实施的出口管制,英伟达专门为中国市场设计了包括DGX H20、4090D在内的一些显卡。

事实上,HGX H20是一款H100的性能阉割版,即便如此,售价仍高达1万美元。英伟达的HGX H20仅提供296 INT8/FP8 TOPS/TFLOPS和148 BF16/FP16 TFLOPS的AI计算性能,而完整的H100则能提供3958 INT8/FP8 TOPS/TFLOPS以及1979 BF16/FP16 TFLOPS的性能。

然而,HGX H20仍配备了96GB的HBM3内存,支持高达4.0TB/s的内存带宽,并具有构建8路GPU能力,因此在实际应用中,很多中国公司仍会买单。据报道,英伟达处理器在性能上击败了国内某大厂的同类竞品。

由于美国的出口管制规定,台积电无法向字节跳动交付更高性能的GPU,因此字节跳动的GPU在性能上可能无法超越英伟达的HGX H20,但对于字节跳动而言,它们至少会显著降低成本。

当然,字节跳动开发自有AI GPU的计划也面临巨大挑战。

目前字节跳动依赖英伟达的CUDA及其配套软件栈进行训练和推理。一旦转向自有芯片,它将必须开发自己的软件平台,并确保其软件栈与硬件完全兼容。

虽然许多许多国内公司都开发了AI GPU以减少对英伟达的依赖,但这些芯片仅用于特定的工作负载,其他大部分场景仍然依赖于英伟达。

此前有报道提到,英伟达预计今年将向中国客户交付超过一百万块HGX H20,这几乎是中国本土某款AI加速器的两倍。

英伟达的H20 GPU可能会创造超过120亿美元的收入,超过该公司去年在中国所有硬件销售(包括游戏GPU)的总收入。

本文仅作学习交流,编辑时用AI翻译,人工校对编辑后有少许修改。原文地址如下:

https://www.tomshardware.com/tech-industry/artificial-intelligence/tiktok-owner-bytedance-taps-tsmc-to-make-its-own-ai-gpus-to-stop-relying-on-nvidia-the-company-has-reportedly-spent-over-dollar2-billion-on-nvidia-ai-gpus