财经资讯
英伟达计划二季度量产中国版芯片H20
据媒体报道,在美国收紧芯片出口限制的情况下,全球AI芯片领导者英伟达计划在2024年第二季度开始批量生产为中国市场而专门设计的人工智能芯片。媒体援引知情人士的话报道称,专门面向中国市场的H20 AI芯片的初始产量将非常有限,该公司将主要考虑满足大型客户的订单。
英伟达将基于H100推出三款针对中国市场的AI芯片,包括HGX H20、L20 PCle、L2 PCle,这些新产品都是基于英伟达的Hopper和Ada Lovelace架构。
H20的综合算力相比H100降低了约80%。这一变化反映了芯片的性能调整,以适应美国出口管制政策的相关要求。尽管如此,H20仍然具有在特定情况下的性能优势。例如,通过将推理所需的芯片数量从两个减少到一个,如果再使用8位量化,LLAMA 70B模型可以在单个H20上有效运行,而不是需要两个H100。这表明H20在某些应用场景中仍然能提供有效的性能。
从传统算力的角度来看,H20相比H100有所降级,但在LLM推理这一方面,H20实际上会比H100快了20%以上,理由是H20在某些方面与2024年要发布的H200相似。注意,H200是H100的后继产品,专注于复杂AI和HPC工作负载的超级性能芯片。因此,英伟达H20 AI芯片的推出是为了适应美国对中国的出口管制政策,其性能相比于H100有所降低,但在某些应用场景下仍然保持了一定的效率和实用性。
英伟达和其他的大型科技巨头计划在本周于拉斯维加斯举行的消费电子展上公布他们的最新研发成果。该公司预计将在此次活动中展示几款最新的GPU产品,其中将包括RTX 4080 Super, 4070 Ti Super和4070 Super。分析人士普遍预期,英伟达倾向于保持在全球游戏硬件领域的绝对领先地位。
AI芯片“价格博弈”苗头隐现
股票研究以及市场情报提供商Edgewater Research表示,在2023年年底,AI芯片巨头英伟达的人工智能芯片渠道需求展望首次出现“喜忧参半”的预期数据。在需求端,买卖双方“价格博弈”信号已经出现,尤其是一些买家选择观望,等待他们能接受的市场价格。
该公司表示,目前还不清楚为什么英伟达的人工智能GPU需求突然出现了“好坏参半”的数据预测点,不过人们猜测最有可能的原因是全新H200 AI芯片的正式推出,以及最强大竞争对手之一AMD发布号称“最强算力”的AI芯片Instinct MI300X,这一局面导致主要客户在重新考虑GPU采购计划时暂停购买,直至等到英伟达报出他们认为合理的市场价格。然而,该研究机构补充表示:“这也可能表明2024年中期的英伟达新产品潜在需求将因性能等优势而重新加速。”
AMD并未透露MI300X的定价,但AMD首席执行官苏姿丰表示,AMD的芯片必须比英伟达的芯片购买和运营成本更低,才能说服潜在大客户购买。
全球AI芯片领导者英伟达在AI芯片领域份额接近90%,AMD则远远不及英伟达,然而在AMD发布号称“最强算力”的AI芯片Instinct MI300X之后,英伟达垄断地位毫无疑问将面临来自AMD的巨大威胁。“Advancing AI”发布会上,AMD将截至2027年的全球AI芯片市场规模预期,从此前预期的1500亿美元猛然上修至4000亿美元,而2023年AI市场规模预期仅仅为300亿美元左右。华尔街大行花旗预计2024年AI芯片市场规模将在 750亿美元左右,同时预计AMD能够占据 10% 左右的市场份额。