1月5日,拉斯维加斯。黄仁勋再度向全球抛出“重磅炸弹”——Rubin。其训练性能是Blackwell的3.5倍,AI软件运行性能飙升5倍;但推理成本,仅为前代的1/10。但这种惊人的表现,却是被逼出来的。实际上,TPU和可重构数据流架构(RPU)的崛起,正凶猛侵蚀英伟达的霸权。
去年11月,Meta拟采用谷歌TPU的传闻一出,英伟达一夜蒸发数千亿美元。焦头烂额的黄仁勋,不得不光速出手,将可重构数据流芯片公司Groq收入囊中。如今,Groq的并购与Rubin的发布,共同指明了AI芯片的“收敛时刻”:更高性能的通用芯片,才是所有人要奔赴的终极战场。

2025年圣诞节,英伟达豪掷200亿美元(约1400亿人民币),买了一家“非GPU”公司——Groq。英伟达以其持有现金三分之一的巨资,打包买走了Groq的核心技术、图纸和核心人才。
三个月前,Groq的估值还仅为69亿美元。如今,黄仁勋抛出3倍溢价,对Groq志在必得。而Groq主攻的,是特有的LPU芯片技术,即用软件定义硬件的“可重构数据流架构”。这种独特的设计,能让LPU在处理大模型时,实现Token“瞬时”+“准时”的吞吐,超越GPU、TPU的物理极限,实现比GPU快5-18倍、能效比高10倍的突破,加之Groq是由谷歌TPU之父创办,因而被称为“高阶TPU”。这是英伟达真正缺乏,或许也是让黄仁勋心动不已的技术。
在AI从“训练”向“推理”转换的时代,可重构数据流架构将是GPU难以抵挡的存在。感受到风向的,不只是英伟达。去年底,英特尔已与美国可重构AI芯片独角兽SambaNova签下一份收购意向书,要在可重构赛道施展拳脚。而在大洋彼岸的中国,一则中国芯片企业融资的消息,同样意味深长。2025年12月2日,北京四大明星芯片公司清微智能宣布,完成超20亿元人民币的C轮融资。清微智能打造的RPU,与Groq的LPU,属于同源的可重构数据流技术路线。中美两国的超级资本,几乎不约而同押注在“可重构”这个关键战场。
在“榜一大哥”们相继投下重注后,2026年AI芯片三大技术流派至此可见端倪:一是GPU派,二是ASIC派,三是可重构数据流派。
GPU派,以英伟达、摩尔线程为代表,是当今AI芯片领域的绝对霸主。但GPU芯片的性能提升,非常依赖于半导体制程的极限突破,以及HBM带宽的艰难提升。当“内存墙”、高功耗等问题席卷而来,GPU为通用性付出的代价,让效率的进一步提升困难重重。于是,就有了ASIC派,以谷歌TPU、寒武纪、百度昆仑芯为代表。ASIC架构,走的是一种“特种兵路线”。它是一种为特定算法深度定制的集成电路,通过将硬件与算法深度绑定,实现AI运算的极致能效。
但ASIC的短板也很明显,一旦算法迭代,硬件难匹配,芯片就有过时、甚至被废的风险。那AI芯片,能不能既能实现高性能、低功耗,又能够根据算法变化,实现硬件灵活重构?
于是,“可重构数据流派”正式登场。像Groq的LPU、清微智能的RPU,都属于这一派。它的核心,是“软件定义硬件”。也就是说,RPU内部的硬件资源,可通过软件指令、实时重组,所以像一条可以随时调整工序的智能流水线。这种兼具ASIC高效能和GPU灵活性的可重构芯片(RPU),又被称为芯片界的“变形金刚”。