邮件咨询
给 willyb@xm.com 留言
发送邮件咨询,第一时间回复。
精彩导读:
大家好,今天XM外汇将为大家带来“「AI新世代」从GPU到LPU:英伟达大举进攻推理芯片,黄仁勋再落决定性一子”。希望对你们有所帮助!原创内容如下:
今天3月18日),随着冷空气东移,东北、华北等地将迎来降温,部分地区降幅可超10℃,明天起气温又会回升。西南地区至长江中下游一带未来三天阴雨天气持续,气温仍偏低,湿凉感明显。同时,青藏高原一带多雨雪天
AI产业的新世芯片勋再风向变了。前几年,代从U到大举定性所有人都在拼命“训模型”——把信息喂给GPU,伟达xm外汇账户安全等它长出智能,进攻那时候,推理英伟达的黄仁GPU是唯一的王,谁也撼不动,落决但这两年,新世芯片勋再智能体成群结队地涌向领域,代从U到大举定性Manus出圈,伟达OpenClaw刷屏,进攻模型厂商和云服务商开始靠卖token赚钱,推理Cerebras们举着“更快、黄仁更便宜”的落决旗号,在英伟达霸占多年的新世芯片勋再版图上撕口子。
业界终于意识到:训练还在持续,但“推理”已经成为主流。英伟达自然不会错失这一领域机遇,xm外汇账户安全推理这块蛋糕,它也要切一刀。3月17日凌晨,在GTC 2026上,英伟达CEO黄仁勋亮出新武器——Groq 3 LPU,大举进攻推理芯片领域。同时他甩出一组数字:到2027年底,Blackwell和Rubin两条产品线的年收入将达1万亿美元,比半年前的推测翻了一倍。
训练推理两手抓
这次英伟达正式推出Vera Rubin平台,共搭载7款芯片,分别是Rubin GPU、Vera CPU、ConnectX-9 SuperNIC、BlueField-4 DPU、NVLink 6 Switch、Spectrum-X 102.4T CPO,以及新集成的Groq 3 LPU。
“LPU”全称为“Language Processing Unit”,即语言答复单元,是一款专用的AI推理加快芯片。Rubin GPU结合Groq LPU,将把当下每秒100个token的吞吐量,推向每秒1500个token甚至更多,从而完美支撑AI智能体交互场景。
英伟达还推出了一个专用于容纳新型Groq加快器的充分机架——Groq LPX。据英伟达超大规模与高性能计算副总裁Ian Buck介绍,Groq LPX将深化“每个令牌上AI模型每一层”的解码性能,并使Rubin能够服务于人工智能的下一个前沿领域:多智能体系统,这些系统需要在推理数万亿个参数的模型的同时,在数百万个token的上下文窗口中供给交互式性能。
英伟达对推理芯片领域的觊觎并非始于今日,而是早有准备。2025年12月,该公司就以约200亿美元的价格收购Groq的重点技术资产,其创始人加入英伟达,Groq 3 LPU是收购后首个公开效益。
基于高盛全球投资调查部的模型推测,在AI服务器的AI芯片中非GPGPU芯片的出货占比将呈现明晰上升趋势,推测将从2024年的36%逐步延伸至2027年的45%,而GPGPU芯片的出货占比推测将从2024年的64%逐步削减至2027年的55%。
InSemi Research高级解析师秦丰伟向本报记者介绍道,GPU在基座大模型训练、通用性要求更高的场景(如公有云)、并行计算场景会更有对抗力,而ASIC(包括TPU、DPU、NPU、LPU等)在模型部署时期、在推理场景下对照更有优势,因为这些场景对能效比、响应延迟等方面要求更高。
“所以英伟达推出LPU,是答复AI算力要求从‘训练’转向‘推理’的方针性布局,这是补齐短板的一步决定性棋。它用更精深刻的产品布局,答复了领域改变和对抗对手的挑战。”深度科技调查院院长张孝荣对本报记者说。
据媒体报道,英伟达答复日益延伸的推理要求的安排已为其带来了回报,OpenAI上月表明,已与英伟达达成合同,将采购具有“专用推理能力”的芯片。
从芯片到工厂的生态升级
过去几年,生成式AI引爆领域,大模型训练成为绝对的算力黑洞,凭借GPU的绝对主导地位,英伟达吃下了这轮热潮的大部分红利,业绩与市值双双狂飙,赚得盆满钵满。
然而,随着模型参数比拼进入边际效应递减的瓶颈期,大模型训练在狂奔两年后终于慢了下来。2025年开始,对抗的轴心就开始偏移——智能体与上下文工程站上C位。最直接的信号是:OpenClaw攻陷社交平台,从科技圈一路破圈,挤进普通人的信息流里。
智能体是鼓励推理领域要求延伸的一大决定性因素,其重点场景更侧重于推理,而非训练,这一看法在多项权威调查和行业解析中得到明晰支持,所以当AI能力从基础大模型的训练时期向注重构建工作流的智能体演进时,AI算力要求重心已从训练转向推理。
而作为AI基础设施的头号玩家,英伟达自然也要顺应领域潮流进行改变,而且是整个生态层面的升级。
此次GTC大会上,除了推出LPU,英伟达还配合以OpenClaw创始人Peter Steinberger为代表的团队,召集了一批顶级支撑与计算专家,推出NeMoClaw参考架构,它内置OpenShell技术、网络防护机制和隐私路由能力,可以让企业在自己的私有氛围中支撑运行智能体系统。
英伟达甚至推出了Vera Rubin DSX AI工厂参考构思,教大家如何构思、扩展和运营整个AI工厂基础设施堆栈,涵盖计算、NVIDIA Spectrum-XEthernet网络以及存储,以达到可重复、可延伸且最优的集群性能。
黄仁勋表明:“在AI时代,智能token是新的货币,而AI工厂是生成这些token的基础设施。借助Vera Rubin DSX AI Factory参考构思和Omniverse DSX Blueprint(数字孪生蓝图),我们正在供给构建世界上最高生产力AI工厂的基础,加快首次收入时间,并最大化规模和能源效益。”
至于推出LPU后,英伟达旗舰GPU的占比会有怎样的改变,《华夏时报》记者就此采访了英伟达方面,截至发稿未接到回复。“英伟达进军推理芯片领域,并不意味着GPU业务会因此受损,反而会在与LPU的协同中,迎来更广阔的领域空间。”张孝荣说。
智参智库特聘专家袁博指出,短期内,GPU凭借强大的场景回应性和生态壁垒主导领域,特别是在AI训练场景,长远来看,两条路线并非完全对立,而将走向融合与领域分层。“硬件上,GPU会集成更强的专用重点,而专用芯片也会深化可编程性。领域上,推测将形成其主导革新与通用平台、专用芯片深耕规模化推理的分层格局。”
在ASIC领域,其实已经集结了一批英伟达的对手,包括国外的Cerebras,中国的寒武纪、华为、燧原科技等。张孝荣认为,英伟达进军推理芯片领域,对于国内厂商而言既是挑战也是催化剂,会形成“挤压”与“倒逼”并存的复杂局势,这将加快行业洗牌和技术升级。
以上内容就是关于“「AI新世代」从GPU到LPU:英伟达大举进攻推理芯片,黄仁勋再落决定性一子”的全部内容,是由XM外汇小编认真整理编辑的,希望对你的交易有所帮助!感谢支持!
记者今天17日)从国家消防救援局获悉,2025年出现的28万起居住场所火灾中,因电气故障引发的火灾占比高达44%。从起火部位看,厨房和卧室占比近一半,其中厨房3
免责声明: XM Group仅提供在线交易平台的执行服务和访问权限,并允许个人查看和/或使用网站或网站所提供的内容,但无意进行任何更改或扩展,也不会更改或扩展其服务和访问权限。所有访问和使用权限,将受下列条款与条例约束:(i) 条款与条例;(ii) 风险提示;以及(iii) 完整免责声明。请注意,网站所提供的所有讯息,仅限一般资讯用途。此外,XM所有在线交易平台的内容并不构成,也不能被用于任何未经授权的金融市场交易邀约和/或邀请。金融市场交易对于您的投资资本含有重大风险。
所有在线交易平台所发布的资料,仅适用于教育/资讯类用途,不包含也不应被视为用于金融、投资税或交易相关咨询和建议,或是交易价格纪录,或是任何金融商品或非应邀途径的金融相关优惠的交易邀约或邀请。
本网站上由XM和第三方供应商所提供的所有内容,包括意见、新闻、研究、分析、价格、其他资讯和第三方网站链接,皆保持不变,并作为一般市场评论所提供,而非投资性建议。所有在线交易平台所发布的资料,仅适用于教育/资讯类用途,不包含也不应被视为适用于金融、投资税或交易相关咨询和建议,或是交易价格纪录,或是任何金融商品或非应邀途径的金融相关优惠的交易邀约或邀请。请确保您已阅读并完全理解,XM非独立投资研究提示和风险提示相关资讯,更多详情请点击 这里