The Lab · 2026-03-26 01:09:57 · 虎嗅 (RSSHub)
英伟达的叙事核心已从芯片转向了更具野心的“Token经济学”。在刚结束的GTC大会上,黄仁勋宣告AI“推理拐点”已至,并描绘了一个在未来21个月内价值高达1万亿美元的GPU订单预期。这一巨变背后,是OpenClaw等智能体生态的爆火,驱动了全球范围内对推理算力,尤其是Token消耗量的指数级需求。英伟达正试图将其生态体系构建成一个包含芯片、系统、软件、网络和服务的五层“蛋糕”,而Token经济被视为其中更持久、更庞大的市场。
北美市场的需求暴增主要源于多模态内容生成和代码生成,而OpenClaw带来的Token需求狂潮则在中国市场表现得尤为激烈。新云厂商GMI Cloud创始人Alex Yeh透露,其客户正从大型训练需求快速转向需...
The Lab · 2026-03-26 11:09:27 · 36氪最新 (RSSHub)
英伟达的叙事核心已不再是芯片。在2026年的GTC大会上,黄仁勋宣告了AI推理的拐点到来,并将公司的未来押注于一个更具野心的市场——Token经济学。这背后是未来21个月内高达1万亿美元的GPU订单预期,一个由多模态AI应用和OpenClaw引爆的全球算力需求所驱动的惊人数字。然而,这场盛宴正暴露并加剧着全球AI供应链的深层失衡。
黄仁勋的演讲建立在两个关键事件之上:AI应用的实际落地,以及OpenClaw的爆火带动了全球Agent生态。新云厂商GMI Cloud创始人Alex Yeh指出,北美需求的暴增主要来自多模态和代码生成,而由OpenClaw驱动的Token推理需求则在中国市场表现得更为猛烈。Alex观察到,Token的使...
The Lab · 2026-03-26 11:39:49 · 华尔街见闻 (RSSHub)
国产GPU设计公司沐曦股份披露了其2025年财务数据,展现出营收的强劲增长与亏损状况的显著改善。报告期内,公司实现营业收入16.44亿元人民币,同比大幅增长121.26%。与此同时,其净亏损从上年同期的14.09亿元收窄至7.9亿元,亏损幅度大幅减少。这份成绩单标志着公司在商业化进程和成本控制方面取得了关键进展。
作为国内高性能GPU领域的重要参与者,沐曦股份的营收翻倍增长,直接反映了其产品在市场上的接受度与商业化落地速度。净亏损的收窄,则表明公司在扩大收入规模的同时,运营效率可能有所提升,或获得了更有利的成本结构。这一财务表现发生在全球AI算力需求激增、国产替代加速的行业背景下,显得尤为关键。
尽管亏损大幅收窄,但7.9亿元的...
The Lab · 2026-03-26 15:09:32 · 财新最新 (RSSHub)
国产GPU新锐沐曦股份交出了上市后的首份成绩单,营收狂飙与巨额亏损并存,揭示了行业在高速扩张期面临的真实挑战。2025年,公司实现营业收入16.4亿元,同比激增121.26%,主要受GPU产品出货量大幅提升驱动。然而,亮眼的营收增长背后,是高达8.3亿元的扣非归母净亏损。尽管亏损额较上年收窄了2.1亿元,但这一数字仍凸显了公司在技术研发、市场拓展和产能爬坡上的巨大投入压力。
具体来看,沐曦的产品矩阵包括训推一体C系列、智算推理N系列和图形渲染G系列GPU。2025年,其核心的训推一体GPU销量达到3.36万片,同比增长147.31%;而推理GPU销量为4946片,同比增幅更是超过800%。这份数据清晰地勾勒出沐曦在人工智能算力市场...
The Lab · 2026-03-27 04:09:35 · 钛媒体
英伟达不再只讲芯片故事。在2026年的GTC大会上,黄仁勋将叙事核心转向了“Token经济学”,并抛出一个震撼数字:未来21个月,英伟达GPU订单的预期收入将达到1万亿美元。这一预测建立在两个关键趋势之上:AI应用进入大规模落地阶段,以及OpenClaw的爆火带动了全球Agent生态的繁荣。黄仁勋在演讲中高呼“推理拐点已经到来”,标志着英伟达的商业逻辑发生了根本性转变——从向云厂商和AI公司销售芯片,转变为向全世界每一家公司销售“Token”。
这一战略转向在GTC的预热文章“AI五层蛋糕”中已有预示。黄仁勋强调的不再是单一芯片性能,而是垂直整合能力与庞大的生态系统。新云厂商GMI Cloud创始人Alex Yeh透露,北美市场的...
The Lab · 2026-03-27 13:40:16 · 华尔街见闻 (RSSHub)
北京智源人工智能研究院主导的众智FlagOS项目取得关键进展,其AI训练“全要素”验证结果正式发布。此次验证的核心焦点,落在了国产GPU厂商摩尔线程的AI训推一体全功能GPU智算卡MTT S5000上。该芯片成功完整适配了FlagOS的训练全要素软件栈,标志着国产AI算力在关键软件生态适配层面迈出了实质性一步。
验证过程极具挑战性:摩尔线程MTT S5000面向通义千问Qwen3-0.6B语言模型,完成了高达1T Tokens的从头训练验证。整个训练过程实现了连续6天以上、超过14000步的无中断稳定运行,其Loss曲线的平均相对误差被严格控制在0.82%以内。这一稳定性数据,是衡量国产硬件在长期、高强度AI训练任务中可靠性的关键...
The Lab · 2026-03-28 06:28:17 · Nvidia
Nvidia CEO Jensen Huang在星期一的Nvidia GTC会议上作主旨发言时,揭幕了DLSS 5,这是该公司AI动力图形升级技术的最新转录。 新系统代表了电子游戏和其他潜在视觉应用方式的根本转变,将传统的3D图形数据与能够预测和合成视觉元素的基因化人工智能模型结合起来。 DLSS 5利用黄先生所说的三维可控图形的融合,他将其定性为提供结构化数据的虚拟世界地面真实数据、基因性人工智能和概率计算。 这种混合方法使Nvidia的图形处理单位能够制作详细的场景和像生命一样的字符,而不会从零开始造成每个要素的变化,从而有可能改变实时图像的计算要求。 Huang在其主旨发言中强调,这种用基因改变的AI将结构化信息引信的概念除了...
The Lab · 2026-03-29 04:40:19 · 36氪最新 (RSSHub)
一张来自GPU公司沐曦的内部成本分析图,正在AI算力圈内引发一场认知颠覆。该图表拆解了一座1GW超大规模数据中心为期四年的总拥有成本(TCO),总额高达550亿美元。其中,最令人震惊的数字是电费——仅27.5亿美元,占总成本的比例低至5%。这一数据直接挑战了长期流行的“中国电价优势论”,揭示了在AI算力竞赛的真实成本结构中,电费的影响力微乎其微。
真正的成本巨兽是GPU硬件本身。根据图表,仅GPU芯片采购一项就高达250亿美元,占总成本的45%。紧随其后的是被GPU高功耗倒逼出来的供电与散热系统,成本110亿美元,占比20%。网络(50亿)与存储(40亿)合计占比16%。这四大硬件板块合计吞噬了总成本的82%。图表清晰地表明,决定...
The Lab · 2026-03-29 06:30:51 · NVIDIA
NVIDIA在GTC 2026上公布DLSS 5, 在赌博界引发了重大争议。 尽管开发商对新神经转换技术提出技术批评, 由首席执行官黄詹(Jensen Huang)命名为“GPT图形时刻”, DLSS 5与以前侧重于升级和框架生成的版本相比,是一个根本转变。 新的神经转换技术需要一种游戏的颜色缓冲和运动矢量,然后通过人工智能驱动图像生成来重新解释它们。 该系统应用了先进的效应,包括地表下散射到皮肤质素中、木料中的胶片以及增强的毛发、照明和阴影化(荷兰国际空间研究所称其为好莱坞一级实时产生的光现实主义)。 技术演示需要双重RTX 5090图形卡——一个处理标准游戏制作,另一个处理神经模型。 NVIDIA表示,在计划于2026年秋季公开...
The Lab · 2026-03-30 01:09:35 · 36氪
AI算力军备竞赛的核心战场,正从单卡性能转向集群效率。中信证券最新研报指出,通过高带宽、低时延网络将多张加速卡紧密连接的“超节点”架构,已成为明确的产业趋势,其内存池化等机制正极大提升AI训练与推理效率。这一结构性变革,正在GPU集群内部催生出三个明确的百亿美元级增量市场。
随着英伟达等巨头推动超节点提效扩容,产业链的受益环节高度聚焦。报告测算,至2028年,GPU间交换芯片、液冷、柜内电源三大环节的增量市场空间将分别达到1000亿、130亿和240亿美元。其中,交换芯片作为连接GPU的“神经网络”,因技术壁垒高、格局稳定,商业属性优异,成为最具看点的核心增量。尤为关键的是,伴随算力芯片国产化,交换芯片领域正开启明确的国产替代窗口...
The Vault · 2026-03-30 01:10:15 · 36氪最新 (RSSHub)
中国AI创投圈正迎来一批新的关键面孔。过去三个月,几家乘上AI东风的公司——摩尔线程、沐曦、MiniMax——在资本市场引发震动,其背后几位长期低调的女性联合创始人开始走向台前。她们的角色从财务、运营到市场落地,成为这些明星公司不可或缺的“最佳拍档”,共同缔造了AI时代独特的合伙人故事。
在摩尔线程,联合创始人兼首席运营官周苑是创始人张建中从英伟达带来的老同事。她于2004年至2020年在英伟达担任市场生态高级总监,拥有长达16年的行业积累。2020年公司创立之初,周苑分管财务,后于2023年进入董事会,全面负责公司内部治理与研发管理体系建设。她极少公开露面,但却是支撑公司“小跑进入科创板”的关键内部操盘手。在MiniMax,31...
The Lab · 2026-03-30 11:39:27 · 36氪
国产GPU公司摩尔线程近日公告,与某客户签订了一份总金额高达6.6亿元人民币的重大产品销售合同。这笔交易不仅是公司日常经营中的重大合同,其标的物更是摩尔线程自主研发的核心产品——夸娥(KUAE)智算集群。合同的签订标志着摩尔线程在国产高性能计算与人工智能基础设施领域取得了实质性的商业突破,其产品获得了市场认可。
根据公告,公司已履行了必要的内部审批程序。值得注意的是,基于商业秘密及信息披露豁免的相关规定,摩尔线程对合同对方的部分关键信息,如客户具体身份,予以了豁免披露。这种对客户信息的保密处理,在涉及重大商业合同和高技术产品交易时并不罕见,但也为这笔巨额订单的背景和最终应用场景增添了一层神秘色彩。
这笔6.6亿元的订单,对正处于...
The Lab · 2026-03-30 15:09:29 · 澎湃新闻 (RSSHub)
“国产GPU四小龙”之一的壁仞科技交出了一份营收狂飙但亏损加剧的2025年成绩单。3月30日盘后,这家上海AI芯片公司发布公告,2025年收入达10.35亿元,同比激增207.2%,毛利也同步增长至5.57亿元。然而,在营收翻两倍的亮眼数据背后,是经调整年内亏损同比扩大13.9%至8.74亿元的现实,凸显了公司在激烈市场竞争中为保持技术领先而持续“烧钱”研发的沉重压力。
财报细节揭示了公司的战略重心与潜在风险。研发开支高达14.76亿元,同比增长78.5%,远超营收增速。同时,公司存货余额飙升至9.49亿元,同比暴增520.4%,官方解释是为应对下游旺盛需求并确保供应链韧性。这意味着大量资金被锁定在库存中。尽管公司手握包括IPO募...
The Lab · 2026-03-31 09:10:07 · 澎湃新闻 (RSSHub)
港股“国产GPU第一股”壁仞科技交出首份年度成绩单,展现出高速增长与巨额亏损并存的典型国产芯片企业画像。2025年,公司实现收入10.35亿元,同比激增207.2%,毛利率提升至53.8%。然而,在亮眼营收的另一面,是高达14.76亿元的研发投入和近8.74亿元的经调整年内亏损,凸显了其在技术攻坚期的巨大投入压力。
作为“国产GPU四小龙”之一,壁仞科技的增长引擎明确指向其旗舰产品的规模化交付。报告期内,公司完成了BR106及BR166系列GPU的全形态量产与规模交付,其中BR166系列在2025年8月量产后快速落地,成为业绩跨越式增长的关键。公司已成功交付多个千卡级智算集群,包括2048卡光互连集群,客户覆盖国家级算力平台、电信...
The Lab · 2026-03-31 13:39:27 · 36氪最新 (RSSHub)
AI大模型参数规模持续膨胀,单卡算力与显存的物理上限,正迫使AI训练集群规模不断扩张。在这场决定性的算力竞赛中,网络性能已成为释放集群全部潜力的关键瓶颈。更高的网络带宽,直接意味着能将模型训练周期大幅压缩。而突破这一瓶颈的公认技术路径,正是RDMA(远程直接内存访问)。
RDMA技术的起源,可追溯至2009年NVIDIA与Mellanox为解决GPU通用计算时代的通信瓶颈而共同研发的GPU Direct RDMA。当时,GPU已成为高性能计算的核心加速器,但集群中不同节点GPU间的数据传输仍需CPU介入,严重拖累了整体效率。双方合作探索的解决方案,最终在2012年随Kepler架构GPU和CUDA 5.0一同发布。在此之前,传统数...
The Lab · 2026-04-03 10:29:46 · 36氪
国产高性能GPU赛道迎来关键软件突破。沐曦股份与上海人工智能实验室联合发布了一套名为Kernel-Smith的高性能GPU算子生成系统。该系统并非简单的工具迭代,其核心在于将“稳定评估驱动的进化智能体”与“面向进化的后训练范式”进行深度融合,旨在从根本上提升GPU底层算子的开发效率与性能。
此次合作的关键在于技术路径的独特性。Kernel-Smith系统依托上海人工智能实验室的书生大模型Intern-S1-Pro作为基座能力,并在此基础上进行了深度定制化训练。这意味着,该系统试图利用大模型的生成与优化能力,来攻克GPU编程中极为复杂、高度依赖专家经验的算子开发难题,为国产GPU的软件生态建设提供了一种新的自动化解决方案。
这一发...
The Lab · 2026-04-03 10:30:02 · 华尔街见闻 (RSSHub)
沐曦股份与上海人工智能实验室联合发布了一项关键AI基础设施技术——高性能GPU算子生成系统Kernel-Smith。该系统并非简单的工具迭代,其核心在于将“稳定评估驱动的进化智能体”与“面向进化的后训练范式”进行深度融合,旨在从根本上提升GPU算子的生成与优化效率。这一发布标志着国内在利用大模型技术优化底层硬件计算性能的路径上,迈出了实质性的一步。
该系统深度依托上海人工智能实验室的书生大模型Intern-S1-Pro作为基座能力,并进行了深度定制化训练。其设计目标是让大模型真正化身为“算子优化大师”,通过智能化的方式自动生成和优化GPU核心计算单元(算子),以应对日益复杂的AI计算任务对底层算力提出的苛刻要求。沐曦股份作为高性能...
The Lab · 2026-04-08 12:59:22 · 36氪最新 (RSSHub)
当GPU算力以每季度翻番的速度狂飙,产业的核心矛盾已从单纯的算力竞赛,转向了算力与存储之间的尖锐对立。HBM虽因“近显存级带宽”成为AI服务器的标配,但其高昂成本与规模化部署逻辑相悖,将多数企业挡在门外。与此同时,作为传统“容量担当”的HDD,其机械结构导致的性能短板,在AI训练中已成为导致“数据等待算力”的致命缺陷。GPU的无限算力需求,正与现有存储方案的有限适配能力激烈碰撞。
在这一矛盾中心,面向AI工作负载优化的SSD价值被急剧放大。它并非仅是“容量大”的通用存储,而是为大模型训练与推理量身定制的专用方案。其核心目标在于解决“高性能、高并发、低延迟、高耐久、大容量”的综合需求,旨在打破传统架构中CPU中转的瓶颈,让高端GPU...
The Lab · 2026-04-16 01:03:02 · 36氪
埃隆·马斯克旗下的人工智能公司xAI,正计划与编程工具初创公司Cursor达成一项关键合作。根据知情人士透露,这项合作的核心是xAI将向Cursor开放其庞大的计算基础设施,后者将利用这些算力来训练其最新的AI编程模型Composer 2.5。这意味着,Cursor的模型开发将直接运行在xAI的数万块图形处理器(GPU)集群之上,这为一家初创公司提供了通常只有科技巨头才拥有的顶级硬件资源。
此次合作标志着马斯克在AI领域的布局正从模型开发向底层基础设施服务延伸。xAI不仅拥有自己的大模型Grok,其积累的算力资源如今也开始成为一项可对外输出的战略资产。对于Cursor而言,获得如此规模的算力支持,将极大加速其编程辅助模型的迭代与性...
The Lab · 2026-04-16 02:33:02 · 华尔街见闻 (RSSHub)
英伟达CEO黄仁勋近日抛出了一个颠覆性的公司定位,他宣称英伟达的核心业务并非销售图形处理器(GPU),而是进行一场更根本的价值转换:将“电子转化为Token”。这一表述直接触及了人工智能时代计算本质的哲学层面,将公司的角色从硬件供应商提升为价值创造的基础设施构建者。黄仁勋强调,这一转化过程需要艺术、工程与科学的巨大投入,并且目前“远未完成”,暗示了英伟达未来长期的技术野心与市场叙事。
这一战略定义的核心在于,英伟达正致力于构建一个庞大的生态系统。其目标是以最少的投入,实现从原始电子信号到高价值AI Token(可理解为数据单元或价值载体)的最高效转化,从而让计算能力得以持续释放价值。这不仅仅是技术路径的阐述,更是商业模式的宣言。它...