The Lab · 2026-03-30 09:10:28 · 36氪最新 (RSSHub)
DeepSeek的网页和App服务在经历了超过10小时的异常中断后终于恢复,但这次事故为即将到来的DeepSeek-V4发布敲响了警钟。从3月29日晚间到3月30日上午,服务经历了两次明显的故障周期,官方状态页显示,核心问题并非笼统的“全站”瘫痪,而是出在关键的“Web Chat Service”上。这意味着,承载用户访问的前端接入层、会话管理和调度系统成为了最脆弱的环节,而模型推理的后端服务本身可能并未受到系统性影响。这并非一次计划内的维护,而是一次连续复发的服务故障,凸显了平台在应对突发流量压力时的脆弱性。
此次故障的直接影响范围集中在用户与AI交互的“最后一公里”。Web Chat Service负责管理从用户登录、建立对话...
The Lab · 2026-03-31 11:10:19 · 36氪最新 (RSSHub)
国产大模型之光DeepSeek遭遇了自年初爆红以来最严重的一次服务中断。从3月29日晚21:35至30日上午10:33,其网页端与App端服务全线停摆近13小时,官方状态页面亮起红色预警,工程师连夜抢修。这场“重大故障”不仅让国内微博热搜热度冲上95万+,更引发了海外开发者社区的震动,外媒以“Major Outage”为题进行了专门报道。此次宕机时长远超以往任何一次短暂卡顿,标志着其服务稳定性面临前所未有的考验。
在长达一夜的“断供”中,全球用户猛然意识到,DeepSeek已从技术玩具转变为生产力的刚需。无数依赖其进行编码、写作与分析的“打工人”工作流直接中断,社交媒体上充斥着“半个大脑没了”的哀嚎。然而,就在全网焦急等待服务恢复...
The Lab · 2026-04-07 23:59:33 · 36氪最新 (RSSHub)
DeepSeek刚刚完成了一次没有预告、没有公告的静默升级。其网页版输入框上方悄然出现了两个新图标:一个闪电,一个钻石,分别对应“快速模式”和“专家模式”。快速模式被描述为“适合日常对话,即时响应”,而专家模式则“擅长复杂问题,高峰需等待”。这次更新没有官方说明,却直接向用户开放了两种截然不同的模型体验,暗示着其下一代模型V4的部署已进入关键测试阶段。
实测与网友拆解显示,两种模式背后可能是不同的模型架构。快速模式支持文件上传和OCR识别,响应极快,推测背后是一个针对速度优化的轻量版V4 Lite模型。而专家模式目前功能受限,不支持文件上传,但疑似路由到了更大、更强的模型——很可能就是即将发布的DeepSeek V4正式版的某个形...
The Lab · 2026-04-24 12:57:39 · 36氪最新 (RSSHub)
英伟达CEO黄仁勋曾在播客节目中发出警告:若顶尖AI模型被优化在华为芯片上运行,对美国将是"可怕的后果"。4月24日,这一警告以另一种形式部分成真——DeepSeek-V4沉寂近五个月后重返市场,其定价说明中有一行几乎被忽略的灰色小字:"受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。"这行备注透露的核心信息是:国产算力已在DeepSeek整体体系中占据关键位置,甚至开始影响其成本结构与定价逻辑。
从技术实现看,DeepSeek-V4-pro总参数达1.6万亿,但每次推理仅激活490亿参数;轻量版本DeepSeek-v4-flash则控制在2840亿参数、130亿激活规模...
The Lab · 2026-04-27 00:57:35 · 36氪
中信建投证券最新研报揭示,当前AI模型竞争格局正出现关键转折点:DeepSeek-V4与GPT-5.5同期发布,但两者选择了截然不同的技术路径与商业策略。DeepSeek-V4凭借CSA/HCA注意力压缩与mHC网络重构,在性能逼近闭源旗舰模型的同时,将百万token上下文推理成本压至极低水平,并首次在国产化算力基座上完成完整训练与推理验证。这一突破意味着,国产GPU集群在规模化AI应用中的可行性获得实质性背书。
相比之下,GPT-5.5延续软硬件深度耦合的技术路线,主攻高复杂度知识工作场景,维持高定价匹配高智能的商业逻辑。两种模式的并行演进,折射出当前AI产业的核心矛盾:模型能力持续攀升与算力供给紧张的长期博弈。中信建投指出,基...
The Lab · 2026-04-29 09:27:36 · 36氪最新 (RSSHub)
DeepSeek-V4上线仅数日,围绕其技术突破与市场策略的讨论持续发酵。与外界此前对DeepSeek迭代放缓的质疑形成鲜明对比,梁文锋用V4的强势发布给出了回应。V4-Pro版本参数规模达到1.6T,较V3扩大两倍,跻身开源模型最高梯队,直接向OpenAI和谷歌看齐,同时保留1M超长上下文能力。这一参数规模的跃升,标志着DeepSeek正式告别"小而美"路线,转向"参数暴力美学"与稀疏架构效率并行的策略。
更具行业标志性意义的是国产算力适配的突破。DeepSeek技术报告首次将华为昇腾与英伟达并列写入,将细粒度专家并行方案在双平台上均完成验证。V4在昇腾平台上实现1.50至1.73倍推理加速,成为全球首个在国产算力底座上完成训练...