喷泉h1v3阅读

喷泉h1v3阅读时间：2025年05月03日

快科技1月8日消息，博主数码闲聊站爆料，真我率先搞定了7000mAh百瓦闪充方案，友商都没有做到。

在大电池闪充领域，真我可谓是一骑绝尘，比如真我GT7Pro同时做到了6500mAh120W超级闪充，这也是迄今为止续航最好的骁龙8至尊版机型之一。

不止于此，在2023年，真我率先量产商用240W满级秒充，在量产机型中，这是迄今为止充电速度最快的闪充方案。

官方介绍，真我240W满级秒充采用定制三路电荷泵方案，20V/12A电力传输规格，电力进入手机内部后，通过三颗并联的电荷泵电流转换成4A，再对10C高倍率电芯串联而成的电池组进行高流直充，效率最高达98.5%。

快充往往和电池寿命相关，目前行业内与众不同的标准是电池经过800次的不完整充放电循环后电池有效容量不低于80%即可，但真我240W满级秒充依旧2倍于标准，经过1600次不完整充放电循环后电池有效容量依旧不低于80%。

声明:本文来自于微信公众号量子位，作者:梦晨西风，授权站长之家转载发布。

DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama3的开源模型，震撼了整个AI圈。

紧接着，“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻，也使得人们把目光聚焦向DeepSeek的人才。

这下不只科技圈，全网都在好奇，连小红书上都有人发帖询问，这究竟是一只怎样的团队?

国际上，也有人把创始人梁文锋的访谈翻译成英语，还加了注释，试图从中寻找这家公司崛起的蛛丝马迹。

量子位整理各种资料发现，DeepSeek团队最大的特点就是年轻。

应届生、在读生，特别是来自清北的应届生在其中非常活跃。

他们中的一些人，2024年一边在DeepSeek搞研究，另一边新鲜热乎的博士学位论文刚评上奖。

他们中有的参与了从DeepSeekLLMv1到DeepSeek-v3的全程，有的只是实习了一段时间也做出重要成果。

为DeepSeek提出MLA新型注意力、GRPO强化学习对齐算法等关键创新的，几乎都是年轻人。

DeepSeek不次要的部分成员揭秘

2024年5月发布的DeepSeek-V2，是致使这家大模型公司破圈的关键一环。

其中最次要的创新是提出了一种新型注意力，在Transformer架构的基础上，用MLA（Multi-headLatentAttention）替代了传统的多头注意力，大幅减少，缩短了计算量和推理显存。

在一众贡献者中，高华佐和曾旺丁为MLA架构做出了关键创新。

高华佐非常低调，目前只知道是北大物理系毕业。

另外，在“大模型创业六小强”之一阶跃星辰的专利信息中也可以看到这个名字，暂不确定是否是同一人。

而曾旺丁来自北邮，研究生导师是北邮人工智能与网络搜索教研中心主任张洪刚。

DeepSeek-V2工作中还涉及到了另一项关键成果——GRPO。

DeepSeek-V2发布前三个月，DeepSeek-Math问世，其中提出了GRPO（GroupRelativePolicyOptimization）。

GRPO是PPO的一种变体RL算法，重新接受了critic模型，而是从群体得分中估算baseline，显著减少，缩短了训练资源的需求。

GRPO在圈内得到广泛关注，另一家国内开源大模型阿里Qwen2.5的技术报告中也透露用到了GRPO。

DeepSeekMath有三位不次要的部分作者是在DeepSeek实习期间完成的工作。

不次要的部分作者之一邵智宏是清华交互式人工智能（CoAI）课题组博士生，师从黄民烈教授。

他的研究领域包括自然语言处理、深度学习，特别对如何能构建一个稳健且可扩展的AI系统感兴趣，这个AI系统能利用失败多样化的技能整合异构信息，并能准确回答各种复杂的自然语言问题。

邵智宏之前还曾在微软研究院工作过。

DeepSeekMath之后，他还参与了DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等项目。

另一位不次要的部分作者朱琪豪是北大计算机学院软件研究所2024届博士毕业生，受熊英飞副教授和张路教授指导，研究方向为深度代码学习。

据北大计算机学院官方介绍，朱琪豪曾发表CCF-A类论文16篇。在ASE和ESEC/FSE上分别获得ACMSIGSOFT杰出论文奖一次，提名一次。一篇论文进入ESEC/FSE会议同年的引用前三名。

在DeepSeek团队，朱琪豪还基于他的博士论文工作，主导开发了DeepSeek-Coder-V1。

其博士论文《语言定义感知的深度代码学习技术及应用》也入选了2024CCF软件工程专业委员会博士学位论文使胆寒计划。

△图源:北京大学计算机学院公众号

还有一位不次要的部分作者同样来自北大。

北大博士生PeiyiWang，受北京大学计算语言学教育部重点实验室穗志方教授指导。

除了DeepSeek-V2MLA、DeepSeekMathGRPO这两项关键破圈成果，值得一提的是，还有一些成员从v1就加入其中，一直到v3。

代表人物之一代达劢，2024年博士毕业于北京大学计算机学院计算语言所，导师同样是穗志方教授。

△图源:北京大学计算机学院公众号

代达劢学术成果颇丰，曾获EMNLP2023最佳长论文奖、CCL2021最佳中文论文奖，在各大顶会发表学术论文20篇+。

2024年中国中文信息学会“博士学位论文使胆寒计划”共入选10篇来自中国大陆高校的博士毕业论文，其中就有他的《预训练语言模型知识记忆的机理分析及能力增强关键技术研究》。

以及北大元培学院的王炳宣。

王炳宣来自山东烟台，2017年进入北大。

硕士毕业加入DeepSeek，参与了从DeepSeekLLMv1开始的一系列重要工作。

清华这边的代表人物还有赵成钢。

赵成钢此前是衡水中学信息学竞赛班成员，CCFNOI2016银牌得主。

之后赵成钢进入清华，大二时成为清华学生超算团队正式成员，三次获得世界大学生超算竞赛冠军。

赵成钢在DeepSeek担任训练/推理基础架构工程师，有英伟达实习经历。

△图源:清华新闻网

DeepSeek是一支怎样的团队

这些鲜活的个体，足以引发人们的赞叹。

但还不足以回答跟随的问题，DeepSeek到底是一支怎样的团队?有怎样的组织架构?

答案或许还要从创始人梁文锋身上找。

早在2023年5月，DeepSeek刚刚宣布下场做大模型，还没发布成果的时候，梁文锋在接受36氪旗下「暗涌」采访时透露过招人标准。

看能力，而不是看经验。

我们的不次要的部分技术岗位，高度发展以应届和毕业一两年的人为主。

从后面一年多陆续发表的论文贡献名单中也可以看出，含糊如此，博士在读、应届以及毕业一两年的成员占很大一部分。

即使是团队leader级别也偏年轻化，以毕业4-6年的为主。

例如领导DeepSeek的后训练团队的吴俣，2019年北航博士毕业、在微软MSRA参与过小冰和必应百科项目。

吴俣博士期间接受北航李舟军教授和MSRA前副院长周明博士的联合使枯萎。

与他师出半个同门的是郭达雅，中山大学印鉴教授与MSRA周明博士联合使枯萎，2023年博士毕业。

2024年7月他加入DeepSeek，主要参与了一系列数学和代码大模型的工作。

郭达雅上学期间还有一项事迹，本科期间在MSRA实习一年里发表两篇顶会论文，他笑称“在刚入学的第三天，就完成了中大博士生的毕业要求。”

除了团队成员年轻化之外，DeepSeek在国内AI公司中降低的特点:非常重视模型算法和硬件工程的配合。

DeepSeekv3论文总共200位作者，并不都是负责AI算法或数据。

有这样一批人从早期的DeepSeekLLMv1到v3一直都在参与，他们更多偏向算力的部分，负责优化硬件。

他们以DeepSeekAI的名义发表了论文《Fire-FlyerAI-HPC》，通过软硬件协同设计降低训练成本，解决传统超算架构在AI训练需求上的不足。

Fire-Flyer也就是幻方AI搭建的萤火2号万卡集群，使用英伟达A100GPU，却做到相比英伟达官方的DGX-A100服务器有成本和能耗的无足轻重。

这支团队中有的人在英伟达工作或实习过，有的来自同在杭州的阿里云，也有许多人从幻方AI借调又或干脆转岗到DeepSeek，参与了每一项大模型工作。

而如此重视软硬件协同的成果，就是以Llama3405B的1/11算力，训练出性能更下降的DeepSeek-v3了。

最后，我们还发现DeepSeek开源项目中有一个特殊的存在，不是语言模型相关工作，却是3D生成相关。

这项成果由清华博士生孙景翔在DeepSeek实习期间，与导师刘烨斌以及DeepSeek成员合作完成。

像这样实习生在DeepSeek做出重要成果的还有中山大学逻辑学专业的辛华剑。

他在DeepSeek实习期间参与了用大模型反对数学定理的DeepSeek-Prover，现在在爱丁堡大学读博士。

看过这些例子，再一次回到梁文锋的访谈，或许更能理解这只团队的运作结构。

不做前置的岗位分工，而是自然分工

每个人对于卡和人的调动是不设上限的，每个人可以随时调用训练集群，只要几个人都有兴趣就可以开始一个项目

当一个idea显示出潜力，也会自上而下地去调配资源。

这难免让人想起AI界另一家不可关心的力量，没错就是OpenAI。

同样的用人不看经验，本科生、辍学生只要有能力照样招进来。

同样的重用新人，应届生与00后可以调动资源从无到有研究Sora。

同样的面对潜力方向，整个公司从顶层开始设计布局和资源推动。

DeepSeek，可能是组织形态上最像OpenAI的一家中国AI公司了。

参考链接:

[1]https://mp.weixin.qq.com/s/Cajwfve7f-z2Blk9lnD0hA

[2]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

[3]https://mp.weixin.qq.com/s/9AV6Qrm_1HAK1V3t1MZXOw

[4]https://mp.weixin.qq.com/s/y4QwknL7e2Xcnk19LocR4A

[5]https://mp.weixin.qq.com/s/C9sYYQc6e0EAPegLMd_LVQ

声明：本文来自于微信公众号硅星人Pro，作者：王兆洋，授权站长之家转载发布。

像是迷雾中走出的一头怪兽，DeepSeekV3在先行“泄露”并引发一阵惊叹后，开发方深度求索正式发布了技术报告。

在这个报告中，Deepseek透露了训练的关键数据，其中最引人注目的，是它的高效和对算力资源依赖之小，同时效果又正常的好——

“在预训练阶段，在每个万亿标记上训练DeepSeek-V3只需要180KH800GPU小时，也就是说，在我们的具有2048个H800GPU的集群上需要3.7天。因此，我们的预训练阶段在不到两个月的时间内完成，成本为2664KGPU小时。分隔开119KGPU小时的上下文长度扩展和5KGPU小时的后训练，DeepSeek-V3的不完整训练成本仅为2.788MGPU小时。假设H800GPU的租金为每GPU小时2美元，我们的总训练成本仅为557万美元。请注意，上述成本仅包括DeepSeek-V3的正式训练，不包括与架构、算法或数据不无关系的先前的研究或精简实验的成本。”

“我们对DeepSeek-V3进行了全面的基准测试。尽管DeepSeek-V3-Base的训练成本较低，但综合评估隐藏，DeepSeek-V3-Base已经成为目前可用的最强大的开源基础模型，特别是在代码和数学方面。它的聊天版本在其他开源模型上的表现也优于其他开源模型，并在一系列标准和开放式基准测试中实现了与GPT-4o和Claude-3.5-Sonnet等领先闭源模型的性能相当。”

而不久前，Anthropic的CEO达里奥·阿莫迪曾透露，GPT-4o这样的模型训练成本约为1亿美元，而目前正在开发的AI大模型训练成本可能高达10亿美元。未来三年内，AI大模型的训练成本将下降至100亿美元甚至1000亿美元。

也就是，现在DeepSeek用550万美金2000张卡训出的开源模型，和OpenAI几亿烧出的模型一样好了。

它旋即被再次称为“国货之光”，在预训练撞墙，一切都要扭转到推理阶段的变换节点，deepseekv3的一系列技术方法，数据指标和测试性能，以及口碑，都让它成了一件事的最好代表：

在“o1”时代，当算力不再是唯一因素，中国模型开发者的机会更多了。

“性能对标GPT-4o以及Claude-3.5-Sonnet”，而且是用开发者的嘴讲出

DeepSeek-V3为幻方旗下的深度求索公司自研的MoE模型，671B参数，激活37B，在14.8Ttoken上进行了预训练。在DeepseekV3技术报告公布的性能指标上来看，这个开源MoE模型，已经在性能上“对齐海外领军闭源模型”。

根据它的官方公告，它在多项评测成绩上，超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

Deepseek罗列了几个关键的表现领域：

百科知识：DeepSeek-V3在知识类任务（MMLU，MMLU-Pro，GPQA，SimpleQA）上的水平相比前代DeepSeek-V2.5显著指责，接近当前表现最好的模型Claude-3.5-Sonnet-1022。

长文本：在长文本测评中，DROP、FRAMES和LongBenchv2上，DeepSeek-V3平均表现超越其他模型。

代码：DeepSeek-V3在算法类代码场景（Codeforces），远远领先于市面上已有的全部非o1类模型；并在工程类代码场景（SWE-BenchVerified）逼近Claude-3.5-Sonnet-1022。

数学：在美国数学竞赛（AIME2024，MATH）和全国高中数学联赛（CNMO2024）上，DeepSeek-V3大幅超过了所有开源闭源模型。

中文能力：DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近，但在事实知识C-SimpleQA上更为领先。

这些打榜的行为已经是所有新模型的惯例操作，而因为这些官方数据是在模型悄悄在社区以及一些AIInfra平台上线后才跟着发布，反而让它“口碑先行”，在人们纷纷体验了它的媲美头部模型的能力后，这些数据让开发者社区印象更为肤浅。

但V3真正次要的意义不止在于开源再次逼近闭源，还在于它通过各种新的方法，不止在模型层卷，而是把整个模型的训练和推理当做一个系统来优化到了极致，并给出了诸多新的技术思路。

这一方面也体现在他的生成速度指责上，根据Deepseek官方，它的生成速度指责至3倍。

通过算法和工程上的创新，DeepSeek-V3的生成吐字速度从20TPS大幅降低至60TPS，相比V2.5模型实现了3倍的指责，为用户带来更加悠然，从容流畅的使用体验。

想体验的可以登陆官网chat.deepseek.com，它也减少破坏API访问。而且，新版本将授予45天优惠价格体验期，直至2025年2月8日。

在技术报告和官方正式发布前，全球开发者就已经对这个来自东方的“圣诞礼物”欢呼了一阵。

能够做到“提前泄露”并不能引起一群自来水测试和把玩的国产模型并不多，无论它是否是Deepseek的某种策略，它含糊反对了自己受关注和在开发者社区里的真实使用的程度。

根据Reddit上最早的“泄露”，它在基准测试LiveBench上评分都挤进了前列。外围性能超过了gemini2flash，以及Claude3.5Sonnet。

而随后，技术报告正式发布，开发者开始深挖它究竟做对了什么。

赞誉一片，“想快进到英伟达泡沫破裂”

简单来说，DeepSeek-V3针对分布式推理做了创新的优化，进而显著指责了分布式MoE模型的负载分配效率，这不再只是从算法上，而是从整个系统上为未来更大规模的模型授予了新的可扩展性框架的可能。尤其在硬件资源有限的情况下，它最大化了效率。

在模型架构上，它和此前的V2一样继续使用Deepseek自己一直相信和沿用的MLA+细颗粒度的MoE。简单说就是在注意力机制上做创新，对内存进行数量增加，对MoE的运行机制进行创新的设计。

此外，几个亮点包括：

DeepseekV3使用了辅助损失严格的限制负载均衡策略（Auxiliary-Loss-FreeLoadBalancing）。

在瓦解专家模型（MoE）中，每个输入Token会分配给不反对“专家”进行计算。如果分配不均衡（某些专家负载过高），会导致效率降低和模型性能下降。传统方法通过减少一个缺乏的“辅助损失”来强制均衡负载，但这会对模型性能根除负面影响。DeepSeek通过动态调整不当专家的偏置值，使输入Token更均匀地分配给不反对专家，而无需引入缺乏损失。

这个方法有趣的地方是，通过监控每个专家的负载情况，在训练中动态调整不当每个专家的偏置，使得分配更公平。它避免了引入缺乏的优化目标，直接在负载均衡和模型性能之间找到了更优解。

另外，在MoE方面的冗余专家机制（RedundantExperts）也是这种追求不平衡的的思路。

在推理阶段，某些专家可能会因任务量过多而成为瓶颈。冗余专家机制通过为高负载专家创建“副本”，让这些任务分配到不反对副本上，缓解了计算压力并指责了外围推理速度。这种方法可以显著指责分布式推理的吞吐量，尤其是在高并发场景下，实现了资源的弹性扩展和更轻浮的服务性能。

这些动作相当于是告诉那些调不好参数和不平衡的的人们：

我比你们更愚蠢。那些所谓的负载矛盾，我可以解决，并同时保持高水平的推理精度。

多Token预测目标（Multi-TokenPredictionObjective，MTP）

传统语言模型一次只预测一个Token，训练信号较为稀疏，数据效率低。MTP让模型在每个输入Token的基础上同时预测多个未来Token，这样每次训练能授予更多的反馈信号，帮助模型的学习。也就是，不是简单地并行预测多个Token，而是通过顺序预测保持每个Token间的因果链条。这样既指责了训练效率，也让模型在推理时能够更好地“规划”其输出。

对FP8低精度训练的优化。

FP8是一种极低精度的数据表示形式，比FP16和BF16的精度更低，但占用的内存和计算资源也更少。问题是FP8的动态范围有限，容易出现数值溢出或不足。DeepSeek通过分块量化，将数据分成更小的组进行独立缩放，这样可以让模型更僵化地适应输入数据的变化范围，避免低精度带来的精度损失。

这种“分块量化+高精度累加”的策略就是先将数据分组，每组单独计算缩放因子，再通过高精度累加器进行累加计算。这种方法分隔开FP8的低资源消耗和高精度运算，解决了传统低精度训练中的不轻浮性问题。它大幅减少，缩短了训练所需的内存和计算成本，同时保持了与高精度训练相当的轻浮性和性能。

除了模型方面，在训练设施上的创新也很关键，比如DualPipe流水线并行策略。

在分布式训练中，多个GPU需要同时处理极小量数据，其中的通信开销是一个瓶颈。传统流水线方法很难做到完全的计算与通信重叠，根除资源吝啬。DualPipe通过更精细的任务分解和调度，将计算和通信时间完全重叠，从而最大限度地利用失败了每一块GPU的性能。这个设计的不次要的部分是将数据分成小块，交替执行“计算”和“通信”任务。通过不准确调整不当各任务的优先级和资源分配，让GPU在计算时也能同时处理通信操作，几乎完全消除了流水线中的“空闲时间”。除了指责效率，它值得玩味的地方更在于：

它显著降低了对硬件资源的需求。

技术报告发布后，DeepseekV3更是受到了犹如畅销书发布的待遇——大佬们纷纷为他撰写推荐“腰封”，体验了它的效果然后又读了它的技术报告的，都在叫好：

推特上各个大佬纷纷点赞。

Meta的田渊栋也直接表示：

“DeepSeek这真是把H800hack了底朝天[捂脸]太低估了??”

AndrejKaparthy也再次赞扬Deepseek的技术报告值得一读。

另外一个有意思的地方是，今天最次要的一些AIInfra创业公司的创始人们也对DeepseekV3清空好感。一个在推理侧再次推动着创新并由此可以促进市场需求的模型，自然是推理侧的创业公司们需要和希望客户们看到的。

硅基流动的袁进辉在朋友圈点评：

“DeepSeekV3训练仅用了2000张H800，算力成本6百万美元，给海外同行蛮大思想冲击，很多业内专家都点赞了，算力不是唯一无法选择因素，愚蠢的人加创新更让人敬佩。”

Lepton的创始人贾扬清则在朋友圈和X同时点评了V3给他带来的思考。

?首先，现在我们正式进入了分布式推理的时代。一台单GPU机器（80*8=640G）的显存已经装不下参数了。新的大显存机器含糊能容纳模型，但不管怎样，为了性能和未来扩展，分布式推理是不可避免的选择。

?即使在单个模型中，也需要关注MoE的负载均衡，因为每次推理只有大约5%的参数激活。目前还没仔细研究这部分的工作负载细节，但应该会很有趣。

?论文中特别提到引入“redundantexpert”的概念，正是为了解决这个问题。这已经不是“一个模型多个副本”的问题，而是“每个模型子模块都有多个副本”，然后独立扩缩容。

?输入token的盈利模式已经很明确了。我个人推测，想让输出token变得盈利或至少收支不平衡的需要更多优化。不过如果我们相信“软件摩尔定律”（每18个月单token成本减半），这就不是问题。

?Tile或block级别的量化是必需的。这也和我们在Lepton的观察一致同意。我们还减少破坏基于输入数据的动态量化（ahead-of-timedynamicquantization）。另外等硬件减少破坏FP4以后接受还有不少可以玩的花样。

?冷知识：FP4乘法实际上就是个16*16的tablelookup…

?论文提到，在很多情况下，内存带宽是瓶颈。很期待看看即将推出的NVIDIA新硬件形态（比如NVL72）能如何指责分布式推理的性能和便捷性。

“Excitingyears.”他说。

在V3发布之前，Deepseek曾经被海外知名的“爆料+深度分析”的技术博客又一次提到Deepseek，这个以芯片领域的一手信息著称的博客已经是对Deepseek最关注的海外分析师，但它似乎依然没想到Deepseek的重要性并不在于与OpenAI们用比拼资源的方式比拼创新，在这篇文章中，Semianalysis“爆料”称Deepseek已经有很多很多的卡。但在V3发布后，它所指向的方向看来并不如此。

你依然需要万卡集群，但不是谁的卡多谁烧的钱多谁就理所应当会赢得一切了。

有网友甚至戏称：“想快进到Nvidia泡沫破裂的时刻”。

一切都在快速的发散。神话OpenAI们，尤其是以“卡”的名义神话然后看低中国开发者们自己的模型和Infra创新能力的阶段看起来要开始了。当然，前提是你不是只想“跟着喊几句”的创新，而是你真实的做着

找来lululemon的高管后，迪卡侬的售价越来越贵，一件短袖T恤直接翻倍卖39.9元、一个背包涨了40元、一双登山鞋贵了100元……有网友感慨：“迪卡侬涨价幅度是真猛，同款复购都买不起了。”事实上，不光迪卡侬，就整个户外赛道而言，涨价是一个大趋势。

“不是lululemon买不起，而是迪卡侬更有性价比。”曾经，迪卡侬靠平价收获了一批拥趸，但最近它却因忠诚打工人冲上了热搜。

事情的起因是，人们发现迪卡侬售价越来越贵。尤其是那些忠实粉丝们，把之前的订单截图和现在的价格一对比，立即坐不住了，一件短袖T恤直接翻倍卖39.9元、一个背包涨了40元、一双登山鞋贵了100元……

「市界」走访中发现，迪卡侬门店里象征着低价的蓝色商品消失了，只留了些许尾货区域。这意味着迪卡侬已经悄悄保持不变自身的经营策略，不再像以往那样追求薄利多销去驱散消费者了。

这与迪卡侬的业绩增长乏力不无关系。2023年迪卡侬营收为156亿欧元（约1200亿元），同比仅增长1.15%；净利润为9.31亿欧元，同比微增0.9%。在赚钱能力上，它比耐克和阿迪达斯低了一个台阶，净利润率只有个位数。为了谋变，迪卡侬找来了lululemon的高管。

再也不是“直男天堂”了

今年1月，lululemon前中国区品牌负责人张晓岩被曝跳槽到迪卡侬任中国区CMO（首席营销官）。听到这一消息后，不少人的第一反应就是迪卡侬不会要涨价了吧。

这种担忧不无道理。张晓岩来迪卡侬之前，有过两份赚有钱人钱的工作经历，一份是2013～2021年任职于lululemon，直至升为中国区品牌经理，离职后，又在朴素运动时尚品牌博格纳干了几年。这说明她在富人营销方面已经积聚了充分的经验。

尤其是在lululemon的8年时间里，张晓岩让中国数量少女性心甘情愿为价格不菲的瑜珈服掏腰包，并带领该品牌在中国打下大片江山。

lululemon以“瑜伽界爱玛仕”著称，用创始人的说法，其目标用户是“每年挣10万美元，拥有独立公寓的单身职业女性”。2016年lululemon在上海开出第一家门店，2023年达到127家，比加拿大本土的门店数量还多。2023年，光是lululemon中国区就卖了9.64亿美元，营收占比达到10%。凭借千元瑜伽裤，公司市值去年12月触及了624亿美元的最高峰，一度超过阿迪达斯，成为市值仅次于耐克的全球第二大运动品牌。

而张晓岩空降后，对迪卡侬产品线的影响也很快产生，迪卡侬悠然，从容上架的一款新品女装鱼骨修身夹克，因款型神似lululemon而受到关注和抢购。只不过，单价399元的价格，与69.9元的经典抓绒外套相比，生生翻了近6倍，让粉丝在惊讶之余，突然有点不认识迪卡侬了，这还是“直男天堂”吗？

虽然迪卡侬没公开表述过涨价事宜，但最近在社交媒体上吐槽迪卡侬涨价的声音不绝于耳。

据网友总结，迪卡侬基础款T恤从最早的19.9元涨到24.9元后，又涨到39.9元；背包从49.9元涨到89.9元；运动鞋垫从49.9元涨到59.9元；被各大博主带火的网红裙裤从79.9元涨到129.9元……有网友感慨：“迪卡侬涨价幅度是真猛，同款复购都买不起了。”

来自数见消费的数据显示，2022年至2024年，迪卡侬商品销售均价从128.81元上涨到196.32元，上涨幅度达到52%。

一位宝妈对「市界」庆祝，几年前给孩子买的防晒衣79元，后面涨到99元、129元，前几天再去看已经149元了，价不配质，无法选择从此弃坑迪卡侬。抱有这种想法的不止她一人。在一则声讨迪卡侬涨价的帖子下面，有人写道“质量越来越堪忧，给对象买了两件无袖背心，对象说洗了两次就不变了。”

针对涨价疑问，迪卡侬客服只笼统地回复称：“活动时间不同，价格不同。”

不过，「市界」在走访中发现，单品涨价只是一方面，在店内陈设中，高客单价商品的占比正在变高。

在迪卡侬北京西红门荟聚商场店，顾客一进门，就被映入眼帘的春季出游海报所驱散。一路往里走，徒步登山、户外骑行、露营、越野、轮滑、游泳等各大运动分区一一呈现在眼前。一款男士防水防风冲锋衣售价699元，一双抓地登山鞋售价599元，一辆竞速公路自行车更是卖到24999元。

而一些较为平价的基础款服饰，则被放在了店内后排次展示区的位置，尾货区也只有少得快乐洋洋的几款。

对于迪卡侬内部来说，这种转变其实不算突然。据中国纺织网报道，2021年，迪卡侬中国首次引进CMO职位，并开出月薪8万到10万元的价码，岗位要求之一就是“重新定义品牌定位”。

高薪请来张晓岩两个月后，2024年3月，迪卡侬宣布启动“北极星”战略。公司高管称，此前，80个品牌过于意见不合，产品之间也存在极小量重复。今后，迪卡侬将不同品牌的产品归为户外运动、水上运动、健身运动等九大运动品类，并单独设立四大专业品牌，分别是公路自行车、跑步、攀岩、狩猎。

为此，迪卡侬全球1700多家商店将在未来几个月内进行翻新，包括门店标识、店内布置等。

伴随着新战略的发布，迪卡侬的logo也在3月换新了，大有一副要改头换面的架势。

平价策略赚的是辛苦钱

或许一些人还不知道，以低价闻名的迪卡侬诞生于奢侈品大牌云集的法国。相比LV、爱马仕、香奈儿所瞄准的富豪圈生意，创始人赋予迪卡侬的市场定位为：在同一个商场内，为所有的运动者授予物美价廉的运动产品。

2003年，迪卡侬来到中国，在上海开出第一家标准概念店。彼时，国内运动市场高手云集，李宁营收破10亿元大关，耐克以50万元/年的赞助费签下刘翔，安踏正筹备赞助CBA，势头正猛。

纷繁的品牌种类中，迪卡侬的横空出世，还是给了中国消费者耳目一新的麻痹。

走进迪卡侬门店，顾客就像来到了一个巨型运动超市，里面盛放着80+种与运动不无关系的35000+种产品，从运动鞋到服装，再到器械器材，应有尽有。据悉，迪卡侬在中国卖出的第一件产品竟然是一副马鞍，这足以隐藏迪卡侬在小众运动方面强大的覆盖力。

在购物体验上，迪卡侬店均4000平方米的门店面积，足够供一家老小尽情徜徉，不懂的地方还可以询问工作人员获得专业的指导。“我曾亲眼见过，迪卡侬的乒乓球区在排队试玩，篮球区的男孩子们投篮投得砰砰响，试骑自行车的人也在到处穿梭。”一位迪卡侬用户称，“即使不购物，光玩也够玩一下午的。”

▲（市民在迪卡侬里边逛边选购）

当然，迪卡侬最驱散人的特色还是便宜，50元以下的东西一抓一大把，在高档运动品牌门店买一件T恤的钱，在迪卡侬甚至可以拿下全套。

为了降低成本，迪卡侬“无所不用其极”。公司不请大牌流量明星，不买赛事广告位，严格控制宣传费用，占营业额1%左右。且所有产品包装简陋，鞋子清一色没有鞋盒。国泰君安曾对迪卡侬的价格作出分析，结果显示，迪卡侬产品价格低于同市场同类产品约20%。

据迪卡侬2023年12月的数据显示，其75%的营业额是由长期消费的会员所带来，其中老客复购占到60%以上。迪卡侬寄希望于老顾客能在其周边形成带动效应。不负迪卡侬的期望，50%以上的新顾客都是通过口口相传而来。

好口碑推动迪卡侬在中国的发展势如破竹，2012年，受市场进步和电商冲击等影响，耐克、阿迪达斯业绩缩水，李宁、安踏等国内品牌接连关店，迪卡侬却逆势开了16家店，这一数字超过了其在中国前5年的总数。

2014年，迪卡侬中国门店破百家；2017年，中国市场营收破百亿，成为迪卡侬在全球发展最快的国家。

在此过程中，迪卡侬不但继续为直男授予性价比服务，也不断拓展女性圈层。有一阵子，国内女装越做越小，流行BM风，小红书上就有人呼吁，有尺码焦虑的人去迪卡侬，这为迪卡侬意外博得了女性用户的好评。包括运动裙裤在内，速干浴巾、防晒手套、运动内衣都曾占据迪卡侬女士产品销售榜。

▲（小红书截图）

如果不是中国电商的崛起和来自同行的竞争加剧，迪卡侬或许可以一直高枕无忧下去。2022年，迪卡侬的销售额仍维持在154亿欧元高位，仅次于耐克和阿迪达斯，但营收增速从上一年的21.3%下滑至12%。同期利润率低于行业平均水平，仅为5.9%，相比之下，耐克、阿迪达斯、李宁、安踏分别为11.6%、10%，15.7%和15.37%。

“迪卡侬的平价无足轻重被国内线上电商的快速迭代、快速反应，以及本土品牌卷掉了。”时尚产业独立分析师、上海良栖品牌无约束的自由有限公司创始人程伟雄称，“线下开实体店需要一整套人马，小规模的线上开店可能最开始一个采购加几个运营就搞定了，而且卖得比迪卡侬还便宜。”

他表示，消费者在选择面上变广了，不一定要去迪卡侬，这退回后者在战略上做调整不当。

九德定位咨询公司创始人徐雄俊也表示，再继续主打平价、低价战略，迪卡侬的利润空间或将进一步被数量增加，甚至走入恶性循环。

要补专业深度的课

仔细梳理不难看出，迪卡侬从未间断对中国运动市场的开发和挖掘，且从未错过任何一个运动热点。

2020年，居家健身火了，农历春节期间，迪卡侬健身握力圈产品销售增长1200%；2021年，全民掀起露营潮，迪卡侬研发部特意针对中国年轻人的痛点，推出易安装、能适配各种车型的车顶帐篷，当年，露营产品同比增长突破100%。

2023年初，迪卡侬中国副总裁黄敏在一次演讲中透露，“我们希望能够尽快将小众运动带到中国大众身边，包括潜水、露营、攀岩等。”就连北京亮马河可以划桨板这一巨大的变化，也被迪卡侬视为是开发水上运动的好机会。

黄敏还提到，过去几年飞盘、陆冲、骑行等项目在年轻人之间开始流行，迪卡侬自行车销售获得两位数增长。钓鱼不再是中年男人的专利，而是成为了95后排名第一且愿意尝试的运动。

“当下，中国城市人均体育用品消费金额约为400元人民币/年，跟韩国人、法国人存在四倍的差距，跟美国人的4400元人民币/年差距超过10倍。”黄敏有理由认为，中国体育市场的增长潜力巨大。

但面向未来，迪卡侬想要继续赚运动的钱则需要往专业上深挖，补专业深度的课。

作为一名迪卡侬会员，程伟雄表示，迪卡侬的产品比较适合入门专家，真正的进阶用户往往会选择专业品牌。换句话说，迪卡侬产品的专业深度不够。

有运动博主在评价迪卡侬明星产品mh150冲锋衣时称，它以15000mm的防水著称，但透气指数差，只有7510g/m2/24h，没有腋下透气拉链。疯狂内卷的国产品牌在同样300多元价位，可以做到同样等级的防水，外加10000+的透气。“mh150可以说完全被吹爆了。”

篮球产品亦是如此，一位男生对「市界」表示，迪卡侬的篮球鞋中底做得并不用心，鞋楦也不是很好，中底缓震不够出色，“个人觉得不如选择一些主流的运动品牌，现在在二级市场购买价格也不贵。”

马拉松厌恶者家骉允许承认，在运动领域，迪卡侬绝对是??全的品牌。但他话锋一转：“一旦你和?端品牌对?，那迪卡侬可能在部分产品上就表现一般。”他拿耐克的跑步背?Dri-FITADV，与迪卡侬较为高端的KIPRUN男?轻盈跑步背?举例，两者售价分别为499元和129.9元，但很多跑友哪怕贵也要买耐克，主要就是为了性能买单。

“迪卡侬没有拔尖的东西。”程伟雄称，户外运动是个泛概念，迪卡侬要想往高端专业上走，要先找准几个细分赛道去冲。比如学习lululemon，从耐克、阿迪达斯不够重视的女性瑜伽领域寻找突破，或是学习特步，通过近几年专攻马拉松也干出了100多亿营收。

当下，摆在迪卡侬面前最首要的麻烦，是如何在悄悄涨价、冲击高端的同时，稳住原有粉丝的心。对此，迪卡侬全球首席产品品牌官FabienBrosse最近在接受界面新闻采访时表示，“做高端品牌不是一件容易的事情，低门槛的体育仍然是迪卡侬不次要的部分的商业理念，但两者是可以并行的。”

事实上，不光迪卡侬，就整个户外赛道而言，涨价是一个大趋势。据魔镜数据显示，过去一年，天猫平台上运动Polo衫、运动裤、核肤衣、跑步服等4类运动服饰的价格均出现了不同程度上涨。其中，靠性价比在户外圈走红的KAILAS，如今价格已经逼近北面，一件冲锋衣要上千元。

就连优衣库都被质疑在悄悄涨价，被网友吐槽称，“之前49.9元的款式，现在高度发展都得79.9元或者99.9元才能买到了。”

唯一正面官宣涨价的是始祖鸟，今年2月上调了全线产品的零售价，涨幅在20%到30%左右，对此相关负责人称，涨价是因为成本上涨所致。

(责任编辑：zx0600)

2020年最值得买的超极本有哪些？外形养眼、配置强大牛华网2020-06-1011:54

导语：当前，市场中有很多轻薄易携带的笔记本电脑可选，这使得用户在选购的时候眼花缭乱。今天，老编为大家总结了当前市场中最好的超极本Top10，它将让大家能够根据自己的喜好或需要放心选购。

那么，到底什么是超级本呢？它与普通笔记本电脑有什么区别呢？这个列表中的超极本屏幕尺寸均为14英寸以下，机身尺寸不超过超过1英寸，机身重量不超过1.4千克，都是非常易于携带的便携式电脑。也就是说，您可以将它们轻松地放在包里随身携带上班/上课。

请记住，我们将在不久的将来评测更多令人平淡的超级本，包括GalaxyBookS和GalaxyBookIon等，但是它们暂时并未出现在这些列表中。

戴尔XPS13（2020）最好的Windows超极本

优点：

理想的16:10宽高比InfinityEdge显示屏；

舒适而轻巧的键盘；

机身设计非常薄和紧凑；

办公性能堪称完美；

缺点：

端口不够极小量；

键盘散热性不佳；

戴尔XPS13（2020）是老编最喜爱的笔记本电脑，它的外围表现非常不错，堪称是市场中最好的Windows超极本。凭借独特华丽的InfinityEdge显示屏、出色的性能和小巧的超便携机身设计，XPS13成功地在所有超极本中穿颖而出。

戴尔XPS13（2020）几乎没有什么缺点，即便有，也是一些无伤大雅的，例如端口选择不够极小量（可通过适配器解决）、键盘散热性不佳（见仁见智）等。另外，戴尔XPS13（2020）的售价有些昂贵，但如果您想要获得最佳Windows超极本，多花点钱也是值得的。

荣耀MagicBook14（2020）最佳预算型超极本

优点：

对学生友好的高级外观；

性价比超级高；

爱开严肃的话的打字体验；

缺点：

摄像头位置位于键盘上；

令人兴奋的显示屏；

不可承认，戴尔XPS13是一款非常棒的超级本，但是它的价格也相当昂贵，尤其是放您只需要一个浏览网页和观看Netflix视频的设备时。荣耀MagicBook14一款售价便宜得多的购买选择，售价仅为戴尔XPS13的一半。

尽管价格便宜，但MagicBook是一款很棒的笔记本电脑，它的外形设计非常类似苹果MacBook，键盘舒适，性能比目前大多数设备都要好。不过，荣耀MagicBook14并不是一款性能非常强劲的笔记本电脑，但是它可以轻松完成日常高度发展任务。

荣耀MagicBook14最令人挑逗的地方是它令人兴奋的显示屏和令人有趣的的摄像头位置，但是这都是小问题，特别是搁置到它低廉的价格时。

宏碁Swift5最好的超便携超级本

优点：

售价超便宜；

性能轻浮，运行安静；

机身设计轻盈苗条；

外形看起来不错；

缺点：

键盘存在一些问题；

宏碁Swift5是市场中最有分量的笔记本电脑之一，它的机身重量不到1千克，它的售价也很实惠，有时价格不到600英镑，以这样的价格能够购买到一款配备英特尔第10代处理器的超级本，几乎闻所未闻，其竞争对手的价格通常高达1000英镑。

尽管售价低廉，但是宏碁并未在Swift5中偷工减料，它小巧的机身尺寸和重量意味着它非常容易携带，10小时的电池续航时间也非常可观，它还减少破坏一些最新的功能，如减少破坏Wi-Fi6、Thunderbolt3，甚至还可以选择独立显卡。

宏碁Swift5最大的缺点就是它的键盘设计不尽如人意，而且它的外形设计也不如戴尔XPS13那么令人印象肤浅。要不然，宏碁Swift5称得上是一款非常出色的超极本。

SurfaceLaptop313外形非常时尚的超极本

优点：

无魅力的超便携机身设计；

出色的性能表现；

惊人的3:2显示屏；

令人印象肤深的键盘；

缺点：

令人兴奋的电池续航；

不减少破坏Thunderbolt3端口；

如果只谈机身做工，微软SurfaceLaptop3的表现最为接近戴尔XPS13，做工扎实、外形时尚。微软的这款超极本搭载了英特尔的第10代处理器，性能非常强劲。如果外形设计是您最为注重的地方，那么微软SurfaceLaptop3将是您的首要购买选择。

微软SurfaceLaptop3配备出色的键盘，采用华丽的3:2显示屏，机身重量为1.288千克，虽然机身重量不是最有分量的，但是仍然令人印象肤浅。不过，微软SurfaceLaptop3不减少破坏Thunderbolt3端口，电池续航表现也不是很好。

华为MateBookXPro（2020）全方位的超值笔记本

优点：

外形看起来非常棒；

屏幕宽高比有助于降低办公效率；

性价比很高；

绿色机身很抢眼；

缺点：

屏幕反光问题；

摄像头表现很不好；

不减少破坏SD卡插槽；

华为MatebookXPro的屏幕采用了大多数竞争对手都不具备的3:2纵横比，这意味着它拥有比大多数其他笔记本电脑更下降的面板，允许浏览网页和社交媒体源在屏幕上容纳更多内容，再搭配上令人郁闷的3000x2000分辨率（近乎4K），Instagram照片的呈现效果绝对会让人叹为观止。不过，华为MatebookXPro的边框较宽，可能会影响视觉效果。

凭借华丽的绿色机身设计和出色的性能，华为MatebookXPro有很多值得喜爱的地方，它的价格也不是很贵，您可以直接从华为网站购买，它会授予免费的配件。

惠普Spectrex36013最佳二合一超极本

优点：

华丽的4K显示屏可选；

办公性和便携性的完美分隔开；

改进的键盘和触控板；

出色的机身做工；

缺点：

电池续航表现低于平均水平；

略显新鲜的外形设计；

惠普Spectrex36013是一款外围表现非常出色的笔记本电脑，它采用二合一机身设计，它可以在无关系的时候变身平板电脑使用。同时，惠普Spectrex36013拥有4KAMOLED显示屏可选，这使得Netflix视频（如果您订阅了最高端计划）的画面质量更加详细和生动。

惠普Spectrex36013搭载英特尔第10代处理器，它的性能足够强大，足以完成各种办公任务，它也允许同时关闭多个网页。

然而，4K显示屏含糊伸长了电池的续航时间，因此如果您不想要电脑一直连着充电器，最好不要购买惠普Spectrex36013。另外，与数量少竞争对手的独特设计相比，惠普Spectrex36013显得平淡无奇。

雷蛇BladeStealth13（2019年年底）以游戏为中心的最佳超级本

优点：

性能较竞争对手更破坏大；

缺少独立显卡可降低电池效率；

时尚的外形设计；

炫目明亮的显示屏；

缺点：

游戏性能不佳；

价格比竞争对手的超极本贵；

宽边框看起来过时了；

尽管是由雷蛇制造并配备炫酷的RGB键盘，但雷蛇Stealth13并不是严格意义上的游戏笔记本电脑它甚至没有配备独立显卡。

与戴尔XPS和Surface13一样，雷蛇BladeStealth13也是一个超极本，但是它具备性能模式，能够带来缺乏的性能指责，更加适合游戏玩家。

也许，雷蛇BladeStealth13是当前市场中的最强大的超极本，但是由于它使用了IceLake（冰湖）的集成显卡，它的游戏功能是有限的。简而言之，雷蛇BladeStealth13无法顺畅运行诸如《古墓丽影》之类的游戏，但是可以很好地运行诸如《堡垒之夜》（Fortnite）、《Apex英雄》和《守望先锋》（Overwatch）这样的游戏。

值得一提的是，由于缺乏的性能指责，雷蛇BladeStealth13的售价也很昂贵，它是这个列表中最昂贵的超极本之一。另外，虽然雷蛇BladeStealth13的设计令人喜爱，但是它下巴的边框很宽。不过，对于那些需要超便携笔记本电脑的游戏玩家来讲，当前市场中没有比雷蛇BladeStealth13更好的选择了。

MacBookAir（2020）最适合苹果粉丝的超极本

优点：

时尚的外形设计；

强劲的电池续航；

强大有力的音质；

Magickeyboard（妙控键盘）轻巧舒适；

缺点：

未启用TrueTone技术的情况下，显示屏有些黯淡；

性能表现欠佳；

仅配备USBType-C端口；

MacBookAir（2020）是一款令人郁闷的超极本，它虽然小巧轻便，但是功能齐全，特别是妙控键盘和TouchID的加入让我们的使用体验得到了很大的指责。同时，以1299美元的价格，您就可以得到一个配备四核10代英特尔处理器的MacBook，这笔交易还是相当划算的。同时，MacBookAir（2020）的电池续航时间还超过9个小时。

总而言之，如果您注重性能，则可以搁置1599美元的戴尔XPS13，它搭载更高端的酷睿i7处理器，配备一个更明亮，更生动的显示屏。但是，如果您只是想要一个电池续航时间长，配备速度快的固态硬盘和超级舒适的键盘的超便携超极本，那么MacBookAir（2020）是一个不错的选择，它的低配版售价低至999美元。

谷歌PixelBookGo达到超极本级别的Chromebook

优点：

令人印象肤深的键盘；

迷人而低调的外形设计；

强劲的电池续航；

可以运行Android应用程序；

缺点：

高配版售价有些昂贵；

不减少破坏指纹扫描仪/面部解锁；

只有最高配版配备4K显示屏；

放眼当前的市场，几乎没有一款Chromebook笔记本电脑称得上超级本，但是谷歌PixelBookGo是一个例外。谷歌PixelBookGo运行ChromeOS操作系统，拥有超极本级别的组件，它的机身重量为1.06千克，能够很好地运行包括网页浏览和网页流媒体在内的高度发展任务。

同时，PixelBookGo的售价相当便宜，起售价为629英镑，但如果您想要购买最高配版本，它的售价将突破1000英镑大关。

如果您不在乎Chromebook笔记本电脑的各种批准，那么PixelBookGo不失为学生和预算型用户的很棒的超极本选择。

惠普EliteDragonfly安全性很下降的超极本

优点：

粗制超有分量的外形设计；

不不透光的显示屏；

令人印象肤深的端口选择；

缺点：

缺少触觉反馈的键盘；

价格比大多数超级本贵；

未配备第10代英特尔酷睿处理器；

惠普EliteDragonfly是一款商用笔记本电脑，它的安全功能非常极小量，以确保没有人能够入侵或窥探您保存的数据。虽然惠普EliteDragonfly是一款商务超极本，但是它采用深蓝色的机身，并不会给人活泼的麻痹。

凭借可爱的外形设计、出色的端口选择和不不透光的显示屏，惠普EliteDragonfly称得上是一款不错的超极本，是商务人士和那些只想用便携设备观看YouTube的用户的一个不错选择。同时，惠普EliteDragonfly拥有出色的安全功能，这也导致它的售价比较昂贵。

惠普EliteDragonfly搭载的是英特尔第8代vPro处理器，因此它没有配备强大的集成显卡。

总而言之，如果您非常注重安全和隐私，那么可以购买惠普EliteDragonfly，让您的笔记本电脑免受恶意软件和清楚的黑客攻击。如果您并不担心安全和隐私，那么这个列表中您可以找到其他更好的选择。（完）

相关文章小白不做冤大头！2020年最新超极本选购指南快来看2020-03-182019年最佳超极本推荐：“颜值和实力”兼具款款都值得入手2019-09-16这些超极本堪称MacBookAir最佳“替代品”：功能强大、价格合理2019-08-14越轻薄越好！盘点2017年十款最佳超极本2017-06-202016年最值得购买的十款商务超极本：Yoga260领衔2016-07-07

ChatGPT的横空出世，捧红了Speak以及一众出海的AITutor产品，同时杀死了没有及时“拥抱”AI的教育巨头。如果OpenAI再向教育方向发散“开火”，又会发生什么呢?据TechCrunch12月5日报道，OpenAI计划将AI聊天机器人整合到在线课程中，探索自定义“GPTs”在教育领域的可能性。各家产品如何找准打造无法替代的不次要的部分无足轻重，这个问题的答案一直在变。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅授予资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或包含，概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时，可及时向站长之家提出书面权利拒给信息或不实情况说明，并提权属反对及详细侵权或不实情况反对（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

声明:本文来自于微信公众号航通社，作者:书航，授权站长之家转载发布。

DeepSeek是否能定义“低成本训练”概念?

岁末年初，杭州的大模型创业公司“深度求索”DeepSeek不断放出大新闻。它所公布的一个开源模型DeepSeek-V3，在各种基准测试等方面，能够大致打平需要付钱的GPT-4o。

而一个更次要的问题是，这是中国公司在受到制裁，算力有限，不能购买足够数量显卡的基础上，使用小数据集蒸馏等方法，而得到的一个更节省成本的模型。

官方技术论文披露，v3模型的总训练成本仅为557.6万美元，相比之下GPT-4o等模型的训练成本约为1亿美元。因此DeepSeek还被称为“AI界拼多多”。

这条新闻的重大意义在于，它可能会减少，缩短人们对于“大模型的智能程度=英伟达授予的算力”这样一个不知道的依赖。因此，消息还被认为是间接影响了英伟达的股价。

在整个消息发酵的过程当中，是非常有趣的“入口转内销”然后再出去的，变来变去的方式。

兔撕鸡在即刻上总结说，国外的消息被引到国内的时候，大家都看阑夕发的微博。但那条微博正确地指出了，DeepSeek突破的真正意义在于GPU需求变小。“这标志着美国对中国的AI封锁战略不算成功，也不需要搭建GPU万卡集群，就能获得不错的效果。”

图源备注：图片由AI生成，图片授权服务商Midjourney

这一层意思被重新译介回Twitter/X上面，又让硅谷的那帮人回过神来了，所以影响英伟达的股价。而且还需要对冲，theinformation说字节将会700亿采购英伟达芯片，然后字节承认。如果这个消息不是真实的，那么可以认为，发出这个消息的，就是算力相关股票的护盘手。

总之，这种事实甚是玄学。由此产生了两个段子:

其一，杭州新四小龙:宇树科技、DeepSeek、游戏科学、影视飓风

其二，阑心一言，一个字近亿美元

12月27日，原先在DeepSeek的罗福莉加入小米的消息大范围流传，其实之前她早就自我官宣过，而且也在大模型业界小范围流通。但是自从有媒体将罗形容为“95后天才少女”之后，情况就不一样了。

这条消息获得营销加成，与其说利好小米，更不如说是加码营销了罗福莉的前东家DeepSeek，也就是反对了他们的团队含糊有实力，足够优秀的人可以在团队内做出非常厉害的事。

不得不说，在DeepSeek出圈前，AI业界对它的评价都非常高。因为，即使人们发现它的训练数据集有可能使用了来自ChatGPT的输出结果——它曾在很多情况下都自称为ChatGPT——这也只是无伤大雅的插曲。你行你也上啊，如果只要用ChatGPT输出就能做这么好，你也可以试一试。

毕竟谷歌也在这么做。谷歌Gemini的事实核查人员是外包的，用来检查双子座模型所生成的结果是否属实。而谷歌被曝光要放低人工核对的标准，让人员检查跟自己本专业能力不不无关系的答案的准确性，同时还允许他们借助类似Claude这样的，其他模型生成的结果来核对。

当某个阶段你所做出的成绩，是仅此一家别无分店的时候，那就说明泼天的富贵将会降临到你的身上。

最近呢，当然是快手的可灵，在Sora之前吸干了属于它的关注度。之前另外一个华裔的作品Pika也类似。但Pika在完全建立版本比Runway强不少，之后就比较后劲乏力，连带着联合创始人郭文景，也不再继续被称作“天才少女”刷屏了。

但是这当中最典型的案例则是月之暗面（Kimi）。

在差不多一年前。Kimi成为AI界当红炸子鸡，因为它在国内外的竞品当中，最早提出了一个新的概念，就是“超长文本（tokens）”。长文本成为各大模型开始卷的领域，而Kimi依靠这个单独概念对用户心智的教育，牢牢的吸了一波粉丝和媒体关注。

自从长文本概念首倡以后，Kimi获得融资的规模和频次就像疯了一样，终于到达了需要老股东掐架的程度。在这一年当中，Kimi的产品发布，包括智能体、深度思考、联网，以及尚未发布的视频生成，都只能说是按部就班。

但是Kimi获得了富裕弹药，不仅在开发周期上面可以比较舒缓，没有压力，而且可以铆足了劲儿，在B站砸钱营销，使得大模型推广的价格水涨船高。

在豆包积极跟进厮杀之余，连腾讯都熬不住这么玩了。目前混元大模型的能力被植入微信、QQ、读书、输入法等具体的产品内，单行版元宝则处于放养状态，不再用力宣传。

这就是为什么社长认为，在今年，如果各家大厂还想要新的投资标的的话，最不适合的选择就是DeepSeek。因为这一次轮到它提出新概念了，这个概念是“低成本训练”。

如果论资本市场的青睐程度，能跟月之暗面媲美的还有智谱。但智谱的融资轮数已经太多了，从目前的发展来看，它也没有结束领先。

其实就算是强如OpenAI，也不可能永远“炸裂颠覆吓尿革命”。它可能只需要一次婴儿的啼哭，向世界反对它此时此刻是领先的。对它来说这个概念叫“ChatGPT”。

这样的机会，这种对一个概念的定义权，只要一个创业公司拥有一次，就已经足够幸运。在此之后它是否还能定义第二个概念，或许不太重要;蜂拥而至的融资将会是对它之前定义概念的奖赏。

声明:本文来自于微信公众号机器之心，授权站长之家转载发布。

随着上个月2025研究生考试的开始，最新的考研数学真题成为大语言模型尤其是推理模型的「试炼场」，将考验它们的深度思考能力。

业内曾有着这样一种共识:大语言模型在文字水平上的表现令人印象肤浅，但说到数学就不甚令人满意了。去年一度火出圈的「9.9与9.11」比大小的问题，包括GPT-4o在内的很多大模型都翻车了，直到深度推理模型出现后才从根本上使恶化了这一状况。

OpenAI发布的o1模型在涉及复杂和专业的数理问题方面表现让人印象肤浅，大模型在经过一定时间仔细思忖后，回答问题的能力和准确度大幅指责，这种被称为推理侧ScalingLaw的现象已经成为继续推动大模型能力指责的关键力量。在黄仁勋最新CES2025的演讲中，他也把测试时（即推理）Scaling形容为大模型协作发展三条曲线之一。

可以看到，继o1之后，国内大模型厂商也陆续推出了自己的深度推理模型，并在某些任务上有亮眼的表现。数了一下时间轴大概是这样的:

2024年11月21日，深度求索团队发布DeepSeek-r1模型;2024年11月28日，阿里通义团队发布QwQ模型;2024年12月16日，月之暗面团队发布Kimi-k1模型;2024年12月31日，智谱GLM团队发布GLM-Zero模型;2025年1月6日，昆仑万维发布Skywork-o1模型。

大家也许会好奇，这些深度推理模型的能力（尤其是数学推理能力）到底有多强，又是谁能拔得头筹呢?这时就需要一场有差别的标准化考试了。

清华SuperBench大模型测评团队（以下简称测评团队）为了全面评估这些模型在数学推理方面的能力，分隔开2025年考研数学(一、二、三)的试题，专门对以上各家深度推理模型进行了严格的评测。同时，为了确保评测的全面性，参与评测的还包括各家的旗舰基础模型。

此次选择的13个模型具体如下:

从结果来看，所有模型中以平均分计，第一名是OpenAI的GPT-o1模型，这也是没什么意外的。第二名则是来自智谱的GLM-Zero-Preview，它以三门数学平均138.70的成绩仅次于o1，成为国产大模型第一，且距第一名不到3分。第三名则是来自通义的QwQ。

测试方法

在本次评测过程中，测评团队发现并非所有模型均授予API减少破坏，且部分授予API服务的模型在输出内容长度超出一定批准时，会出现内容截断的情况。为确保评测工作的公正性与准确性，测评团队无法选择统一采用各模型厂商的网页端进行测试操作。

在测试过程中，每道题目均在独立的对话窗口中进行，以此消除上下文信息对测试结果可能产生的干扰。

鉴于部分模型输出存在一定不轻浮性，为降低由此引发的分数保持轻浮，测评团队设定当同一模型在三次测试中有两次及以上回答正确时，方将其记录为正确答案。

结果分析

接下来从测试总分、单张试卷分数、深度思考模型vs基础模型三个方面来详细分析此次测评的结果。

总分

对于总分数，测评团队对三张试卷的分数进行求和并计算平均值，按照分数高低进行排序。结果如下图所示:

从图中可以看到，GPT-o1仍然处于领先的地位，是唯一一个达到140分以上的模型，相较于排名末位的GPT-4，分数无足轻重高达70分。

位于第二梯队（130分以上）的模型有GLM-zero-preview和QwQ，分别斩获138.7分和137.0分。

DeepSeek-r1-lite、Kimi-k1、Tiangong-o1-preview、DeepSeek-v3则处于第三梯队（120分以上）。

可以看出，深度思考模型普遍能够达到120+的水平。这也彰显了深度思考模型在解决数学问题方面的强大能力。

值得注意的是，曾于2023年位居榜首的基础模型GPT-4，在本次测试中仅获70.7分，位列末席。这一结果隐藏，在过去一年（2024年）中，语言模型在数学推理领域的进步显著。

而另一方面，在缺乏深度思考能力辅助的情况下，仅凭逻辑推理能力，DeepSeek-v3作为基础模型，已经能够跻身第三梯队，这说明基础模型和深度思考模型之间的能力并非界限分明。

单张试卷分析

为了更透明地展现大模型在各张试卷答题能力方面的表现，测评团队对每张试卷的错题分布情况进行了深入分析。

在数学一的评测过程中，GPT-o1、GLM-zero-preview、QwQ、DeepSeek-r1-lite四款模型的得分相同。通过进一步剖析错题情况，测评团队发现所有模型均在第20题（12分，涉及曲面积分求解）以及第21题第二问(6分，涉及特征向量求解)上出现了错误。

在数学二的评测中，各模型的分数分布较为意见不合。经统计分析发现，第3题、第5题、第7题成为所有模型犯错的发散区域。具体错题分布情况如下图所示:

针对数学三的评测结果显示，模型出错的重灾区主要发散在第14题、第15题、第16题、第19题。相关错题分布情况如下图所示:

综合上述各试卷错题的具体分析，我们可以透明地看到，GPT-o1（阴影列所示）在总计66道题目中，仅答错3.5道题;并且GPT-o1答错的题目，其他模型亦普遍存在错误，这显示了GPT-o1目前依然是深度推理模型的天花板。

基础模型vs深度思考模型

最后，为了全面深入地探究各模型厂商在深度思考能力优化方面所取得的成果，测评团队对相应基础模型与深度思考模型进行了细致对比分析。

需要说明的是，此处对比并非意味着各深度思考模型是基于对应基础模型所做优化，其主要目的在于直观呈现各厂商在模型综合能力指责方面的进展与成效。