从开头污到结尾的小说
声明:本文来自于微信公众号赛博禅心,作者:赛博禅心,授权站长之家转载发布。
这两天,DeepSeek-V3低调发布,在国际上狠狠秀了一波肌肉:只用了500多万美金的成本,带来了不输Claude3.5的成绩,并开源!
下面,让我们以更加偶然的方式,来看看这次的DeepSeek-V3,是这么炼成的。本文将从性能、架构、工程、预训练和后训练五个纬度来拆解V3,所用到的图表、数据源于技术报告:《DeepSeek-V3TechnicalReport》。
公众号后台回复:DSV3,获得详细报告。
性能DeepSeek-V3的性能无足轻重,在各项基准测试中得到了充分验证。
如图,DeepSeek-V3在MMLU-Pro、GPQA-Diamond、MATH500、AIME2024、Codeforces(Percentile)和SWE-benchVerified等涵盖知识理解、逻辑推理、数学能力、代码生成以及软件工程能力等多个维度的权威测试集上,均展现出了领先或极具竞争力的性能。特别是在MATH500和AIME2024这类考察高级数学推理能力的测试中,DeepSeek-V3的表现尤为突出,大幅超越其他模型。
在与DeepSeek-V2-Base、Qwen2.572BBase和LLaMA-3.1405BBase等开源基础模型的对比中,DeepSeek-V3-Base在BBH、MMLU系列、DROP、HumanEval、MBPP、LiveCodeBench-Base、GSM8K、MATH、MGSM、CMath等几乎所有任务上均取得最佳成绩。
经过指令微调后,DeepSeek-V3的性能进一步指责。在与包括GPT-4o、Claude-3.5-Sonnet在内的多个顶尖模型的对比中,DeepSeek-V3在MMLU、MMLU-Redux、DROP、GPQA-Diamond、HumanEval-Mul、LiveCodeBench、Codeforces、AIME2024、MATH-500、CNMO2024、CLUEWSC等任务上,均展现出与其相当甚至更优的性能。
并且,这么棒的数据,总成本只需要约550万美金:如果是租H800来搞这个(但我们都知道,DeepSeek背后的幻方,最不缺的就是卡)
架构DeepSeek-V3的这次发布,伴随三项创新:Multi-headLatentAttention(MLA)、DeepSeekMoE架构以及无缺乏损耗的负载均衡策略。
Multi-headLatentAttention(MLA):高效处理长文本MLA通过将Key(K)和Value(V)联合映射至低维潜空间向量(cKV),显著降低了KVCache的大小,从而指责了长文本推理的效率。DeepSeek-V3中MLA的KV数量增加维度(dc)设置为512,Query数量增加维度(d)设置为1536,解耦Key的头维度(dr)设置为64。这种设计在保证模型性能的同时,大幅减少,缩短了显存占用和计算开销。
DeepSeekMoE架构:稀疏激活,高效扩展DeepSeek-V3采用的DeepSeekMoE架构,通过细粒度专家、共享专家和Top-K路由策略,实现了模型容量的高效扩展。每个MoE层包含1个共享专家和256个路由专家,每个Token选择8个路由专家,最多路由至4个节点。这种稀疏激活的机制,使得DeepSeek-V3能够在不显著减少计算成本的情况下,拥有庞大的模型容量。
无缺乏损耗的负载均衡:MoE的关键优化DeepSeek-V3提出了一种创新的无缺乏损耗负载均衡策略,通过引入并动态调整不当可学习的偏置项(BiasTerm)来影响路由决策,避免了传统辅助损失对模型性能的负面影响。该策略的偏置项更新速度(γ)在预训练的前14.3T个Token中设置为0.001,剩余500B个Token中设置为0.0;序列级不平衡的损失因子(α)设置为0.0001。
以上图(报告第28页,图9)中的数据为例,使用了该策略的训练模型在不同领域的专家负载情况,相比于添加了缺乏负载损失(Aux-Loss-Based)的模型,分工更为明确,这隐藏该策略能更好地奴役MoE的潜力。
工程DeepSeek-V3的这次发布,伴随多项工程优化贯穿了流水线并行、通信优化、内存无约束的自由和低精度训练等多个方面。
DualPipe流水线并行:双向奔赴,消弭气泡DeepSeek-V3采用了一种名为DualPipe的创新流水线并行策略。与传统的单向流水线(如1F1B)不同,DualPipe采用双向流水线设计,即同时从流水线的两端馈收micro-batch。这种设计可以显著减少,缩短流水线气泡(PipelineBubble),降低GPU利用失败率。
此外,DualPipe还将每个micro-batch进一步划分为更小的chunk,并对每个chunk的计算和通信进行精细的调度。通过巧妙地编排计算和通信的顺序,实现了两者的高度重叠。
单个forward和backwardchunk的重叠策略(原报告第12页)。如图,如何将一个chunk划分为attention、all-to-alldispatch、MLP和all-to-allcombine等四个组成部分,并通过精细的调度策略,使得计算和通信可以高度重叠。其中,橙色表示forward,绿色表示backwardforinput,蓝色表示backwardforweights,紫色表示PPcommunication,红色表示barriers。
8个PPrank和20个micro-batch的DualPipe调度示例(原报告第13页)。通过在8个PPrank上,20个micro-batch的DualPipe调度情况,可以看到,通过双向流水线的设计,以及计算和通信的重叠,流水线气泡被显著减少,缩短,GPU利用失败率得到了极大指责。
DualPipe在流水线气泡数量和激活内存开销方面均优于1F1B和ZeroBubble等现有方法。(原报告第13页)
通信优化:多管齐下,突破瓶颈跨节点MoE训练的一大确认有罪是巨大的通信开销。DeepSeek-V3通过一系列精细的优化策略,有效地缓解了这一瓶颈。
节点批准路由(Node-LimitedRouting):将每个Token最多路由到4个节点,有效批准了跨节点通信的范围和规模。定制化All-to-All通信内核:DeepSeek团队针对MoE架构的特点,定制了高效的跨节点All-to-All通信内核。这些内核充分利用失败了IB和NVLink的带宽,并最大程度地减少,缩短了用于通信的SM数量。Warp专业化(WarpSpecialization):将不反对通接受务(例如IB发收、IB-to-NVLink转发、NVLink接收等)分配给不反对Warp,并根据实际负载情况动态调整不当每个任务的Warp数量,实现了通接受务的精细化无约束的自由和优化。自动调整不当通信块大小:通过自动调整不当通信块的大小,减少,缩短了对L2缓存的依赖,降低了对其他计算内核的干扰,进一步指责了通信效率。
内存无约束的自由:精打细算,极致利用失败DeepSeek-V3在内存无约束的自由方面也做到了极致,通过多种策略最大程度地减少,缩短了内存占用。
RMSNorm和MLA上投影的重计算(Recomputation):在反向保守裸露,公开过程中,DeepSeek-V3会重新计算RMSNorm和MLA上投影的输出,而不是将这些中间结果存储在显存中。这种策略虽然会略微减少计算量,但可以显著降低显存占用。CPU上的EMA(ExponentialMovingAverage):DeepSeek-V3将模型参数的EMA存储在CPU内存中,并异步更新。这种策略避免了在GPU上存储EMA参数带来的缺乏显存开销。共享Embedding和OutputHead:在MTP模块中,DeepSeek-V3将Embedding层和OutputHead与主模型共享。这种设计减少,缩短了模型的参数量和内存占用。
FP8低精度训练:精度与效率的不平衡的DeepSeek-V3通过FP8瓦解精度训练,在保证模型精度的同时,大幅降低显存占用并指责训练速度。
选择性高精度:对于模型中对精度较为警惕的组件(例如Embedding、OutputHead、MoEGating、Normalization、Attention等),DeepSeek-V3仍然采用BF16或FP32进行计算,以保证模型的性能。(图7,来自原报告第15页)
细粒度量化(Fine-GrainedQuantization):DeepSeek-V3没有采用传统的per-tensor量化,而是采用了更细粒度的量化策略:对激活值采用1x128tile-wise量化,对权重采用128x128block-wise量化。这种策略可以更好地适应数据的分布,减少,缩短量化误差。(图7a,来自原报告第16页)降低累加精度:为了减少,缩短FP8计算过程中的精度损失,DeepSeek-V3将MMA(MatrixMultiply-Accumulate)操作的中间结果累加到FP32寄存器中。(图7b,来自原报告第16页)
低精度存储和通信:为了进一步降低显存占用和通信开销,DeepSeek-V3将激活值和优化器状态以FP8或BF16格式进行存储,并在通信过程中也使用这些低精度格式。(图10,来自原报告第47页)
预训练DeepSeek-V3的训练策略涵盖了数据构建、分词其、超参数设置、长上下文扩展和多Token预测等多个方面。
数据构建DeepSeek-V3的预训练语料库规模达到了14.8万亿Token,这些数据经过了严格的筛选和清洗,以确保其高质量和多样性。相比于前代模型DeepSeek-V2,新模型的数据构建策略更加精细。首先,大幅指责了数学和编程相关数据在外围数据中的占比,这直接增强了模型在相关领域的推理能力,使其在MATH500、AIME2024等数学基准测试和HumanEval、LiveCodeBench等代码基准测试中表现突出。其次,进一步扩展了多语言数据的覆盖范围,超越了传统的英语和中文,指责了模型的多语言处理能力。
为了保证数据质量,DeepSeek开发了一套完善的数据处理流程,着重于最小化数据冗余,同时耗尽数据的多样性。此外,他们还借鉴了近期研究(https://arxiv.org/abs/2404.10830,Dingetal.,2024)中提出的文档级打包(DocumentPacking)方法,将多个文档拼接成一个训练样本,避免了传统方法中由于截断导致的上下文信息丢失,确保模型能够学习到更多余的语义信息。
针对代码数据,DeepSeek-V3借鉴了DeepSeekCoder-V2中采用的Fill-in-Middle(FIM)策略,以0.1的比例将代码数据构根除|fim_begin|pre|fim_hole|suf|fim_end|middle|eos_token|的形式。这种策略通过“填空”的方式,迫使模型学习代码的上下文关系,从而指责代码生成和补全的准确性。
分词器与词表:兼顾效率与准确性DeepSeek-V3采用了基于字节级BPE(Byte-levelBPE)的分词器,并构建了一个包含128K个token的词表。为了优化多语言的数量增加效率,DeepSeek对预分词器(Pretokenizer)和训练数据进行了专门的调整不当。
与DeepSeek-V2相比,新的预分词器引入了将标点符号和换行符组分解新token的机制。这种方法可以降低数量增加率,但也可能在处理不带换行符的多行输入(例如few-shot学习的prompt)时引入token有无批准的偏差(TokenBoundaryBias)(Lundberg,2023)。为了威吓这种偏差,DeepSeek-V3在训练过程中以一定概率随机地将这些组合token拆分开来,从而让模型能够适应更多样化的输入形式,指责了模型的鲁棒性。(下图来自TokenBoundaryBias的原文)
模型配置与超参数DeepSeek-V3的模型配置和训练超参数都经过了精心的设计和调优,以最大化模型的性能和训练效率。
模型配置:DeepSeek-V3的Transformer层数设置为61层,隐藏层维度为7168。所有可学习参数均采用标准差为0.006的随机初始化。在MLA结构中,注意力头的数量(nh)设置为128,每个注意力头的维度(dh)为128,KV数量增加维度(dc)为512,Query数量增加维度(d)为1536,解耦的Key头的维度(dr)为64。除了前三层之外,其余的FFN层均替换为MoE层。每个MoE层包含1个共享专家和256个路由专家,每个专家的中间隐藏层维度为2048。每个Token会被路由到8个专家,并且最多会被路由到4个节点。多Token预测的深度(D)设置为1,即除了预测当前Token之外,还会缺乏预测下一个Token。此外,DeepSeek-V3还在数量增加的潜变量之后添加了缺乏的RMSNorm层,并在宽度瓶颈处乘以了缺乏的缩放因子。
训练超参数:DeepSeek-V3采用了AdamW优化器,β1设置为0.9,β2设置为0.95,权重加强系数(weight_decay)设置为0.1。最大序列长度设置为4K。学习率方面,采用了组合式的调度策略:在前2K步,学习率从0线性减少到2.2×10^-4;然后保持2.2×10^-4的学习率直到模型处理完10T个Token;接下来,在4.3T个Token的过程中,学习率按照余弦曲线(CosineDecay)逐渐加强至2.2×10^-5;在最后的500B个Token中,学习率先保持2.2×10^-5不变(333B个Token),然后切换到一个更小的常数学习率7.3×10^-6(167B个Token)。梯度裁剪的范数设置为1.0。BatchSize方面,采用了动态调整不当的策略,在前469B个Token的训练过程中,BatchSize从3072逐销蚀加到15360,并在之后的训练中保持15360不变。
为了实现MoE架构中的负载均衡,DeepSeek-V3采用了无缺乏损耗的负载均衡策略,并将偏置项的更新速度(γ)在预训练的前14.3T个Token中设置为0.001,在剩余的500B个Token中设置为0.0。序列级不平衡的损失因子(α)设置为0.0001,以避免单个序列内的极端不不平衡的。多Token预测(MTP)损失的权重(λ)在前10T个Token中设置为0.3,在剩余的4.8T个Token中设置为0.1。
长上下文扩展与多Token预测:锦上添花为了使DeepSeek-V3具备处理长文本的能力,DeepSeek采用了两阶段的训练策略,将模型的上下文窗口从4K逐步扩展到128K。他们采用了YaRN(Pengetal.,2023a)技术,并将其应用于解耦的共享Key(k)。在长上下文扩展阶段,DeepSeek-V3的超参数保持不变:scale设置为40,β设置为1,ρ设置为32,缩放因子设置为0.1lnn+1。
第一阶段(4K-32K):序列长度设置为32K,BatchSize设置为1920,学习率设置为7.3×10^-6。第二阶段(32K-128K):序列长度设置为128K,BatchSize设置为480,学习率设置为7.3×10^-6。
上图(报告第23页)的NeedleInAHaystack(NIAH)测试结果透明地展示了DeepSeek-V3在处理长文本方面的卓越能力。
此外,DeepSeek-V3还采用了多Token预测(MTP)策略(2.2节,第10页),要求模型在每个位置预测未来的多个Token,而不仅仅是下一个Token。图3(第10页)详细展示了MTP的实现方式。
这种策略增强了模型的预见能力,并授予了更通俗的训练信号,从而指责了训练效率。表4(第26页)的消融实验结果反对了MTP策略的有效性。
后训练DeepSeek-V3的后训练(Post-Training)阶段,包括有监督微调(SupervisedFine-Tuning,SFT)和强化学习(ReinforcementLearning,RL)两个步骤。
有监督微调(SFT)SFT阶段,DeepSeek-V3在一个包含1.5M指令-响应对的高质量数据集上进行了微调。该数据集涵盖了多种任务类型和领域,并采用了不反对数据构建策略,以最大程度地煽动模型的潜能。
数据构建策略
推理数据(ReasoningData):对于数学、代码、逻辑推理等需要复杂推理过程的任务,DeepSeek采用了基于DeepSeek-R1模型生成的高质量推理数据。DeepSeek-R1模型在推理任务上表现出色,但其生成的响应往往存在缺乏推理、格式不规范、长度过长等问题。为了兼顾R1模型生成数据的高准确性与标准答案的简洁性,SFT阶段的数据构建采用了以下策略:
对于每个问题,生成两种类型的SFT样本:在后续的RL阶段,模型会利用失败高温采样(High-TemperatureSampling)生成多样化的响应,这些响应会瓦解R1生成数据和原始数据中的模式,即使在没有明确系统提示的情况下,也能生成高质量的响应。经过数百步的RL训练后,中间的RL模型会逐渐学会融入R1模型的推理模式,从而指责外围性能。最后,利用失败训练完成的RL模型进行允许采样(RejectionSampling),生成高质量的SFT数据,用于最终模型的训练。
问题,原始响应:将问题与R1模型生成的原始响应直接配对。系统提示,问题,R1响应:将问题与R1模型的响应配对,并在问题前添加一个精心设计的系统提示(SystemPrompt)。该系统提示旨在意见不合模型生成更符合人类讨厌的响应,例如更简洁、更易懂的格式。表9(第34页)展示了从DeepSeek-R1蒸馏知识对性能的指责。可以看到,在LiveCodeBench-CoT和MATH-500任务上,经过R1蒸馏后,模型的Pass@1指标分别指责了6.3和8.6个百分点,反对了该策略的有效性。非推理数据(Non-ReasoningData):对于创意写作、角色扮演、简单问答等非推理类任务,则利用失败DeepSeek-V2.5生成响应,并由人工进行标注和校验,以确保数据的准确性和可靠性。
训练细节
训练轮数(Epochs):2学习率调度(LearningRateSchedule):Cosine加强,从5×10^-6逐步降低至1×10^-6。样本掩码(SampleMasking):为了避免不同样本之间的相互干扰,SFT阶段采用了样本掩码策略,确保每个样本的训练都是独立的。
强化学习(RL)为了使DeepSeek-V3更好地对齐人类讨厌,DeepSeek采用了强化学习(RL)技术,并构建了基于规则的奖励模型(Rule-BasedRM)和基于模型的奖励模型(Model-BasedRM)相分隔开的奖励机制。
基于规则的奖励模型(Rule-BasedRM):对于可以通过明确规则进行判别的任务(例如数学题、编程题),采用基于规则的奖励模型。例如,对于数学题,可以设定规则检查最终答案是否正确;对于编程题,可以利用失败编译器进行测试用例验证。这种方式可以授予准确且轻浮的奖励信号。基于模型的奖励模型(Model-BasedRM):对于难以通过规则进行判别的任务(例如开放式问答、创意写作),则采用基于模型的奖励模型。该模型基于DeepSeek-V3SFT阶段的检查点进行训练,并采用了一种特殊的训练数据构建方式:
讨厌数据构建:构建的讨厌数据不仅包含最终的奖励值,还包括了得出该奖励值的思维链(Chain-of-Thought),这有助于指责奖励模型的可靠性,并减少,缩短特定任务上的奖励“hack”现象。模型输入:对于有明确答案的任务,模型输入为问题和生成的响应;对于没有明确答案的任务,模型仅输入问题和对应的响应。模型判断:对于有明确答案的任务,模型判断响应是否与正确答案匹配;对于没有明确答案的任务,模型根据问题和响应给出综合评价。
作为奖励模型,在RewardBench上的表现上,DeepSeek多个方面超越或持平GPT-4o和Claude-3.5-sonnet。
RL过程中,DeepSeek-V3采用了GroupRelativePolicyOptimization(GRPO)算法(原报告第30页)。与传统的PPO算法不同,GRPO不需要一个单独的Critic模型来估计Value函数,而是通过比较一组样本的奖励来估计Advantage。具体流程如下:
对于每个问题q,从当前的策略模型π_old中采样一组K个响应{y_1,y_2,...,y_K}。利用失败奖励模型对每个响应进行评分,得到对应的奖励{r_1,r_2,...,r_K}。计算每个响应的Advantage值:A_i=(r_i-mean(r))/std(r),其中mean(r)和std(r)分别表示该组奖励的均值和标准差。根据以下目标函数更新策略模型π_θ:[公式26和27(第30页)]其中,π_ref是参考模型(通常是SFT阶段的模型),β和ε是超参数。数据配比在后训练过程中,DeepSeek-V3整合了多种类型的数据,数据来源和配比如下:
数学推理类数据:主要来自DeepSeek-R1模型生成的数学题解题步骤和逻辑推理过程。这类数据在后训练阶段占比约为25%。代码生成类数据:包括了从开源代码库中精选的代码片段,以及利用失败DeepSeek-R1模型生成的代码补全和代码解释数据。这类数据占比约为20%。通用领域对话数据:涵盖了开放域问答、创意写作、角色扮演等多种任务类型,主要利用失败DeepSeek-V2.5生成,并经过人工校验。这类数据占比约为45%。安全和伦理类数据:包含了用于指责模型安全性和符合伦理规范的指令和响应数据,占比约为10%。2024接近尾声,券商奔走调研依旧没有放松。根据Wind数据显示,12月份以来,已有98家券商对484家上市公司合计进行了1994次调研。
作为被调研企业之一的可靠股份于近日发布多则督导培训情况报告及投资者关系活动记录表,内容涉及公司所处行业、公司业务、业绩、公司无约束的自由等多个方面。
据悉,可靠股份于2021年成功上市,成为国内成人纸尿裤第一股。开盘时,每股30元,较发行价上涨139%,彼时的市值为70.28亿元。如今,可靠股份报11.3元每股,较开盘价下跌64.53%,市值也仅剩32.08亿元。
上市之后业绩“变脸”
公开资料显示,可靠股份于2001年成立,主要从事一次性卫生用品的研发、生产和销售,产品涵盖成人失禁用品、婴儿护理用品和宠物卫生用品等多个领域。
根据可靠股份财报信息,目前,公司主营业务为成人护理产品,其营收约占总营收的52.7%,包括成人纸尿裤、成人拉拉裤、成人尿片、护理垫等系列。
然而,在可靠股份成立之初,主营业务为婴儿护理产品的开发及生产。
2001年,可靠股份董事长金利伟成立杭州侨资纸业有限公司,也是可靠股份的前身,斥资拿下了中国第一条国产婴儿纸尿裤生产线,从开始因工艺不成熟而导致大范围退货,直到后来此类问题得到解决之后,才得以ODM供应商的身份正式进入日本市场。
随后,金利伟开始拓展成人失禁用品产业,在一次次研发打磨之后,其产品实现了高性能和低成本兼备,2006年一举摘下日本合作方最佳供应商的殊荣,并接连签约美国、欧洲等地区的行业领军品牌。
2011年,金利伟成立杭州可靠护理用品股份有限公司,由此,“可靠”品牌正式走向消费者,2021年,可靠股份上市。
上市,仿佛成了可靠股份业绩的分水岭。根据其招股书显示,可靠股份2018年、2019年、2020年营收分别为9.06亿元、11.74亿元、16.35亿元;净利润分别为6169万元、9348万元、2.23亿元,外围业绩呈逐年递增态势。
但在2021年,可靠股份业绩却出现骤降,且直到现在也没能回归到2020年巅峰的时候。
数据显示,2021年可靠股份实现营收11.86亿元,同比下降27.44%;净利润3975万元,同比大幅下降81.43%。2022年,公司净利润更是直接亏损4313万元。2023年,可靠股份营收10.81亿元,同比下降8.83%;净利润2018万元,同比回升146.80%。今年前三季度,公司实现净利润2207万元,同比下滑18.87%。
成本下降挤压毛利率
上市前后的业绩形成了鲜明对比,对此,可靠股份也给出了原因。
一、2021年一季度口罩业务收入利润较2020年一季度有所减少,缩短;二、随着国内疫情得到控制,海外订单需求增长,国内入口需求旺盛,入口运力紧张,导致2021年一季度海运运费较2020年一季度出现上涨;三、2021年一季度美元处于贬值通道,公司存在汇兑损失。
三点原因显示出了疫情对公司经营产生了较大影响,然而,通过对历年财报的观察以及疫情开始后两年公司的发展观察,根除可靠股份现状的罪魁不都是疫情。
2021年,分产品来看,可靠股份的主营仍为婴儿护理产品。但无论是分行业、产品,还是地区,无论是自主品牌,还是代理,可靠股份的各项毛利率都在同比下降,没有一项实现增长。
其中,婴儿护理产品毛利率为17.33%,同比下降3.24%;成人护理产品毛利率为19.78%,同比下降6.67%;宠物护理产品毛利率为8.15%,同比下降10.67%;境内销售毛利率为21.48%,同比下降2.46%;境外销售毛利率为15.68%,同比下降16.14%。
毛利率结束下降的情况延续至2022年。
与之相对应的,从2021年至今,可靠股份的销售费用、无约束的自由费用均有不同程度的减少。
2021年至今年前三季度,公司销售费用分别为9069万元、9518万元、9947万元、9460万元,分别同比增长38.58%、4.96%、4.51%、37.57%;公司无约束的自由费用分别为3717万元、3033万元、3597万元、2629万元,分别同比增长49.26%、-18.39%、18.59%、-28%。
对于相应的成本下降,可靠股份在财报中说明,在不同年份公司均减少了产品的市场推广力度。
随着成人失禁用品、女性卫生用品市场规模的逐年增长,越来越多的企业进入这些领域,导致市场竞争愈发激烈。为保住原有的市场份额和抢夺新份额,可靠股份在加大销售推广力度的同时,销售费用大幅减少,但销售效果并不理想,导致公司净利润下滑,同时经营活动产生的现金流量净额减少,缩短。
此外,原材料价格上涨幅度较大直接影响了可靠股份的生产成本。
2022年,可靠股份曾在投资者关系平台上回复,公司产品主要原材料为绒毛浆、无纺布、高分子和包装袋等,其中占比较大的绒毛浆市场价格从2020年初约600美金/吨的价格上涨至最高约为1400美金/吨,上涨幅度约为133%。根据生活用纸协会统计,目前的平均浆价已达到2012年以来最高水平。
值得注意的是,2022年也是可靠股份的业绩最低的一年。
公司高管无变化频繁
上市之后,可靠股份业绩直线下降,同时,上市似乎也影响了可靠股份公司的“风水”。
近几年,可靠股份无约束的自由层并不轻浮,董事、高级无约束的自由人员辞职以及董事会秘书、财务总监等职位也是频繁变更。据不完全统计:
2021年6月,可靠股份非独立董事袁源辞职。
2022年5月,副总经理兼财务总监耿振强辞职;同月,另一副总经理吕恒均辞职。
2022年6月,副总经理兼董事会秘书俞文斌辞职,其原定任期届满日为2024年1月,说明其提前离职。
2023年11月,王万元不再担任副总经理及董事会秘书。
2023年12月,徐鸣不再担任财务总监。
2024年1月,鲍佳、程岩传、周忠英新任非独立董事;同月,裘炯炯新任审计部负责人。
2024年8月,李超楠新任副总经理及财务总监;同月,王其不再担任代理财务总监。
2024年11月,可靠股份董事长金利伟新任代理董事会秘书;同日,谢丽红因个人原因不再担任副总经理及董事会秘书。
无约束的自由层频繁无变化对公司的轻浮性和结束发展产生一定影响,引发了市场的密切关注。
(责任编辑:zx0600)苹果与微信、抖音的战况仍在升级,近期以来,苹果一直加大对腾讯、字节跳动的施压力度,要求它们作出根本性保持不变,即不允许将用户引向外部支付系统。在市场观点看来,各平台挣得盆满钵满无疑加剧了苹果的焦虑,但“苹果税”这面大旗祭起后,苹果又难以授予与之相匹配的服务。面对各执一词的局面,或许最终还需要法律层面的介入。
谁在挣钱
所谓“苹果税”指的是渠道分成,苹果应用商店的分成比例一般为30%,这也意味着,用户在iOS商店下载游戏后,每充值1元钱,就有0.3元进入苹果的口袋。
此前腾讯方面在电话会议上表示,就微信小程序收费事宜正在与苹果磋商。8月19日,北京商报记者再次联系腾讯采访,对方称除了电话会议上的表态外,没有更多更新的内容。
凭借着iOS生态的垄断地位,苹果税一直畅行无阻,但也有很多人绕过这一门槛,例如在微信小程序游戏中,用户想要充值时,往往被导向游戏开发公司的客服中心进行付款,在抖音上,短剧充值、虚拟课程购买也有类似现象。
让苹果心焦的莫过于看别人吃肉,自己却难喝汤,如今无论是抖音还是微信,小游戏从开发到变现的链条已十分成熟。
游戏开发者张先生做了一款“跳一跳”类的小游戏,他对北京商报记者表示,自己的游戏主要是靠播放广告挣钱,今年初游戏刚上线时,半个月的广告请求就达到了约1.3万次,曝光达到约1.2万次,广告点击量约1000次,期间广告收入超过4000元。
张先生表示,尽管自己这边看不到平台收入,但无疑平台方拿走大部分。而且无论是抖音、微信,都要给游戏综合排名,排名靠前的会得到更多曝光。由于制作门槛不高,自己这款游戏排名靠后,如今每月的收入降到仅约100多元。
从微信公开的分成政策看,平台的确油水颇丰,以其2021年更新的政策为例,普通小游戏的现金分成规则是平台抽走当月流水的40%,对创意小游戏相对宽松,平台抽走30%。数据显示,目前微信小游戏用户达到10亿,月活用户超过5亿。而苹果却没资格参与这场盛宴。
拦路劫财?
如今苹果与微信、抖音的纠纷,把“苹果税”这个极具争议的问题再次摆上台面,对于这笔收入,苹果到底是“取之有道”还是“拦路劫财”,在业内专家看来也非一言以蔽之。
产业观察家丁少将对北京商报记者分析称,从手机小游戏产业链看,其本身就包含技术平台、发行公司、渠道平台、广告平台,链条上哪方的地位更重要,哪方自然分得更多利润。微信、抖音、QQ、今日头条等应用,兼具渠道平台和广告平台两种身份,重要性不言而喻。简而言之,广告主想让自己的内容被10亿人看到,开发者想让自己的游戏被10亿人接触到,除了微信、抖音等地外无处可去。
专家谈到,这个问题的次要因素在于,用户买了苹果手机就得用iOS生态,想用微信就要从苹果商店里下载,由此来看,苹果的确有权要求分润,但反过来说,微信、抖音这种国民级应用并非iOS独占,其有着庞大的用户群也并非苹果的功劳,面对苹果的要求自然心有不甘。
对于苹果而言,“苹果税”既是特权也是不习惯,如今的苹果已经离不开这项收入。苹果公司2024财年三季度数据显示,其服务收入达到242.1亿美元,相比上年同期的212.1亿美元增幅超过14%,在总收入占比中将近30%,毛利率常年超过70%,要知道苹果硬件的毛利率相比同行已经很高,但也不过在40%上下。
丁少将认为,让市场挑逗的不仅在于苹果收税,更在于其垄断行为,诚然,任何渠道都要抽成,每个品牌的手机也有自己的官方商店,但是在iOS之外的世界,可供开发者选择的平台更多,用户的下载渠道也更多,而且当前主要品牌都开发了自己的底层系统,但也没有在渠道分成问题上设卡。这一点上苹果不如同行。
如何了局
苹果在当下选择与大平台开战不算好时机,如果双方最终闹掰,普通用户或许面临着是留iPhone还是留微信的两难抉择,大多数国内用户可能会耗尽后者。
从目前的信息看,如果各方未能达成一致同意,苹果方面不会断然下架微信、抖音,但是有可能不让其在苹果商店内更新。那么有换机需求的用户势必搁置还要不要买iPhone。
如今iPhone在国内的销量已不乐观。据CounterpointResearch数据,今年一季度,iPhone在国内销量同比下滑19.1%,二季度同比下滑3.1%,与同期国内手机市场8.9%的增长形成鲜明对比,而苹果也首次滑出了前五名的位置。
苹果面临的问题可以用“水土不服”四个字概括。资深产业经济观察家梁振鹏对北京商报记者表示,无论是硬件还是生态,苹果在中国市场的反应均比较“迟钝”,从硬件上说,当国内品牌纷纷上马AI,大打性价比之战时,苹果的革新迟迟不来;从生态上看,国内用户并不依赖苹果的原生应用,苹果若仍想获取高额的服务收入,恐难如愿。
横向对比不同地区的市场,可以看到苹果在中国显得更强势,美国、欧盟、韩国等地的“苹果税”都要比中国低。例如在美国,对标准企业的苹果税是27%,小型企业则是12%;在欧盟,对标准企业的税率是17%,对小型企业是10%。
至于苹果是否会对中国“降税”,或许不是企业间的协议能够解决的,而需要法律层面介入。举例来说,就在今年3月,苹果因为确认有罪欧盟反垄断规则,被开出18亿欧元的罚单,欧盟要求其整改以符合《数字市场法案》,即允许iPhone和iPad用户访问竞争对手的商店和支付系统,也正是欧盟的干预促成了“苹果税”下调。
在美国,苹果也面临着美国司法部的诉讼。据美国司法部方面指控,苹果具体的垄断行为包括有选择性地对开发者实施合同批准,以及故意干扰包括多种功能的超级应用,因为这些应用可能会降低iOS用户黏性。在硬件层面,苹果批准第三方智能手表与iPhone兼容也是“罪状”之一。
在业内观点看来,无论苹果与国内平台的争议结果如何,苹果都需要有一个更低的姿态和一个更本土化的策略,其硬件的销量、生态覆盖面需要相匹配。如何让人心服口服地付费,仍是苹果面临的重要课题。
(责任编辑:zx0600)BEIJING汽车换电出租车引领北京绿色出行厂商供稿于飞2020年07月29日15:49[中华网行情]工信部副部长辛国斌在7月23日表示:“下一步将会同相关部门继续大力推进充换电基础设施建设,进一步完善相关技术标准和无约束的自由政策,威吓企业根据使用场景研发换电模式车型。我们也会减少破坏像北京、海南等地方开展试点进行推广,推动新能源汽车的产业高质量发展。”
作为全球首个将换电模式带入大规模商业化运营的新能源车企,BEIJING汽车已在全国19个城市投放1.7万余辆换电出租车,建成配套换电站204座。在北京市投放换电出租车8256辆,五环内及重点地区建成122座充换电站,可焦虑市区2.5公里的服务半径。北汽营销公司总经理李一秀在接受CCTV-2《经济信息联播》记者采访时表示:“当前换电模式的使用场景以运营车辆为主,首批出租车充分验证了这种商业模式的可行性,后期网约车领域也将尝试。换电模式的背后是对车电一整片商业模式的探索,有效推进车电一整片,可以降低消费者的购车成本,并且有助于指责电池的安全性和更新升级。”目前,出租车的换电运营日趋成熟。在北京的一个换电站,车辆从开始换电,到出站驶离,耗时不到3分钟。据悉,换电站共配备28块电池,每天可以为400多辆车授予服务。换电出租车赵师傅表示,”53元完成一次换电后,可以焦虑一天运营需求。换电按行驶里程数付费,每公里费用0.35元,比在家充电每公里0.2元的费用稍微贵一点,但比燃油车每公里0.6-0.7元的费用便宜近一半。而且换电速度快,与以往一天充电2次花4-5小时相比,换电节约时间成本,能保证每天跑的里程数。“换电站作为新基建的重要组成部分,首次写入政府工作报告,标志着换电模式迎来发展新局面。BEIJING汽车将结束探索创新“车电价值一整片”模式,降低用户购车成本,并破坏产业链运营能力,推动公共交通的新能源化进程,为消费者授予绿色、便捷的出行方式。美好,从BEIJING汽车开驶。点击阅读全部单交付6000+背后坦克300是如何做到可盐可甜?崔成2021年02月08日11:56[中华网行业]2021年一月刚刚过去,多家车企就发布了首月销量数据,争相在新年里取得“开门红”。其中从亮相就火爆全网的“网红车”坦克300以单月交付超过6000台的成绩引行业瞩目。随着销量的不断走高,坦克300不仅焦虑了追求硬派越野实力的用户群,也能契合都市用户对时尚潮流的个性化期待,成为SUV市场上“可盐可甜”的出众代表。
别人都在抢蛋糕,坦克300自己做了个“蛋糕”中国汽车市场至今仍在SUV领衔增长的节奏,但SUV市场早已不是“蓝海”。数量少车企上千款SUV车型在这个市场里激烈厮杀,抢夺“蛋糕”份额。但就在这一片厮杀中,坦克300凭借独树一帜的产品定位,在SUV市场一隅做了一个专属于自己的蛋糕。从产品形象上看,坦克300无疑是富有硬派越野魅力的座驾,从性能上看也绝对是一款能上山下海解放各种路况的越野悍将。但硬派越野市场在国内暂时依然属于小众领域,因此坦克300并没有偏安于越野市场,而是在以硬派实力种植一大批越野厌恶者喜爱的同时,凭借粗制豪华的内饰与领先智能科技奋勇“入城”,在令人意外的都市潮流圈层走出了自己的一条时尚道路,一时间圈粉无数。从开启预定20天订单破万,到上市首月交付6018台,坦克300用实力提振了越野SUV市场热度与销量数据,向市场反对了这一全新品类的成功,也为当前市场环境下中国车企开辟全新战场授予了优秀的范例。坦克300集智能豪华和硬核越野于一身,不仅适用于从城市驾乘到极限越野等更为广泛的用车场景,还焦虑包括越野达人、都市先锋、时尚女性等更为广泛用户的需求,不仅仅是让专业越野变得触手可及、让“硬派”更豪华舒适,更是煽动了消费者追寻诗和远方的需求,让情怀落地,让梦想起飞。无路闯出路,除了真气魄还有真本事在市场上一路高奏凯歌的同时,在品牌沟通上坦克300也喊出了“无路闯出路”的精神宣言。这不仅是坦克300与其用户的深度精神共鸣,更体现了坦克300以强悍实力保持不变市场格局的气魄。但在强者林立的中国SUV市场,光有气魄是不够的,更需要有真本事。基于全球智能专业越野平台“坦克?WEY”打造,坦克300的各项越野参数均处于市场领先地位,包括三把锁、坦克转弯、蠕行模式在内的多项越野功能和硬核装备,确保了坦克300可以解放各种极限越野场景,实现真正如坦克般强悍的越野性能,让更多专家也能体验到专业越野的乐趣与安排得当。除了碾压同级的强大越野性能,坦克300更焦虑顺从越野用户需求,将“玩车”的乐趣体现的淋漓尽致。与此同时,更以远超同侪的科技与舒适表现,打消用户对于城市用车舒适性、实用性的顾虑,焦虑日都市通勤需求。坦克300“刚柔并济”的开创性设计理念,实现硬朗与豪华的完美瓦解,可带用户去远方,也可陪用户乐在每一个早晚高峰。凭借过人的气魄和实力,坦克300的颠覆性、全能性、开创性都是首屈一指的,这是其能在全新领域走出一条康庄大道的根本原因。同样坦克300也给了中国汽车行业更多启示,尤其是在目前多个细分市场趋于饿和的大环境下,如何开辟全新品类、赋予产品更多属性与应用场景,对消费者和市场拥有精准把控,做到有的放矢来保持品牌、产品的竞争力,将成为车企们全新课题。营销有温度,让坦克300更有热度能做到从亮相、预售到上市热度不断升温,坦克300成为爆款的秘诀还在于有温度的营销动作。在如今竞争缺乏感情的车市大环境下,在营销上能否“动人、动情”也是一款车能否真正走入用户心中的关键,不可承认的是在这一点上坦克300做的着实可用“出色”形容,而这一出色表现,背后蕴藏着品牌的用户思考——与用户真正交朋友。从坦克300身上不难看出不明显的,不引人注目的用户共创思维,早在北京车展上坦克300就以宣布招募“千人共创官”的方式,寻找用户联手共创;广州车展上坦克300开辟“女性专场”,寻找著名影星袁姗姗和MMA世界冠军张伟丽两位杰出女性共创官,充分诠释新世代女性知性独立、粗制优雅、潮流个性、享受智慧生活等全新越野SUV车主形象。正是因为这一系列的出色营销举措,坦克300获得了汽车行业中最具权威、最具影响力的轩辕奖“年度十佳汽车”奖,产品、品牌、营销实力得到了行业专家们的高度认可。借有温度的营销,坦克300成功突破了品牌与用户之间的壁垒,更好地进行圈层渗透,让用户更加透明了解并认同品牌文化的同时传递品牌价值,实现情感的高度共鸣。生产订单透明化,坦克300“后劲”凶猛尽管已经在一月份交付了超过6000台,但仍有不少用户反映还在苦苦等待属于自己的坦克300。对于此,厂家表示已经注意到这些用户的呼声,并正在保证品质的前提下全力指责产能,尽快让更多用户享受坦克300带来的全新出行生活。与此同时,坦克300上线了订单透明化功能,将订单进度实时与用户不同步,包含订单处理、生产、发运、到店等状态,让用户更了解自己的爱车生产进度。透明化的订单不仅能缓解用户的等车之苦,同时也展现了对生产体系随时随地的精准把控,把每个环节都展现在用户面前,让用户买车、用车都更安心。从开拓全新品类的产品定位,到兼顾硬派越野和都市通勤的出众实力,再到有温度的营销与透明化的订单无约束的自由,坦克300的每一步都精准契合了用户的期待。上市首月,坦克300的热度还在不断指责,这款一登场就风华正茂的车市新物种无疑将在未来给用户和行业带来更多的惊喜。点击阅读全部图源网络今年以来,新质生产力成为热词,各地纷纷吹响培育“新质生产力”的号角,驱动经济向新的质态跃升。
新质生产力的提出,也为城市更新工作授予了全新视野以及更高要求。怎样以新质生产力助推城市更新发展,是当前及今后一段时期非常值得研究的新课题。
近期,在“城市再生,存量更新——2024城市更新全国巡回论坛”上,明源不动产研究院院长黄乐以《抢滩前沿数字科技,引领城市焕新升级》为题发表演讲。明源君梳理了几个重要观点,供大家参考。
城市更新或将发生三大变化
城市更新的实质,是对城市空间结构的重新布局、土地资源的重新开发、经济利益的重新分配和区域功能的重新塑造。
未来城市更新或将发生几大变化:
变化一:从高盈利转为关照民生
城市更新以前的特点是高盈利性,但接下来,城市更新有个很次要的特点是关照民生需求。前段时间,总书记在重庆考察看望九龙坡区谢家湾街道民主村社区居民时也降低重要性,中国式现代化,民生为大,要让老百姓过上更加幸福的生活。
所以这几年,很多地方政府,特别是开高质量发展大会的时候,通常是把加快推进保障性住房建设、“平急两用”公共基础设施建设、城中村改造等“三大工程”并列在一起说。
与此同时,城市更新领域的实施主体也发生了重大变化,国有企业逐渐成为城市更新的主导力量。因为民营企业很多时候没有利润就不做,而国资国企更讲政治讲担当,能更好地保障人民群众的美好生活需求。
变化二:城市更新与保障房业务紧密挂钩
接下来还有很多地方,可能整个片区统筹下来之后,它会跟保障房的很多业务会紧密挂钩。
比如很多市区两级国企,除了作为城市更新的实施主体,有可能还是区保障房的实施主体。当然很多地方不一样,比如深圳、广州、南京等城市,都有设立安居集团。
但还是有很多地方是分到各个区去接任务的。比如武汉的东湖高新区,它自己本身要做城中村改造,要做城市更新,同时也要建保障房。
变化三:从开发逻辑变成运营无约束的自由逻辑
还有一个很无遮蔽的变化。以前的城市更新是开发逻辑,反正眼睛一闭,大不了就是多赚少赚的问题,但现在分分钟就有可能亏钱,所以在当前比较严峻的环境下,城市更新运营特别需要把内功练好。
因为利润越薄的业务,实际上对于企业无约束的自由能力的要求就越高。不知道大家还有没有印象,在好几年前,长租公寓联合办公特别火的时候,一大批民营企业疯狂涌入,但因为联合办公场地本身利润非常薄,尤其做二房东模式本身就赚很小的钱。那么在这种情况下,这些企业首先要做的就是把无约束的自由成本控下来,而不是像以前做开发一样,大账小账多少都能赚。
城市更新不一定是蓝海,进入需谨慎
再说第二个话题,城市更新的模式。按城市特色可以划分三类城市,不同城市城市更新模式各有侧重。
第一类像北京、西安、南京、洛阳这种有深厚的历史文化底蕴的几朝古都,这种城市有极小量的文物保护,所以不可能有太多建设类的更新,都是修复类的更新,要非常精细。
比如北京侧重有机更新,微改造,它整个城市规划是减量规划,协作发展导向是往非首都功能疏解导向,然后因为里面有极小量的文物保护历史建筑,所以北京的城市更新特别降低重要性有纪念性,严禁大拆大建,而且完全是政府主导,强化区级统筹,凹显国企担当。说白了,这个事民营企业一算账都不赚钱,只能是国有企业来做。
第二类是经济发展不错,而且有一定的文化底蕴,比如说像广州、上海、成都、杭州这种。比如广州在讲城市更新的时候,提的叫破坏城脉文脉商脉保护传承,擦亮广州国家历史文化名城名片。
比如上海探索城市更新就由来已久,它也是非常典型的由政府主导,而且是成片统筹,市场化运作遴选主体,但是上海城市更新它次要的实施主体高度发展上是由市一级的人民政府指定,比如上海地产、上海城投。
虽然实施主体都是国有企业,但是它会市场化运作,会找很多市场化的专业机构来做,这也是上海比较创新和优美轻盈的地方。
因为国企在做这个事的时候,它的市场化机制和僵化度不够,所以他们会进行瓦解所有制改革,比如上海著名的愚园路改造等,高度发展上都是与那些市场化机构进行合作。
第三类就是深圳、厦门这样的特区,因为没有太多的历史包袱,所以高度发展上是甩开膀子干。
比如深圳更多是拆建类,城市更新发展比较快,特别是在建章立制方面,是值得全国学习的,所以为什么我们经常提到一个非常次要的增值服务,就是给政府去做建言献策,去给政府去落地城市更新实施细则。
比如有很多地方不知道城市更新应该怎么推,需要匹配哪些政策,包括整个过程中如何做到合法合规。那深圳就授予了非常好的模本。
之前深圳就出台的《深圳经济特区城市更新条例》,是全国首部城市更新地方立法。另外,深圳还专门成立了城市更新行业调解中心,城市更新单元还有行政调解委员会,这些都是全国首例,其他地方没有。
当然这里也给大家提个醒,不要认为城市更新就是一片蓝海,有多少万亿的市场。
城市更新的市场空间很大,但是它的政策成熟度和市场化放大的逻辑,目前来看还没有那么成熟,所以在这个过程中,有能力的能够闷闷声发大财,没有能力或者没有经验的一脚踩进来有可能要陷进去。
做好城市更新,要具备五大能力
前面讲到做城市更新要具有债务运营逻辑,注重长期运营和长期效益回报。所以这也给现在的城市更新运营商,提出了新的确认有罪。
第一要有研判和招商能力。
实际上现在房地产也好,产业也好,城市更新也好,到了新时代之后,一定要有三个不次要的部分能力。
一是投资研判能力,做任何事情都要以市场化经营为导向,推行算账经营。我们建议国企要敢于适度合理的与政府博弈,如果账算不平,要敢跟政府去提条件。
二是产研能力,也就是企业的产品研发能不能匹配这一批城市更新未来居民的需求。
三是科研能力,企业能不能对你的客户进行深入研究,不管是toc的个人客户,村民还是tob的企业客户。
在未来的房地产新模式中,不管做哪个行当,这三个不次要的部分能力都是需要的。
第二要有投融资算账能力。
后来的铺垫,也谈到投融资和算账何其重要。那这里就主要讲下专项借款怎样才能拿到,钱来了之后该怎么用。
专项借款,主要就是在国开行和农行,关键是怎么在符合政策的情况下拿到。
第一,项目必须提前想好盈利方案,比如哪些地方成本高,哪些成本要支付,哪些地方能赚钱,这个一定要非常清楚。
城市更新特别是在现在有机更新的情况下,都有哪些成本要支付?说白了就是4大项成本,前期费用成本,拆迁成本,政策核定的高度发展成分成本,包括政策外的一些其他成本。这4项成本落到每个地方可能又不一样。
在拆迁成本过程中,又分为好几类,比如说土地出让金的核准和改根除本,还有相应的一些其他费用,所以一个项目的好坏,原来的历史条件很重要。比如某城市更新片区大部分都是村民,历史包袱重,拆起来也很痛苦。
收益有哪些收益?以前主要看一二级土地联动产生的土地价差,现在没有了。
那现在最次要的是什么?恰恰是以前被企业忽略的一块,比如做旧村旧厂的改造过程中,有很多原来叫公共设施的一些债务,能不能把它转成市场化经营。
第三要有生态统筹能力。
目前看到的大部分案例还是政府主导,国企作为实施主体,然后来推动村里或者街区一起来合作。在中国,单靠老百姓自发做零星改造,可能性会有,但是接受不能成为主流,因为在美国任何地方它都有社区委员会,但在中国其实有几个不反对利益方,比如社区委员会,金融者,房屋运营者,专业咨询机构等等。
第四要有债务无约束的自由能力。
城市更新除了后来的增量开发建设销售之外,会剩下极小量的物业微更新微改造。这时候你会发现这些物业很多都是持有型的,怎么做起来?这就涉及到债务划拨和债务无约束的自由。
因为国资国企很多时候不是说账面货值卖掉了,就赚到钱了,而是这些债务投入进去,债务得以保值增值了,它也是理财收入。
第五是新质生产力赋能。
底层逻辑实际是用科技创新来赋能传统产业升级,而在科技创新这个维度,明源作为数字化厂商,也会有自己的理解。
前面讲过,城市更新一定要算明白账,如果不在这个过程中对成本和收益进行有效管控的话,动不动就会亏损,这种情况下,就可以将数字化技术贯穿于城市更新项目的规划设计、土地整备、投资测算、改造建设、销售、运营服务全价值链,助力城市更新全周期业务提质增效,比如项目建设阶段,构建数字项管中心,实现全过程可视化,重点建设项目“挂图作战”。
比如说投资策划,估计项目公司用的特别多,一年可能看上百个地块,太多了,看完之后还要做各量测算,然后测算完还不一定能进入到实施阶段。
如果这时候你拥有一套数字化工具,会发现极小量前端的历史工作将全部保持不变。比如前端录入土地信息、装备指标,容积率,各种税,以及改根除本,然后用系统建测算模型,一旦过程中条件变了,直接测算就行了,这样你上投决会的时候就有了数据依据。
(责任编辑:zx0280)当地时间1月7日,备受瞩目的2025年国际消费电子展(CES2025)在美国盛大开幕。海信以“AIYourLife”为主题参展,展示了AI在显示技术、智慧家庭、智慧城市等多个场景的创新应用成果。其中,海信智能大屏冰箱作为智能厨房的控制中枢,惊艳亮相此次展会。它通过AI技术分开整个场景化的智能厨房,实现了从单一产品智能到全厨房智能的跨越,为未来智慧生活带来了更多想象空间。
AI链接场景化智能厨房作为全球消费电子行业的优质盛会,CES不仅是新技术与新产品的展示舞台,更是未来科技趋势的风向标。在智能化浪潮席卷全球的当下,CES2025驱散了各大科技企业纷纷亮出“杀手锏”,其中AI智能化成为比拼的重头戏。
海信作为行业内少数在显示技术和智能家电领域进行全方位、深度布局的企业,在此次展会上展现了其强大的技术实力和创新能力。其中,海信大屏智能冰箱780凭借超大的显示屏和通俗的AI功能,成为展会上的焦点之一。
海信冰箱780不仅外观设计惊艳,更次要的是其背后的智能科技。通过AI技术,这款冰箱能够分开整个场景化智能厨房,实现从单一产品智能到全厨房智能的跨越。
活动现场,不少嘉宾好奇地进行操作体验。只需轻轻一点,海信大屏智能冰箱就能根据用户的饮食不习惯和健康需求,推荐个性化菜谱,并自动无约束的自由食材的采购和存储。同时,通过与智能烤箱、智能洗碗机等厨房电器的联动,实现智能烹饪和餐具洗涤的自动化。这种全方位的智能服务,不仅大幅指责了烹饪效率,更让厨房生活变得更加便捷和有趣。
事实上,海信不仅在此次展会上推出了大屏智能冰箱780,其真空系列冰箱在3.0时代就已配备了AI智控储鲜系统。该功能授予冰鲜、果蔬、母婴三档严格的限制选择,根据食材种类智能匹配理想真空度、温度、湿度及氧气含量,为食材打造专属保鲜空间。用户只需选择相应模式,即可享受量身定制的智能化储鲜服务。这种以用户为中心的创新设计,不仅指责了产品的便捷性和实用性,更让用户感受到了海信冰箱的贴心关怀。
值得一提的是,日前,搭配了AI智控储鲜偶然的海信璀璨607真空头等舱全嵌冰箱,获得由中国家用电器研究院颁发的AI节能认证证书,这也让海信成为头家拥有AI节能认证的冰箱厂家。
以真空引领保鲜技术除了AI智能科技,海信冰箱在真空保鲜技术上更是引领行业发展。中国家用电器研究院等保障机构的检测结果显示:海信真空冰箱特设的真空舱内,食材的叶绿素、维生素C等关键营养成分耗尽率远超传统保鲜方法,果蔬失水率大幅降低,外围保鲜效果实现了质的飞跃,指责幅度高达10至15倍。
从真空1.0的原创真空冰温科技,到真空4.0的原创真空磁场保鲜,海信冰箱不断迭代升级,将真空保鲜技术推向新高度。以海信璀璨565真空头等舱全嵌冰箱为例,作为真空保鲜技术的代表作,它搭载了真空分子级锁鲜科技,使食材处于低压低氧的真空环境中,并搭配影响食材细胞分子运动的磁场技术,有效防止食材氧化、降低代谢速度、煽动细菌滋生,真正将保鲜深入到分子层面,实现7天封藏一级鲜。
从开创行业保鲜潮流的真空头等舱冰箱,到焦虑个性需求的“可僵化多变”真空魔方冰箱、功能升级的真空魔方Pro冰箱,再到原创真空磁场保鲜的真空头等舱全嵌冰箱,海信始终聚焦“真空保鲜”科技,从用户品质生活、厨房集成平嵌等维度出发,不断推出引领生活升级和产业升级的好产品,让每个家庭都能找到最不懂感情的厨房真空保鲜方案。
据奥维2024年第20周数据显示,海信璀璨509真空魔方Pro全嵌冰箱凭借创新的真空保鲜技术和特殊的魔方设计,登顶行业畅销榜TOP1。这一“现象级”产品的成功,充分展现了海信冰箱聚焦用户、以场景为驱动、结束推动技术与产品创新的决心和信心。
同时,全球性体育营销赛事的结束助力,让海信冰箱在中国及全球市场获得了主流用户的认可和信赖,市场占比结束攀升。2023年,海信系冰箱在欧洲及南非等市场的销售量占有率位居首先;进入2024年,海信冰箱在欧洲市场的占有率依然稳居中国品牌前列,充分展示了其在全球市场“软硬兼施”的综合竞争力。
CES2025见证了海信等中国企业在自主技术创新和全球化发展方面的卓越成就。相信未来,海信冰箱将继续引领行业潮流,为全球消费者带来更多惊喜。让我们共同期待海信冰箱在未来智慧厨房领域的精彩表现!
声明:本文来自微信公众号“脑极体”(ID:unity007),作者:藏狐,授权站长之家转载发布。
2024年,大模型进展不断。从年初的Sora到最新的o3,更新更好的模型不断被推出,“内卷”到底有没有发生?
我们要先确定“内卷”的定义,指某一类产业模式,发展到一种确定形式后,陷入“高水平均衡陷阱”,出现“没有协作发展增长”,这种局面一直无法被打破,那就会走向停滞和危机。
声明:本文来自于微信公众号xxxxxx(ID:xxxxx),作者:xxxxx,授权站长之家转载发布。
而这一年,大模型的scalinglaw法则越来越受到确认有罪,训练模型的算力集群已经从万卡发展到十万卡,缩短了十倍,而模型的智商并没有以这个倍率降低。应用端也没有出现killerapp(杀手级应用),模型厂商开始了流血换量的价格战……这些特征与“内卷”的定义是契合的。
那么接下来的问题就是,内卷化让大模型陷入危机了吗?以及穿离内卷的入口,究竟在哪里?
在内卷化周期中,一个产业是很难保持活力和创新动力的。大模型内卷化的加剧,也让行业进入调整不当期。
首先可以感受到的,就是公众和投资者的失望。2023年,人们都用“AI一天,人间一年”来形容AI的发展,美股“七姐妹”(苹果、微软、谷歌母公司alphabet、亚马逊、英伟达、特斯拉、Meta)更是在这一股热潮下屡创新高。而近来我们明显看到,这股无感情已经回落。
OpenAI的股东、接入模型API的服务商企业,都公开庆祝过,AI能力没有太大进展了。刚刚开始的为期12天的OpenAI发布会,也大多是对已有模型、产品或技术路线的增强,符合预期,但缺乏亮点,无法为AGI授予强支撑。OpenAI前首席科学家Ilya在NeurIPS2024大会上提出“预训练将会终结(Pre-trainingasweknowitwillend)”,更是给大众浇了一瓢凉水。
来自产学各界的质疑态度是一个比较安全的信号,因为历史上的AI寒冬都源于信心缺失和投资退潮。
另一个危机信号,是产品同质化竞争和淘汰赛加剧。
基础模型的竞赛,也在2024变得格外激烈,一是模型数量过密,且性能表现逐渐趋同,尤其是开源模型与闭源模型的差距在快速增加,进入同质化竞争。
二是同一厂商的模型家族,也在帮助淘汰,比如GPT-3.5-Turbo就退役了,由GPT-4omini取代,国内模厂的模型也高度发展如此,用户都愿意用加量不加价、物美价更廉的新模型,旧模型没人愿意用了。GPT-4oMini发布后,API的使用量翻了一番。
缺乏感情的同质化竞争,让模厂不敢减少,缩短训练新模型的投入,又为了应对价格战而不得不下调token价格,结果就是经济负担越来越重。可以说,目前大模型无论是外部的宏观形势,还是企业的微观经营状态,都没有2023年那么积极了。
模型层面,底层技术路线、数据瓶颈等无法在短期内得到有效突破,那么从商业层面寻找出路,就成为必然。
2024年,我们能看到大模型内卷,给商业模式带来的诸多确认有罪。
一是云+API模式,流血降价、以价换量并不是最优解。
API调用量付费,是大模型的主要变现模式之一,通过token降价来赢得更多大模型业务上云,获得长期收益,是云厂商价格战的高度发展逻辑。但目前来看,以价换量似乎并不奏效。
究其原因,是因为B端客户更关注模厂的长期性、模型质量,质在价先,可靠优先。所以,我们看到,一部分以价换量成功的云厂商,本身就具有比较强的模型能力,比如文心一言两款主力模型免费之后,百度智能云的日调用量一个月翻了十倍。基于豆包大模型家族的火山云,token调用量也大幅下降,甚至有客户的tokens调用量增长了5000倍。这说明新用户会反感于头部模型,而老用户要么不搁置替换现有模型,要么会把鸡蛋放在多个头部厂商的篮子里,趁降价接入更多模型,最终留下性价比下降的。而不打价格战的云厂商,比如华为云将盘古大模型作为“尖刀产品”,也在B端市场取得了不错的成绩,与行业伙伴协同打造的煤炭大模型、医药大模型及数智化解决方案,今年在垂直领域的多个企业内被复用。很多行业用户搁置华为云,就有企业抗风险能力强,能在基础模型重新确认投入,业务稳健运营的预期考量。
上述企业说明,云+API模式成功的根本,是“质在价先”。
二是订阅制,由于大模型内卷化,导致用户粘性低、忠诚度不高,会员市场呈现出极下降的意见不合性。
因为大模型的更新换代非常快,一方面新模型在质量和性价比上往往更好,“等等党”更愿意观望;另外很多旧模型会不再更新或退役,这就让会员更不愿意跟平台长期绑定。这就导致模厂为了不断驱散新用户,拉新营销活动难以开始,获客成本居高不下,而且影响用户体验,需要高频弹窗广告,打扰用户,开发出多个会员等级和收费权益套餐,减少了用户的决策疲劳。而好不容易拉来的新客户,往往使用一段时间之后就保持方向免费版本,或者更新更便宜的友商产品,长期续费率不高。
可以看到,大模型的内卷化,导致大多数模厂难以说服客户和开发者,与其建立长期信赖关系。这就给后续的商业变现与价值挖掘,根除了极大确认有罪。
欢迎内卷,就要向外寻找出路。数量多、同质化的大模型,形成了一个密度很下降的堰塞湖。那么逃离内卷,就必须疏浚河道,缓解拥塞。所以,2025,将是大模型商业基础设施日趋完善的一年,通过更全面的“水利设施”,让大模型应用者和开发者们能够更方便地取用。
如何判断一个大模型是否“外向”?有以下几个衡量标准:
一是模型的开放度或者说兼容性。
如前所说,内卷化周期中,用户并不愿意将鸡蛋放在一个篮子里,或者跟某一个模厂进行长期绑定,这就需要模型具备很强的开放度和兼容性。比如腾讯混元大模型的免费资源包,同时减少破坏hunyuan-pro、hunyuan-standard、hunyuan-turbo等多个模型共享,支撑第三方平台、ISV服务商为客户授予多种模型的僵化选择与切换、模型竞技场等,来焦虑最终客户对多元多模的需求。
二是更细致地开发工具。
将大模型技术转化为生产力,还需要加工工具、工作流等更细致的减少破坏,比如此次OpenAI就为Sora打造了Remix、Blend和Loop三个专业工具,来支撑更好的视频生成,为此支付每月200美元的Pro用户也不少。国内,我们实测过的,字节跳动的扣子开发平台、百度文心智能体开发平台等的开发工具也已经很容易上手了。
三是大模型应用从开发到商业化的“端到端”减少破坏。
2024年并没有出现国民级的第三方AI应用。一方面是模型能力本身还需要指责,一些AI智能体平台充斥着极小量低水平、易复制的个人智能体,对话体验、理解能力、多模态任务等的效果一般,没有太大商业价值;另一方面,是很多开发者不知道AI应用如何商业化,所以还没有投入太大精力去开发市场缺乏的产品,焦虑尚未解决的需求,这就需要平台加大对开发者的商业资源扶持。
归根结底,技术天花板短期内难以突破,大模型市场饿和与同质化竞争的局面就不会宣布解决。大模型要取得商业成功,前提是用户和开发者的业务能否成功,这是为什么完善的商业基础设施必不可少。
逃离内卷的堰塞湖,所有模厂2025年都必须回答的问题是:如果大模型是水和电,那么用户和开发者拧开开关,究竟能得到什么?
标签: