-
_NEWSDATE: 2026-04-26 | News by: 腾讯科技 | 有0人参与评论 | _FONTSIZE: _FONT_SMALL _FONT_MEDIUM _FONT_LARGE
归根结底,传统计算资源的定价衡量的是“物质资源的时间占用”,而Token定价衡量的是“智能服务的能力交换”。这是人类经济史上第一次把“思维产出”拆解为可量化、可交易的原子单位。它不仅是一种新的按成果计费方式,更是智能经济时代定价范式的开端。
二、Token的成本结构是什么?
01 Token的定价权,谁更稀缺是关键
Token的生产成本由四大要素构成:芯片、电力、数据与人才。但这其中不存在单一的定价“锚”,而是一个随时间动态迁移的多锚体系。
这里所说的“锚”,是指在一个成本结构中真正决定价格底线的那个关键要素,就像船只靠“锚”固定位置一样,价格也需要一个最硬的约束来“锚定”它的下限。
在不同阶段,决定Token价格底线的关键要素并不相同,定价权会沿着技术演进的节奏在四大要素之间逐步让渡。
如果把这条迁移路径沿时间轴展开,可以清晰地看到三个阶段:
短期(一到两年),芯片是主锚。比如目前NVIDIA GPU供不应求,芯片成本在推理总成本中占比达到六到七成,芯片的可获取性直接决定了Token的供给量与价格。
GPU的稀缺是怎么一步步传导到Token价格上的?在上游,NVIDIA的GPU产能有限,下单要排队一年以上;中游,OpenAI、Anthropic等AI公司抢不到足够的卡,能建的推理集群就那么大;到了下游,API 能输出的Token量受限,价格自然维持高位,最终那笔账将由每一个AI用户买单。
中期(三到五年),电力将成为硬性约束:随着芯片供给增加和架构创新,芯片价格会持续下降,但电力受物理定律限制,加之AI数据中心能耗激增引发的社会关注,能源成本将成为不可压缩的底线。
长期(五年以上),人才与知识密度将主导定价。芯片和电力都是物理成本,终将被技术进步不断压缩;但训练顶级模型所需的研究人才和数据积累是稀缺的,这构成了高端Token定价的核心锚点。
所以定价锚是从GPU→能源→人才转移。
02 Token的两层结构:成本托底,能力拉开
即便定价权明确了,Token的价格为什么仍然各有差异?这里的核心关键,是区分两类成本——推理成本与训练成本。
推理成本是生产每个Token的边际成本,由芯片和电力主导;训练成本是创造模型能力的一次性投入,由算力、人才和数据主导。
当前Token定价主要反映推理成本,而高端模型的溢价实质上是训练成本的分摊。Token正在从同质商品演变为品质分级商品:低端Token的锚是电力与运维,高端Token的锚是人才与研发。定价锚的总体方向,是从“物质稀缺性”向“智能稀缺性”迁移。
需要补充的一点是,如果价格只是成本传导的结果,那就无法解释一个现象——同一家公司旗下的不同模型,Token价格为何能相差数十倍。
这其中存在缺口,只有引入价值定价的逻辑才能解释:比如说GPT-5能完成复杂推理、代码生成、专业分析等GPT-4难以胜任的任务,能力飞跃支撑了远超成本的溢价。
用户对“更聪明的AI”有明确的支付意愿、企业客户愿意为可靠的商业决策支付溢价,就像愿意为资深顾问而非初级助理支付更高费用。
从市场策略视角看,这种悬殊的价差还体现了“二级价格歧视”:厂商通过提供不同品质的产品线,让不同支付意愿的用户自我选择分层,高价版锁定商业客户,低价版负责获客与维持用户基数,一个产品组合覆盖整条需求曲线。
把这两股力量合在一起,就是当前Token价格的完整形成机制:底部由GPU瓶颈的成本传导托起,顶部由模型能力的价值溢价拉高。
更深一层看,这种“能力分层决定价格分层”的结构,标志着人类首次通过市场机制对“智能等级”本身进行直接定价。比如律师按时间收费、医生按诊次收费,而AI按“思维单位的质量等级”收费。一个“智能分层付费”的新经济秩序正在建立。
三、Token的价格和产业周期会如何变化?
01 摩尔定律之上:Token价格呈现“下行曲线”
当GPU瓶颈不再是主导因素(这个是前提),Token价格将沿着一条由摩尔定律延伸而来的长期曲线持续下行,而且下行的速度比任何人预想的都要惊人。Token价格战会让全世界用上AI,就像电力价格战让全世界用上了电。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见