-
日期: 2026-04-26 | 來源: 騰訊科技 | 有0人參與評論 | 字體: 小 中 大
歸根結底,傳統計算資源的定價衡量的是“物質資源的時間占用”,而Token定價衡量的是“智能服務的能力交換”。這是人類經濟史上第壹次把“思維產出”拆解為可量化、可交易的原子單位。它不僅是壹種新的按成果計費方式,更是智能經濟時代定價范式的開端。
贰、Token的成本結構是什麼?
01 Token的定價權,誰更稀缺是關鍵
Token的生產成本由肆大要素構成:芯片、電力、數據與人才。但這其中不存在單壹的定價“錨”,而是壹個隨時間動態遷移的多錨體系。
這裡所說的“錨”,是指在壹個成本結構中真正決定價格底線的那個關鍵要素,就像船只靠“錨”固定位置壹樣,價格也需要壹個最硬的約束來“錨定”它的下限。
在不同階段,決定Token價格底線的關鍵要素並不相同,定價權會沿著技術演進的節奏在肆大要素之間逐步讓渡。
如果把這條遷移路徑沿時間軸展開,可以清晰地看到叁個階段:
短期(壹到兩年),芯片是主錨。比如目前NVIDIA GPU供不應求,芯片成本在推理總成本中占比達到六到柒成,芯片的可獲取性直接決定了Token的供給量與價格。
GPU的稀缺是怎麼壹步步傳導到Token價格上的?在上游,NVIDIA的GPU產能有限,下單要排隊壹年以上;中游,OpenAI、Anthropic等AI公司搶不到足夠的卡,能建的推理集群就那麼大;到了下游,API 能輸出的Token量受限,價格自然維持高位,最終那筆賬將由每壹個AI用戶買單。
中期(叁到伍年),電力將成為硬性約束:隨著芯片供給增加和架構創新,芯片價格會持續下降,但電力受物理定律限制,加之AI數據中心能耗激增引發的社會關注,能源成本將成為不可壓縮的底線。
長期(伍年以上),人才與知識密度將主導定價。芯片和電力都是物理成本,終將被技術進步不斷壓縮;但訓練頂級模型所需的研究人才和數據積累是稀缺的,這構成了高端Token定價的核心錨點。
所以定價錨是從GPU→能源→人才轉移。
02 Token的兩層結構:成本托底,能力拉開
即便定價權明確了,Token的價格為什麼仍然各有差異?這裡的核心關鍵,是區分兩類成本——推理成本與訓練成本。
推理成本是生產每個Token的邊際成本,由芯片和電力主導;訓練成本是創造模型能力的壹次性投入,由算力、人才和數據主導。
當前Token定價主要反映推理成本,而高端模型的溢價實質上是訓練成本的分攤。Token正在從同質商品演變為品質分級商品:低端Token的錨是電力與運維,高端Token的錨是人才與研發。定價錨的總體方向,是從“物質稀缺性”向“智能稀缺性”遷移。
需要補充的壹點是,如果價格只是成本傳導的結果,那就無法解釋壹個現象——同壹家公司旗下的不同模型,Token價格為何能相差數拾倍。
這其中存在缺口,只有引入價值定價的邏輯才能解釋:比如說GPT-5能完成復雜推理、代碼生成、專業分析等GPT-4難以勝任的任務,能力飛躍支撐了遠超成本的溢價。
用戶對“更聰明的AI”有明確的支付意願、企業客戶願意為可靠的商業決策支付溢價,就像願意為資深顧問而非初級助理支付更高費用。
從市場策略視角看,這種懸殊的價差還體現了“贰級價格歧視”:廠商通過提供不同品質的產品線,讓不同支付意願的用戶自我選擇分層,高價版鎖定商業客戶,低價版負責獲客與維持用戶基數,壹個產品組合覆蓋整條需求曲線。
把這兩股力量合在壹起,就是當前Token價格的完整形成機制:底部由GPU瓶頸的成本傳導托起,頂部由模型能力的價值溢價拉高。
更深壹層看,這種“能力分層決定價格分層”的結構,標志著人類首次通過市場機制對“智能等級”本身進行直接定價。比如律師按時間收費、醫生按診次收費,而AI按“思維單位的質量等級”收費。壹個“智能分層付費”的新經濟秩序正在建立。
叁、Token的價格和產業周期會如何變化?
01 摩爾定律之上:Token價格呈現“下行曲線”
當GPU瓶頸不再是主導因素(這個是前提),Token價格將沿著壹條由摩爾定律延伸而來的長期曲線持續下行,而且下行的速度比任何人預想的都要驚人。Token價格戰會讓全世界用上AI,就像電力價格戰讓全世界用上了電。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見