-
日期: 2026-03-24 | 來源: APPSO | 有0人參與評論 | 字體: 小 中 大

本文來自微信公眾號: APPSO ,作者:正在發出文令的
2012年,張壹鳴給新公司取名,用了壹個計算機術語做名字——字節。
這大概是中國科技公司裡最讓人服氣的壹個名字。兩個字,有技術感,有力量感,認知成本幾乎為零。你不需要懂計算機,只需要認中文,就知道“字節”說的是某種文字層面的基本單位。
幹淨、准確、過目不忘。能拿壹個術語做公司名且毫無違和感,這本身就說明這個詞翻譯得有多好。
現在,“字節跳動”成了全球價值最高的獨角獸公司。但要是問你:如果當年那家公司叫“存儲單位跳動”,你還覺得那麼自然嗎?
別笑,這就是最近AI行業在發生的事。
別吵了,Token最好的中文翻譯壹直在那兒
上周大家對於Token該翻譯成生什麼吵翻天“模元”“智元”“靈符”“令牌”“偷啃”……社交媒體隔段時間就會掀起壹輪爭論,每次都以各說各話收場。
這些候選詞各有各的巧思,但放在壹起看,你會發現:大家都在比誰更有靈氣、更有意境,卻沒人先問壹個最根本的問題——Token在技術上到底是什麼?
它不是“智能”的單位,不是“模型”的單位,它是語言處理的最小單位。
“靈符”有東方賽博美感,但術語不需要意境,它需要精確。
“智元”大氣,但Token是語言的處理單位,不是“智能”的單位,往上貼“智”字是貼錯了標簽。
“令牌”最離譜,這是Token在計算機安全領域的既有譯法,特指身份驗證憑證,拿來混用等於把銀行卡和撲克牌叫同壹個名字。
“偷啃”這種音譯就完全喪失了中文的優勢了。
其實在這場混戰之前,答案早就在那裡了。
在自然語言處理(NLP)學術文獻裡,Token作為文本的最小處理單位,長期被譯為“詞元”。
詞,指向語言屬性;元,指向最小粒度。兩個字,壹個管歸屬,壹個管層級。
蘋果就采用了這個譯法。打開Apple中國官網,產品詳情頁寫著“詞元響應速度”。
要知道蘋果的中文本地化團隊是出了名的較真——AirDrop叫“隔空投送”,Live Text叫“實況文本”,每個詞都是反復推敲的結果,目標只有壹個:准確、簡潔、有造詞美感。
蘋果選了“詞元”,絕不是心血來潮。無獨有偶,在央視新聞節目裡,Token同樣被譯作詞元。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見