-
日期: 2026-04-29 | 來源: 人民報 | 有0人參與評論 | 字體: 小 中 大
2025年初,中國 AI 公司 DeepSeek 憑借 R1 模型迅速打開國際知名度,壹度引發美國科技與政界對中國 AI 追趕速度的高度關注。
然而,壹年多後,當 DeepSeek 於上周推出新壹代旗艦模型 DeepSeek V4 預覽版時,市場反應卻遠不如外界預期。 原先被部分中國媒體形容為“再次震撼全球 AI 產業”的新模型,最終並未展現足以改變全球 AI 格局的突破性能力。
相反,DeepSeek V4 的表現,更反映出中國 AI 產業在美國高端芯片限制、算力不足,以及原創能力受限等壓力下,逐漸走向“低成本追趕”與“技術蒸餾”的發展模式。壹、技術現實:中國 AI 與美國頂尖模型仍存在明顯差距DeepSeek 此次推出的 V4 系列,包含擁有 1.6 兆參數的 V4-Pro 以及主打輕量化的 V4-Flash。
官方宣稱,新模型在程式生成、推理能力與 Agent(代理型 AI 任務)方面取得重大提升,但多家第叁方測試機構與開發者社群的實際評價,則顯得相對保留。1. 核心能力仍落後美國第壹梯隊 在多項軟體工程與推理測試中,DeepSeek V4 雖然已接近部分美國主流模型先前水准,但與 OpenAI、Google 等公司最新壹代大型模型相比,仍可看出差距。 尤其在復雜推理、多步驟邏輯處理、長文本穩定性,以及高階 Agent 任務上,V4 的表現仍不夠穩定。部分測試者指出,模型在面對模糊指令與高復雜度問題時,仍容易出現推理斷裂、重復輸出或內容失焦等情況。
這也反映出,中國目前最先進的大模型,雖然已能在部分標准化測試接近美國產品,但在真正代表前沿能力的通用推理與創造性任務上,仍未追上美國第壹梯隊。2. “冗長輸出”暴露模型精煉度不足部分 AI 評測機構也指出,DeepSeek V4 存在明顯的“高冗長度”現象。
簡單來說,模型往往透過大量文字鋪陳來提高命中率,而非以更精准、更高效的推理方式直接完成任務。這種現象在大型模型領域,通常被視為底層推理架構與訓練品質尚未完全成熟的表現。 雖然這類模型在部分考試型測試中可能取得不錯分數,但在真實世界應用中,過度冗長不僅增加運算成本,也容易降低實用性與可靠性。
贰、 “技術蒸餾”爭議:中國 AI 的敏感灰色地帶DeepSeek 能夠在短時間內、以極低預算開發出高性能模型,也讓外界持續關注其訓練方式。 近年來,美國 AI 產業與政府部門多次警告,中共國部分 AI 公司可能透過大規模調用美國模型輸出結果,再進行“知識蒸餾”(Knowledge Distillation)訓練,以低成本模仿美國模型的推理能力。
所謂“知識蒸餾”,原本是 AI 領域常見的技術手段,但若涉及未經授權、大規模抓取商業模型輸出內容,便可能牽涉智慧財產權、服務條款與商業倫理問題。1. 2.4 萬個假帳號背後的數據竊取疑雲根據 OpenAI 與 Anthropic 向美國眾議院提交的證詞,DeepSeek 及其關聯實體被指控動員大規模“數位民兵”,借助逾 2.4 萬個虛假帳號及復雜的身份規避手段,對美國頂尖 AI 系統發動工業級數據收割行動。
據稱,相關人員透過數以千萬計的對話,系統性地萃取 GPT 系列與 Claude 模型的推理邏輯、思維鏈路(Chain-of-Thought)以及對復雜任務的應對模式。2. “搭便車”式躍進:創新還是鏡像? 這意味著,DeepSeek 的技術路徑,在相當程度上並非奠基於底層算法的原創突破,而更像是對美國研究成果的高度系統性挪用。
矽谷業界人士毫不諱言:DeepSeek 並非在自主研發 AI,而是在“鏡像復制”美國 AI 的核心能力。這種依附式的研發路徑,或許能帶來短期的性能躍升,卻難以積累真正從零到壹的原創實力。壹旦美國各大模型強化訪問管控,中方 AI 的進步動能恐將迅速消退。
叁、 硬體限制下的技術選擇:國產替代與現實落差在美國對高階 AI 芯片(如 Nvidia Blackwell 與 H200)出口限制持續收緊的背景下,DeepSeek V4 被認為轉向以華為升騰(Ascend)系列為核心的運算平台。這壹策略在中共官方語境中被視為“自主可控”,但也引發外界對其技術代價的討論。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見