-
日期: 2025-03-22 | 來源: 經濟日報 | 有0人參與評論 | 專欄: 騰訊 | 字體: 小 中 大
騰訊宣布推出自研深度思考模型“混元T1”正式版,並同步在騰訊雲官網上線。 輸入價格為每百萬tokens人民幣1元(新台幣4.5元),輸出價格為每百萬tokens人民幣4元(新台幣18元)。 輸入價格與行業差距不大,但輸出價格為DeepSeek-R1標准時段的肆分之壹,顯然沖著DeepSeek而來。
每日經濟新聞報道,該模型以騰訊於3月初發布的“混元Turbo S”為基礎打造,是壹款能秒回、吐字快、擅長超長文處理的強推理模型。
在體現推理模型基礎能力的常見指標方面,例如大語言模型評估增強數據集MMLU-PRO中,混元T1取得87.2分,僅次於OpenAI o1。 在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基准測試中,混元T1的成績也達到業界領先推理模型的水平。
透過大規模強化學習並結合專項優化,混元T1正式版進壹步提升了推理能力。 與先前已上線騰訊元寶的“混元T1-preview”模型相比,綜合效果明顯提升。
混元T1正式版沿用混元Turbo S的創新架構,采用Hybrid-Mamba-Transformer融合模式。 這是工業界首次將混合Mamba架構無損應用於超大型推理模型。
今年以來,騰訊混元大模型持續快速迭代,AI似乎已成為騰訊內部最大的驅動力。 騰訊推出深度思考模型T1 Preview和快思考模型Turbo S,並已廣泛應用於騰訊元寶、ima、騰訊文檔、微信讀書、搜狗輸入法、QQ瀏覽器等多款內部產品。 騰訊混元積極擁抱開源,開源模型全面覆蓋文本、圖像、影片和3D生成等多個模態。
業內認為,這壹戰略選擇的背後,壹方面基於騰訊長期以來堅持技術普惠的理念,另壹方面也得益於騰訊在用戶與產業多端的場景與生態優勢,為AI技術的落地提供了廣闊空間。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見