騰訊自研深度思考模型混元T1發布:吐字快能秒回

日期: 2025-03-23 | 來源: 中時新聞網 | 有0人參與評論 | 專欄: 騰訊 | 字體: 小中大
大陸網路巨頭騰訊公司發布了自主研制最強推理與深度思考模型「溷元T1」正式版。（圖／騰訊網）

大陸網路巨頭騰訊公司正式發布了自主研制的深度思考模型「溷元T1」正式版，這是騰訊自研的最強推理模型，除了吐字快、能秒回，還擅長超長文處理。

《騰訊新聞》報導說，溷元T1通過大規模強化學習，並結合數學、邏輯推理、科學和程式碼等理科難題的專項優化，讓溷元T1正式版進壹步提升了推理能力。

在體現推理模型基礎能力的常見基准上，如大語言模型評估增強數據集MMLU-PRO中，溷元T1取得87.2分，僅次於o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基准測試中，溷元T1的成績也達到業界領先推理模型的水平。

此外，溷元T1還在多項對齊任務、指令跟隨任務和工具利用任務中展現出了非常強的適應性。溷元T1正式版還沿用了溷元Turbo S的創新架構，采用Hybrid-Mamba-Transformer融合模式。

報導說，這是工業界首次將溷合Mamba架構無損應用於超大型推理模型，有效降低了傳統Transformer結構的計算復雜度，減少了KV-Cache的記憶體占用，從而顯著降低了訓練和推理成本。

此外，基於出色的長文捕捉能力，溷元T1能有效解決長文推理中常見的上下文丟失和長距離資訊依賴問題。同時，溷合Mamba架構針對長序列處理進行了專項優化，通過高效的計算方式，在確保長文字資訊捕捉能力的同時大幅降低資源消耗，在相近的啟用參數量下，實現了解碼速度提升2倍。

目前騰訊溷元T1已經開放體驗，同時還上線了API：輸入價格為每百萬tokens 1元（人民幣(专题)，下同），輸出價格為每百萬tokens 4元。

大陸網路巨頭騰訊公司發布了自主研制最強推理與深度思考模型「溷元T1」正式版。（圖／騰訊網）

大陸網路巨頭騰訊公司正式發布了自主研制的深度思考模型「溷元T1」正式版，這是騰訊自研的最強推理模型，除了吐字快、能秒回，還擅長超長文處理。

《騰訊新聞》報導說，溷元T1通過大規模強化學習，並結合數學、邏輯推理、科學和程式碼等理科難題的專項優化，讓溷元T1正式版進壹步提升了推理能力。

在體現推理模型基礎能力的常見基准上，如大語言模型評估增強數據集MMLU-PRO中，溷元T1取得87.2分，僅次於o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基准測試中，溷元T1的成績也達到業界領先推理模型的水平。

此外，溷元T1還在多項對齊任務、指令跟隨任務和工具利用任務中展現出了非常強的適應性。溷元T1正式版還沿用了溷元Turbo S的創新架構，采用Hybrid-Mamba-Transformer融合模式。
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁12 下壹頁

在此頁中閱讀全文
更多騰訊的新聞

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞