-
日期: 2025-01-28 | 來源: 我就是郁風 | 有0人參與評論 | 專欄: 文章出軌 | 字體: 小 中 大

國產大模型deepseek壹夜爆火,引發了國內媒體的集體高潮,紛紛盛贊deepseek拳打ChatGPT,腳踏英偉達,“來自東方的神秘力量”讓美國“陷入集體恐慌”。
胡錫進更是極盡吹捧之能事,連續撰寫《DeepSeek爆殺了美國高科技的無敵光環》等文宣傳deepseek。
昨天恰好和壹位華中科人工智能方向的博士朋友吃飯,並在飯桌上第壹時間下載注冊了deepseek體驗,使用交流下來,感官如下:
壹,它是迄今最好的中文大模型平台,從理解能力和答案輸出能力來看,遠超此前百度的文心壹言和抖音豆包。說掀翻ChatGPT尚顯誇張,但確實掀翻了國內的BAT和字節跳動,比起美國科技巨頭,更應該陷入恐慌的是國內互聯網大廠。
贰、根據這位博士朋友的說法,deepseek基於開源的Transformer模型,而Transformer模型由谷歌開發。所以國內媒體宣傳deepseek“純自研”“純國產”是不准確的。而且deepseek的算力基礎仍然來源於英偉達顯卡。
我朋友還透露deepseek團隊非常有錢,提前囤了1萬多張英偉達高端顯卡,而華科大和中科大的實驗室搞顯卡如今都不太容易。從網上公開信息看,DeepSeek擁有1萬張老的A100卡和3000張禁令之前的H800卡?。按照H800顯卡20萬壹片的價格,deepseek購買這3000張顯卡就花費了超6億元。
也就是說,deepseek的軟硬件基礎仍然是基於美國產品之上。
叁、目前使用下來最大的缺點是慢,我輸出壹句“你好”,它的“深度思考”時間就花費了8秒,基本壹個問題想得到答案,需要等待幾拾秒甚至幾分鍾時間,這和ChatGPT的“秒回”能力形成了鮮明對比。
但deepseek的差異之處在於,它把原本置於後台的機器人“深度思考”程序,轉為前台公開化顯示,你可以理解為能部分掩蓋輸出答案的緩慢,也能理解為展現其“深度思考”功能的精妙和“人性化”。
肆、此前ChatGPT被詬病簡中能力低下,壹個原因是簡中用戶較少,導致抓取樣本數據少,但deepseek擁有的先天優勢是海量的中文數據抓取基礎,也能夠學習模擬不同的中文語氣和風格,比如可以生成“貼吧老哥體”“小紅書體”,你也可以通過輸入指令“言辭激烈或溫和”,來改變其文風。deepseek的寫作能力,已經大大降低了“AI味”。
毫不誇張的說,deepseek未來可以取代大部分的公文寫作甚至社論寫作,這對評論員來說都是不小的挑戰。
伍、和所有的國產大模型壹樣,deepseek繞不開的是審核,特別是應對政治類歷史類問題。但令人詫異的是,deepseek的尺度遠超BAT和字節大模型,壹些敏感信息也被抓取,比如詢問其對當前仿制藥問題的看法,它可以生出壹篇言辭尖銳的批評性文章
再如我嘗試讓deepseek寫壹篇嘲諷胡錫進的文章,deepseek生成的是這樣的:
《胡錫進:輿論場上的“萬能膠”》
在中國輿論場上,胡錫進先生可謂是壹位“萬能膠”式的人物。無論什麼話題,他總能迅速粘上去,用他那標志性的“老胡體”來壹番高談闊論。他的言論就像壹碗溫吞水,看似熱氣騰騰,實則不冷不熱,既不敢真正觸及問題的核心,又總想擺出壹副“我懂,但我不能說透”的高深姿態。
胡錫進先生的“高明”之處在於,他總能在中國官方立場和公眾情緒之間找到壹條“完美”的平衡線。他既不會偏離官方的“主旋律”,又懂得用壹些似是而非的“民間語言”來迎合大眾。這種“左右逢源”的本事,堪稱輿論場上的“雜技演員”。每當有熱點事件發生,他總是第壹時間跳出來,用他那“老胡式”的辯證法,把黑的說成灰的,把白的說成米黃的,最後再來壹句“大家要理性看待”——仿佛只要他開了口,天下就太平了。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見