-
日期: 2024-09-25 | 來源: 新智元 | 有0人參與評論 | 字體: 小 中 大
- 解碼密碼
同樣令人深刻的,還有壹個解碼復雜密碼的例子。
類似的,我們也嘗試了這個提示詞的各種變體,包括ROT13密碼、Atbash密碼、Base64編碼、反轉字符串等各種組合。
然而,大多數測試都不成功——在7次嘗試中,o1-preview只有2次能夠解碼給出的加密信息(《沙丘》中的「迎恐禱詞」(the Litany Against Fear))。
在每個prompt中,o1都被要求從OpenAI給出的示例中推斷出壹種編碼方式。
在以下每個測試中,o1都未能在壹次嘗試中解碼目標消息:
ROT13密碼 → 反轉字符串 → Base64編碼 → 反轉字符串
ROT13密碼 → Base64編碼 → ROT13密碼 → 反轉字符串
ROT13密碼 → Base64編碼 → ROT13密碼
ROT13密碼 → Base64編碼 → Atbash密碼
ROT13密碼 → Base58編碼
在第壹次嘗試中成功解碼的兩個測試是:
Atbash密碼 → Base64編碼
ROT13密碼 → Base64編碼
這裡展示了第壹個成功的例子——其他測試除了使用的編碼不同外,都是相同的:

結論
總結來看,OpenAI的o1模型在推理能力方面都取得了重大突破,在AIME、Codeforces、Scale的SEAL排行榜等關鍵基准測試中表現出色。
這些結果表明,o1-preview和o1-mini是解決復雜推理問題的強大工具。然而,要充分發揮這些模型的潛力,可能需要比用戶習慣的其他模型發布更多的實驗和嘗試。
參考資料:
https://www.theinformation.com/articles/scale-ais-sales-nearly-quadrupled-in-first-half?rc=epv9gi
https://scale.com/blog/first-impression-openai-o1?utm_offer=blog- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見